banner

블로그

Jun 29, 2023

경사 강화 의사결정 트리와 가중 위험 분석을 사용하여 파이프 고장 위험 예측

npj Clean Water 5권, 기사번호: 22(2022) 이 기사 인용

3751 액세스

2 인용

3 알트메트릭

측정항목 세부정보

파이프 고장 예측 모델은 사전 관리 결정을 알리는 데 필수적입니다. 본 연구에서는 Gradient Boosted Tree 모델과 국부적인 특성을 연관시키는 1km 그리드의 파이프의 특정 분할 및 그룹화를 사용하여 파이프 파손 확률을 반환하는 신뢰할 수 있는 예측 모델을 구축하는 것을 목표로 합니다. 이 모델은 약 40,000km의 파이프라인과 14년의 고장 이력을 가진 광범위한 영국 네트워크에 적용됩니다. 이 모델은 정확도에 대해 수신기 작동 곡선 및 곡선 아래 면적(0.89), 브라이어 점수(0.007) 및 매튜스 상관 계수(0.27)를 사용하여 평가되었으며 이는 수용 가능한 예측을 나타냅니다. 가중 위험 분석은 파이프 고장의 결과를 식별하고 의사 결정자에게 고위험 파이프의 그래픽 표현을 제공하는 데 사용됩니다. 가중 위험 분석은 예측된 실패의 결과를 이해하는 데 중요한 단계를 제공했습니다. 이 모델은 파이프의 유지 관리 및 잠재적 교체에 관한 장기적인 주요 결정을 설정하는 전략 계획에 직접 사용할 수 있습니다.

많은 WDN(물 분배 네트워크)이 노후화되고 설계 수명이 종료되는 단계에 있어 파이프 파손, 누수 및 물 낭비로 이어져 환경, 경제, 사회적 영향을 초래합니다. 물 수요 증가와 기후 변화 영향으로 인해 압력이 가중되어 물 공급에 스트레스가 가중되고 물 규제 기관이 성능 목표를 달성하지 못한 것에 대해 무거운 벌금을 부과하는 상황에서1 적절한 사전 관리를 통해 파이프 고장의 영향을 줄이는 것이 시급합니다. 사전 예방적 관리는 문제를 선제적으로 해결하고 허용 가능한 위험 수준을 설정하기 위해 WDN을 관리하는 데 바람직한 접근 방식입니다. 전통적으로 사전 예방적 관리는 역사적으로 정기적으로 실패했던 네트워크의 중요한 영역을 대상으로 하기 위해 단순한 순위 가능성 모델, 전문가 판단 및 상세한 네트워크 지식을 사용하여 파이프 교체 또는 수리의 우선 순위를 지정함으로써 달성됩니다2. 그러나 이러한 단순한 접근 방식은 파이프 고장의 복잡한 메커니즘과 물 손실로 인한 재산 및 인프라 손상, 수리 중 잠재적인 중단, 물 공급 중단, 수리 및 교체에 드는 경제적 비용 등 복합적인 관련 위험이 있는 WDN을 관리하는 데 적합하지 않습니다. 사전 예방적인 관리를 위해서는 향후 파이프 성능을 이해하고 잠재적인 위험을 평가해야 합니다3.

통계적 배관 고장 모델은 과거 데이터로부터 고장 패턴을 식별하고 그에 따른 원인 요인4을 통해 미래 성능을 예측하고 사전 예방적 관리를 지원하는 수단을 제공합니다4. Shamir와 Howard(1979)5는 파이프 1000피트당 연간 고장 횟수를 예측하기 위해 파이프 수명을 사용하는 단일 변수 시간 지수 모델을 사용하여 소규모 파이프 WDN에 대한 최초의 모델 중 하나를 개발했습니다. 단일 변량 모델은 여러 요인이 동시에 작동하여 다양한 실패 모드를 초래하는 복잡한 실패 메커니즘을 형성하는 경우가 많기 때문에 제한됩니다. 이러한 요인은 파이프 내재적, 환경적, 운영적 요인으로 광범위하게 분류될 수 있습니다6. 파이프의 순위를 서로 비교하는 데 사용할 수 있는 실패 횟수 또는 실패율7을 예측하기 위해 정적(파이프 및 토양) 및 동적 시간 관련 변수(날씨)를 포함한 다변량 모델을 사용하여 더 많은 진전이 이루어졌습니다8. 사고가 자주 발생하지 않기 때문에 자산 수준에서 파이프 고장 횟수를 예측하는 것은 수학적으로 문제가 있습니다9. 따라서 실패율을 기반으로 한 연구는 네트워크 전체에서 유사한 특성으로 파이프 실패를 그룹화하는 데 중점을 두고 통계적 유의성을 위해 그룹화된 파이프 길이별로 충분한 실패를 제공합니다10,11. 그러나 네트워크 수준에서 파이프를 그룹화하면 유사한 특성을 가진 모든 파이프가 비슷한 국지적 조건(침구 조건, 트래픽 부하 및 로컬 네트워크 작업과 같은 국지적 영향)과 실패율을 공유한다고 가정합니다. 이는 거의 발생하지 않습니다.

0.9 is outstanding34. Figure 1 shows the ROC curve for the test dataset close to the top left-hand corner and an AUC value of 0.89, suggesting the model has an excellent discriminative ability to distinguish between the classes, and the TPR and FPR appear robust enough to predict failures on the unseen test data./p> {\rm{threshold}}} \end{array}} \right.\). The default probability threshold within the model is 0.536. By this definition, there remains a practical need to optimise the probability threshold specifically to the behaviour of pipe failures within the imbalanced test data. An optimal probability threshold typically strikes a balance between sensitivity and specificity. However, there is a trade-off between TPR and FPR when altering the threshold, where increasing or decreasing the TPR typically results in the same for the FPR and vice versa. Probability threshold optimisation is an important step in the decision-making process and is specific to each problem. In the case of pipe replacement, expert judgement should be used by reasoning that water companies would seek to avoid unnecessarily replacing pipes that may have a longevity of several decades more, resulting in wasted maintenance effort and cost. Furthermore, only 0.5–1% of the network is typically replaced each year due to budget constraints37. It is therefore important to only identify pipes with the highest probability of failure. Considering this, the optimal threshold is set to reduce the FNs (i.e., pipes predicted to fail when they have not). This reduces the number of TPs predicted as discussed above but targets those pipes most likely to fail./p>0.02; ≤0.06] and high [>0.06; ≤0.92]. In this scenario, the length of pipe in the high-risk category is 13.9 km of the 300.7 km or 4.6% of the pipe network present in Fig. 4, a useful percentage of the network to target for management decisions. The choropleth risk map approach is an important means of visualising individual pipes or clusters of pipes with the highest risk in the WDN, evidenced in Fig. 4. Figure 4 also highlights how many pipes in this section of the network have a low risk, which is to be expected since many pipes have a low probability of failure and have small diameters, potentially causing less damage if they fail./p> 200. (iii) second condition for partitioning data by variable x1 at both 30 and 60 to create two more disjoint region R3 and R4 (Taken from Barton et al.55)./p>

공유하다