Previsão de parâmetros de qualidade de efluentes para estações de tratamento de águas residuais: uma metodologia baseada em aprendizado de máquina
João Victor Rios Fuck, Maria Alice Prado Cechinel, Juliana Neves, Rodrigo Campos de Andrade, Ricardo Tristão, Nicolas Spogis, Humberto Gracher Riella, , Cintia Soares, Natan Padoin; Predicting effluent quality parameters for wastewater treatment plant: A machine learning-based methodology, Journal Chemosphere, Volume 352, March 2024, 141472 – (link)
Título
Predicting effluent quality parameters for wastewater treatment plant: A machine learning-based methodology
(Previsão de parâmetros de qualidade de efluentes para estações de tratamento de águas residuais: uma metodologia baseada em aprendizado de máquina)
Resumo
Wastewater Treatment Plants (WWTPs) present complex biochemical processes of high variability and difficult prediction. This study presents an innovative approach using Machine Learning (ML) models to predict wastewater quality parameters. In particular, the models are applied to datasets from both a simulated wastewater treatment plant (WWTP), using DHI WEST software (WEST WWTP), and a real-world WWTP database from Santa Catarina Brewery AMBEV, located in Lages/SC – Brazil (AMBEV WWTP). A distinctive aspect is the evaluation of predictive performance in continuous data scenarios and the impact of changes in WWTP operations on predictive model performance, including changes in plant layout. For both plants, three different scenarios were addressed, and the quality of predictions by random forest (RF), support vector machine (SVM), and multilayer perceptron (MLP) models were evaluated. The prediction quality by the MLP model reached an R2 of 0.72 for TN prediction in the WEST WWTP output, and the RF model better adapted to the real data of the AMBEV WWTP, despite the significant discrepancy observed between the real and the predicted data. Techniques such as Partial Dependence Plots (PDP) and Permutation Importance (PI) were used to assess the importance of features, particularly in the simulated WEST tool scenario, showing a strong correlation of prediction results with influent parameters related to nitrogen content. The results of this study highlight the importance of collecting and storing high-quality data and the need for information on changes in WWTP operation for predictive model performance. These contributions advance the understanding of predictive modeling for wastewater quality and provide valuable insights for future practice in wastewater treatment.
TRADUÇÃO LIVRE
As Estações de Tratamento de Águas Residuais (ETEs) apresentam processos bioquímicos complexos, de alta variabilidade e de difícil previsão. Este estudo apresenta uma abordagem inovadora usando modelos de Machine Learning (ML) para prever parâmetros de qualidade de águas residuais. Em particular, os modelos são aplicados a conjuntos de dados de uma estação de tratamento de águas residuais (ETE) simulada, usando o software DHI WEST (ETE WEST), e um banco de dados de ETE do mundo real da Cervejaria Santa Catarina AMBEV, localizada em Lages/SC – Brasil ( ETE AMBEV).
Um aspecto distintivo é a avaliação do desempenho preditivo em cenários de dados contínuos e o impacto das mudanças nas operações da ETE no desempenho do modelo preditivo, incluindo mudanças no layout da planta. Para ambas as plantas, três cenários diferentes foram abordados e a qualidade das previsões por modelos de floresta aleatória (RF), máquina de vetores de suporte (SVM) e perceptron multicamadas (MLP) foi avaliada. A qualidade de predição pelo modelo MLP atingiu um R2 de 0,72 para predição de TN na saída da ETE WEST, e o modelo RF adaptou-se melhor aos dados reais da ETE AMBEV, apesar da discrepância significativa observada entre os dados reais e os previstos.
Técnicas como Gráficos de Dependência Parcial (PDP) e Importância de Permutação (PI) foram utilizadas para avaliar a importância das feições, particularmente no cenário simulado da ferramenta WEST, mostrando uma forte correlação dos resultados de previsão com parâmetros influentes relacionados ao teor de nitrogênio.
Os resultados deste estudo destacam a importância da coleta e armazenamento de dados de alta qualidade e a necessidade de informações sobre mudanças na operação da ETE para o desempenho do modelo preditivo. Essas contribuições avançam na compreensão da modelagem preditiva da qualidade de águas residuais e fornecem informações valiosas para práticas futuras no tratamento de águas residuais.
Artigo publicado no site Science Direct – Elsevier – Journal Chemosphere