Melhorando a eficiência do tratamento de águas residuais por meio da previsão da qualidade dos efluentes baseada em aprendizado de máquina: uma análise em nível de planta

 em Águas Urbanas, Artigos Científicos e Teses Acadêmicas, WEST

Maria Alice Prado Cechinel, Juliana Neves, João Victor Rios Fuck, Rodrigo Campos de Andrade, Nicolas Spogis, Humberto Gracher Riella, Natan Padoin, Cintia Soares; Enhancing wastewater treatment efficiency through machine learning-driven effluent quality prediction: A plant-level analysis, Journal of Water Process Engineering , Volume 58, February 2024, 104758 – (link)

 

Título

Enhancing wastewater treatment efficiency through machine learning-driven effluent quality prediction: A plant-level analysis

(Melhorando a eficiência do tratamento de águas residuais por meio da previsão da qualidade dos efluentes baseada em aprendizado de máquina: uma análise em nível de planta)

 

Resumo

The main objective of this study was to develop, validate, and comprehend machine learning (ML) models capable of predicting chemical oxygen demand concentration in the effluent (COD) of a given wastewater treatment plant (WWTP). The parameter COD was chosen as a target due to its crucial role in controlling and optimizing water treatment plants, emphasizing its vital importance in maintaining the efficiency and quality of the water purification process. A calibrated WWTP model available on WEST software (DHI), developed using the Umbilo WWTP (South Africa) as a reference, served as a source for extracting influent and effluent data. The dataset was organized daily and hourly to train the ML predictive models. ML techniques used in this study include Support Vector Machines (SVM), Long Short-Term Memory (LSTM), Multilayer Perceptron (MLP), and Random Forest (RF). Exploratory data analysis revealed multicollinearity between some of the model’s input variables, requiring a selection of these parameters. In the case of COD predictions using the daily dataset, the MLP model proved more effective than other ML models. When the hourly dataset was applied, the LSTM models performed better by incorporating historical data into the model structure. When real effluent measurements were used to predict COD, the SVM model had superior results, even outperforming traditional mechanistic models. Variable importance analysis showed the significant influence of influent TSS to predict COD. In conclusion, the study demonstrates the successful applicability of ML models to predict COD in WWTPs and provides valuable insights for optimizing wastewater treatment. The emphasis on model interpretability and validation with real data enriches the results’ reliability.

 

TRADUÇÃO LIVRE

O principal objetivo deste estudo foi desenvolver, validar e compreender modelos de aprendizado de máquina (ML) capazes de prever a concentração da demanda química de oxigênio no efluente (COD) de uma determinada estação de tratamento de águas residuais (ETE). O parâmetro COD foi escolhido como meta devido ao seu papel crucial no controle e otimização das estações de tratamento de água, ressaltando sua importância vital na manutenção da eficiência e qualidade do processo de purificação de água.

Um modelo de ETAR calibrado disponível no software WEST (DHI), desenvolvido tendo como referência a ETAR de Umbilo (África do Sul), serviu de fonte para a extracção de dados de afluentes e efluentes. O conjunto de dados foi organizado diariamente e de hora em hora para treinar os modelos preditivos de ML. As técnicas de ML usadas neste estudo incluem Support Vector Machines (SVM), Long Short-Term Memory (LSTM), Multilayer Perceptron (MLP) e Random Forest (RF).

A análise exploratória dos dados revelou multicolinearidade entre algumas variáveis de entrada do modelo, exigindo a seleção desses parâmetros. No caso de previsões COD utilizando o conjunto de dados diário, o modelo MLP provou ser mais eficaz do que outros modelos ML. Quando o conjunto de dados horários foi aplicado, os modelos LSTM tiveram melhor desempenho ao incorporar dados históricos na estrutura do modelo.

Quando medições reais de efluentes foram usadas para prever COD, o modelo SVM teve resultados superiores, superando até mesmo os modelos mecanísticos tradicionais. A análise de importância das variáveis mostrou a influência significativa do TSS influente na predição do COD. Em conclusão, o estudo demonstra a aplicabilidade bem-sucedida de modelos de ML para prever CODout em ETARs e fornece informações valiosas para otimizar o tratamento de águas residuais. A ênfase na interpretabilidade e validação do modelo com dados reais enriquece a confiabilidade dos resultados.

Artigo publicado no site Science Direct – Elsevier – Journal of Water Process Engineering

Deixe um Comentário

Entre em contato

Nos envie um e-mail e retornaremos o mais rápido possível.