Desarrollo y aplicación de un modelo de sensor blando de regresión forestal aleatoria para el tratamiento de aguas residuales domésticas en un reactor discontinuo de secuenciación.

Scientific Reports volumen 13, número de artículo: 9149 (2023) Citar este artículo

499 Accesos

Detalles de métricas

Los equipos de tratamiento de agua distribuidos a pequeña escala, como el reactor por lotes secuencial (SBR), se utilizan ampliamente en el campo del tratamiento de aguas residuales domésticas rurales debido a sus ventajas de rápida instalación y construcción, bajo costo de operación y gran adaptabilidad. Sin embargo, debido a las características de no linealidad e histéresis en el proceso SBR, es difícil construir el modelo de simulación del tratamiento de aguas residuales. En este estudio, se desarrolló una metodología utilizando inteligencia artificial y un sistema de control automático que puede ahorrar energía correspondiente a la reducción de las emisiones de carbono. La metodología aprovecha el modelo de bosque aleatorio para determinar un sensor blando adecuado para la predicción de las tendencias de la DQO. Este estudio utiliza sensores de pH y temperatura como premisas para los sensores de DQO. En el método propuesto, los datos se procesaron previamente en 12 variables de entrada y se seleccionaron las 7 variables principales como variables del modelo optimizado. Ciclo finalizado por la inteligencia artificial y el sistema de control automático en lugar de por el control de tiempo fijo que era un escenario incontrolado. En 12 casos de prueba, el porcentaje de eliminación de DQO fue de aproximadamente el 91,075 %, mientras que, desde una perspectiva promedio, se ahorró un 24,25 % de tiempo o energía. Esta metodología propuesta de selección de sensores blandos se puede aplicar en el campo del tratamiento de aguas residuales domésticas rurales con ventajas de ahorro de tiempo y energía. El ahorro de tiempo se traduce en un aumento de la capacidad de tratamiento y el ahorro de energía representa una tecnología baja en carbono. La metodología propuesta proporciona un marco para investigar formas de reducir los costos asociados con la recopilación de datos reemplazando sensores costosos y poco confiables con alternativas asequibles y confiables. Al adoptar este enfoque, se puede mantener la conservación de energía y al mismo tiempo cumplir con los estándares de emisiones.

Las aguas residuales domésticas rurales se caracterizan por una calidad y cantidad de agua inestable, descargas dispersas y baja concentración de contaminantes1. Para abordar estos desafíos, los equipos de tratamiento de agua distribuidos a pequeña escala se han utilizado ampliamente en el campo del tratamiento de aguas residuales domésticas rurales debido a su rápida instalación y construcción, bajo costo de operación y gran adaptabilidad2. En los últimos años, el proceso de reactor discontinuo secuencial (SBR) ha surgido como una opción prometedora para el tratamiento de aguas residuales domésticas rurales. En comparación con otros procesos, el SBR puede resistir eficazmente los impactos de cargas orgánicas, tiene modos de operación flexibles, produce buenos efectos en los efluentes y logra mejores efectos de eliminación de nitrógeno y fósforo3,4,5,6.

Sin embargo, construir modelos de simulación precisos para el tratamiento de aguas residuales domésticas rurales puede resultar un desafío debido a las características de no linealidad e histéresis que presenta el proceso SBR7,8. Los problemas no lineales en el tratamiento de aguas residuales se refieren a las relaciones complejas, diversas y no lineales que surgen de las interacciones de diversas reacciones químicas, reacciones biológicas y efectos físicos durante el tratamiento de aguas residuales.

La inteligencia artificial, incluido el aprendizaje automático, se ha aplicado a los procesos de tratamiento de aguas residuales para resolver eficazmente problemas no lineales. El aprendizaje automático abarca una variedad de métodos, como redes neuronales y regresión de vectores de soporte, que pueden usarse para analizar y modelar los datos complejos generados durante el tratamiento de aguas residuales. Esto ha mejorado efectivamente la eficiencia y la calidad del tratamiento de aguas residuales y, al mismo tiempo, ha reducido los costos de tratamiento.

La red neuronal artificial (RNA) es un modelo matemático que simula el comportamiento de redes neuronales animales y realiza procesamiento de información distribuido y paralelo. Las RNA se han utilizado ampliamente para predecir la descarga de aguas residuales, ya que pueden ajustar las interconexiones entre una gran cantidad de nodos internos para procesar información compleja dentro del sistema9,10,11,12,13.

Además de utilizar métodos de redes neuronales artificiales (ANN), también se han utilizado otras técnicas como la regresión lineal (LR), la regresión de vectores de soporte (SVR) y los métodos de redes neurodifusas en la tecnología de eliminación de contaminantes para predecir cambios en las concentraciones de contaminantes o otros parámetros del proceso14,15,16,17,18,19. Estos métodos (como se muestra en la Tabla 1) han demostrado ser eficaces para modelar las relaciones complejas entre varios factores y predecir concentraciones de contaminantes, lo que ayuda a optimizar el rendimiento del proceso de tratamiento.

Sin embargo, a pesar de que estos modelos14,15,16,17 funcionaron bastante bien, su procesamiento o entorno está idealizado. La mayoría de ellos utilizan condiciones experimentales simuladas. Una vez en un caso real de ingeniería, debido a su complejidad, el desempeño del modelo no será tan sobresaliente18,19. Además, en estos casos14,15,16,17,18,19, existen muchos tipos de datos de entrada, como OD, pH, conductividad, DBO, DQO, TN, etc., lo que aumenta la carga de trabajo o dificultad de los datos. adquisición. Por ejemplo, hay un retraso significativo en los datos medidos de los sensores de OD; La DBO solo se puede medir mediante un método bioquímico y no se puede medir con precisión en línea utilizando sensores debido a una histéresis significativa. Sin embargo, aunque la medición de DQO se puede realizar en línea, el método de medición química en línea requiere un control estricto de las condiciones de medición y la adición continua de reactivos. El método del sensor de DQO utiliza principalmente sensores ópticos, que se ven afectados significativamente por la cromaticidad y la turbidez de las aguas residuales. Además, el sensor de DQO es caro para equipos pequeños dispersos, lo que dificulta su popularización. Por lo tanto, es necesario desarrollar sensores con una recopilación de datos estable y precisa, una larga vida útil y un precio económico para reemplazar los sensores con poca estabilidad, una vida útil corta y precios elevados.

Sin embargo, el algoritmo ANN tradicional se basa en la teoría asintótica, el riesgo empírico se acerca al riesgo real solo cuando el tamaño de la muestra se acerca al infinito, por lo que el tamaño de la muestra está lejos del infinito en la aplicación práctica, lo que conduce a problemas de mala capacidad de extrapolación. velocidad de convergencia lenta y extremo local20,21,22,23.

El modelo de bosque aleatorio es uno de aprendizaje automático, que se ha convertido en un punto de investigación en el campo de la inteligencia artificial, que tiene una fuerte capacidad de aprendizaje adaptativo y capacidad de mapeo no lineal24,25. Es adecuado para la simulación del proceso de tratamiento de aguas residuales con las características de gran retraso, no linealidad y multivariable26,27.

La regresión de bosque aleatorio (RFR) es una aplicación crítica del algoritmo de bosque aleatorio (RF), que es una teoría de aprendizaje estadístico desarrollada por Breiman28. La técnica RFR implica el uso de remuestreo Bootstrap para extraer múltiples muestras de los datos originales y construir árboles de decisión para cada muestra Bootstrap. Estos árboles de decisión luego se combinan para predecir los resultados, siendo la predicción final el promedio de las predicciones generadas por todos los árboles29.

La esencia del algoritmo RFR es el modelo de árbol de decisiones múltiples, que realiza predicciones combinando múltiples árboles de decisión. El algoritmo tiene las ventajas de una alta precisión de predicción, buena capacidad de generalización, rápida velocidad de convergencia y menos parámetros de ajuste, lo que puede evitar eficazmente el "sobreajuste" y es adecuado para la operación de varios conjuntos de datos. Es robusto para la extracción variable de conjuntos de datos y adecuado para espacios vectoriales variables de dimensiones ultraaltas. La RFR se ha utilizado ampliamente en muchos campos, como la medicina, la gestión y la agricultura30,31,32.

RFR también hace un uso completo de muestras limitadas y construye múltiples modelos de árboles de decisión, lo que aumenta la diversidad del árbol de decisión y mejora la precisión del modelo de integración de optimización final33,34. La Tabla 2 muestra aplicaciones relacionadas de la regresión forestal aleatoria.

ANN es un tipo de algoritmo de aprendizaje automático que se utiliza comúnmente para predecir el efecto del tratamiento de las aguas residuales45,46,47,48,49. Sin embargo, una de las principales debilidades de las RNA es el sobreajuste, que puede conducir a una reducción en la generalización del modelo50,51,52. Por el contrario, el modelo de regresión forestal aleatoria (RFR) es otro algoritmo de aprendizaje automático que se utiliza para predecir los efectos del tratamiento de aguas residuales. El modelo RFR tiene varias ventajas, incluida una alta precisión de predicción, una rápida eficiencia de procesamiento, una gran capacidad de generalización y no es fácilmente susceptible a un sobreajuste53,54. Estas características hacen del modelo RFR una opción atractiva para predecir los efectos del tratamiento de aguas residuales.

Los académicos utilizaron RFR para predecir la concentración de contaminantes en el aire ambiente55,56,57,58,59 y el efecto del tratamiento de aguas residuales urbanas60,61,62. Sin embargo, hay comparativamente menos estudios sobre la predicción y el control de los efectos del tratamiento de aguas residuales domésticas rurales utilizando el modelo RFR.

La metodología propuesta tiene como objetivo lograr una mejor predicción y un control efectivo del efecto del tratamiento de las aguas residuales domésticas rurales mediante el desarrollo y la utilización del modelo de sensor suave RFR. Al utilizar este enfoque, se espera establecer un modelo de sensor blando confiable y robusto que pueda monitorear y analizar con precisión indicadores clave del tratamiento de aguas residuales en áreas rurales. Esto no sólo facilitará la identificación de problemas potenciales y ayudará a su resolución, sino que también contribuirá a mejoras generales en las condiciones ecológicas locales y los estándares de salud pública.

El sensor suave es un método comúnmente utilizado en el monitoreo y control de procesos, que estima la variable de proceso de interés en función de las mediciones de otras variables que son fáciles de adquirir. El establecimiento de un modelo de sensor suave generalmente implica seleccionar variables de entrada relevantes, diseñar el modelo matemático y entrenar el modelo utilizando datos históricos. El modelo resultante se puede utilizar para predicción y control en tiempo real. Los sensores blandos se han aplicado ampliamente en diversos procesos industriales, como procesos químicos, tratamiento de aguas residuales y plantas de energía. Las ventajas del sensor blando incluyen rentabilidad, flexibilidad y capacidad para manejar sistemas no lineales complejos. El sensor blando ha demostrado ser una herramienta valiosa para la optimización y el control de procesos63,64,65,66.

El modelo RFR es un algoritmo de integración desarrollado sobre la base de la teoría del árbol de decisión, que pertenece al tipo de ensacado67. Al combinar múltiples árboles de carritos de aprendizaje débiles y tomar el valor medio para integrar múltiples modelos, se obtiene el resultado final68.

El modelo RFR utiliza la perturbación de muestras y atributos y aumenta la "diversidad" del árbol del carrito del alumno débil, de modo que el resultado final de la integración tiene una alta precisión y rendimiento de generalización69. El modelo RFR resuelve problemas prácticos como muestras pequeñas, grandes dimensiones y clasificación múltiple, y puede manejar tanto datos discretos como datos continuos70. Supera las deficiencias de la lenta velocidad de convergencia de las redes neuronales y requiere una gran cantidad de muestras. También resuelve el problema del ajuste excesivo o insuficiente del árbol de decisión y tiene buena aplicabilidad y popularización71. La Figura 1 muestra el diagrama de RFR.

Diagrama del modelo RFR.

El método de predicción general del modelo RFR es:

(1) Tome muestras aleatoriamente de las muestras de entrenamiento (n × muestra) n veces para formar un conjunto de entrenamiento (las muestras se devolvieron después de cada muestreo). Repita r veces para obtener conjuntos de entrenamiento:\(D_{1},D_{2}, \ldots,D_{r}\).

(2) Para cada conjunto de entrenamiento, se seleccionan aleatoriamente k atributos del conjunto de atributos (m × atributo), \(k = \log 2m\), y luego se establecen árboles de carro:\(f_{1} (x), f_{2} (x), \ldots,f_{r} (x)\).

(3) El valor de predicción final del bosque aleatorio se determina mediante el método promedio:\(f(x) = \frac{1}{r}\sum\nolimits_{i = 1}^{r} {f_{i} (X)}\).

Para evaluar el desempeño del modelo de predicción de la concentración de DQO, se seleccionan como índices de evaluación el error cuadrático medio (MSE) y el coeficiente de determinación (r2). Los indicadores se calculan de la siguiente manera:

Fórmula \(\hat{y}_{i}\) para el valor predicho del modelo, \(y_{i}\) para el valor verdadero.

Las características del modelo RFR se establecen en la Tabla 3.

En este estudio se prepara un reactor discontinuo de secuenciación (SBR), que recibe aguas residuales de una zona residencial. La fuente de aguas residuales domésticas proviene de la comunidad Shuyuan en el distrito de Pidu, Chengdu, Sichuan, China (longitud: 103,88, latitud: 30,82). Las aguas residuales que fluyeron hacia el SBR estaban compuestas de aguas residuales domésticas que habían sido filtradas y precipitadas primariamente. Se diseñó y fabricó el reactor SBR (acero inoxidable, 800 mm × 800 mm × 1200 mm). El volumen de trabajo del reactor fue de 0,576 m3, respectivamente (Fig. 2). En el tanque de reacción se instalan un agitador y un dispositivo de aireación.

Estructura de SBR.

Las aguas residuales que habían sido filtradas y precipitadas primariamente se bombearon al SBR. Esta bomba se llamó bomba A y generaba 0,1856 m3 de aguas residuales alimentadas al SBR en cada ciclo. La bomba B transportó el mismo volumen de agua fuera del SBR cuando terminó el ciclo.

El proceso SBR está automatizado y controlado por un PIC (circuito integrado programable) o una computadora de un solo chip. El ciclo, que tiene una duración de 480 min, incluye las siguientes etapas: etapa de llenado y aireación de 30 min, etapa de oxidación y agitación de 330 min (alternando aireación y agitación, con una duración de 10 min de aireación y 20 min de agitación), etapa de asentamiento de 60 min. y etapa de descarga de 60 min. La Figura 3 muestra la gestión del tiempo de operación de SBR.

Proceso de tratamiento de SBR.

Se tomaron muestras de aguas residuales afluentes y efluentes del tanque SBR y de un recipiente de recolección que permite el paso del agua filtrada para eliminar la interferencia de lodos activados.

El pH y la temperatura filtrados se probaron mediante sensores de monitorización fabricados por LuHeng Co. de China (pH:sensor de pH LuHeng 6503; temperatura:sensor de temperatura LuHeng 229).

La DQO filtrada se analizó mediante el método del dicromato de potasio, el NH3-N se analizó mediante el método de colorimetría del reactivo de Nessler (fotómetro visible UV SP-756P del espectro de Shanghai) y el TP se analizó mediante el método de detección espectrofotométrica (fotómetro visible UV SP-756P del espectro de Shanghai). El pH y la temperatura se midieron a intervalos de 10 minutos mediante sensores.

Los sensores se instalaron aproximadamente 200 mm por debajo del nivel de líquido más bajo dentro del tanque de reacción y por encima de cualquier posible manto de lodo que pudiera formarse durante la sedimentación. Todos los instrumentos fueron calibrados, mantenidos y operados de acuerdo con las instrucciones del fabricante.

Un perfil típico de DQO vio un aumento en las concentraciones a medida que el afluente se mezclaba con las aguas residuales tratadas que quedaban en el reactor del ciclo anterior. Las concentraciones de DQO alcanzaron su punto máximo poco después de la fase de llenado. Después de este pico, las concentraciones de DQO disminuyeron debido a la oxidación y nitrificación del carbono orgánico72. Aproximadamente a los 250 minutos, la tasa de disminución de las concentraciones de DQO no presenta cambios más obvios y continúa así durante el resto del ciclo (Fig. 4).

Perfil típico para DQO.

Se produjo un aumento y una caída cíclicos en el perfil de pH (Fig. 5) durante la fase de aireación, cuando el aireador se encendía y apagaba, lo que resultó en un pico y un valle en cada período de aireación en el perfil de pH. El aumento del pH, correspondiente al período de aireación, probablemente se debió, en este caso, a la extracción de CO273. Las disminuciones en el perfil de pH durante el período de agitación de 20 minutos probablemente se debieron a una actividad microbiana que libera dióxido de carbono74.

Perfil típico de pH.

Como se encontró, durante la primera etapa del ciclo, el pH cayó más que en la última etapa, probablemente se deba a que la concentración de DQO difiere: una concentración más alta de DQO da como resultado una mayor actividad de los microorganismos. En general, el pH disminuye a medida que se consume alcalinidad durante el progreso de la nitrificación. El progreso de la desnitrificación probablemente provoca el aumento general del pH en las etapas media y final75.

Se produjo un aumento y una caída cíclicos en los perfiles de pH durante la fase de aireación, a medida que el aireador se encendía y apagaba, lo que resultó en un pico y un valle bajo en cada período de aireación en los perfiles de pH76.

Un perfil típico de descenso rápido de la temperatura a medida que el afluente se mezclaba con el agua residual tratada que quedaba en el reactor del ciclo anterior. La temperatura tocó fondo poco después de la fase de llenado. Después de este fondo, la temperatura aumentó debido a la actividad microbiana. Aproximadamente a los 250 minutos, la tasa de aumento de temperatura ya no tiene cambios obvios y continúa así durante el resto del ciclo. La Figura 6 muestra el cambio de temperatura en un ciclo completo.

Perfil típico de temperatura.

Como se encontró, durante la primera etapa del ciclo, la temperatura aumentó más que en la última, probablemente se deba a que la concentración de contaminantes difiere: un nivel más alto de concentración de contaminantes da como resultado una mayor actividad de los microorganismos, que es la razón principal del cambio de temperatura. La variación general de la temperatura de las aguas residuales en un determinado ciclo es relativamente pequeña, lo que está muy influenciado por la conducción de calor y el metabolismo microbiano del ambiente, mientras que la transferencia mecánica de calor, principalmente por las bombas y aireadores, tiene poca influencia en la variación de las aguas residuales. temperatura de tratamiento77.

Según el principio del modelo RFR, el proceso de modelado se divide en cuatro pasos: (1) la recopilación de datos de muestra; (2) la determinación y clasificación de la importancia de las características; (3) se agregó un número diferente de características al modelo de bosque aleatorio para seleccionar la cantidad adecuada de características importantes; (4) Modelo RFR aplicado en la práctica.

Con base en los datos del proceso de operación, el modelo de sensor suave RFR se utiliza para establecer el modelo de predicción de DQO del efluente SBR, que realiza la predicción rápida de la calidad del efluente y proporciona la base para la operación eficiente y estable del proceso de tratamiento de aguas residuales como se muestra en la Fig. 7.

El equilibrio técnico entre los procedimientos SBR y el algoritmo RFR.

En este caso, se observó que los valores de temperatura aumentaban con la reducción de DQO y se consideró útil para identificar el final de la eliminación de DQO.

En la etapa inicial de la reacción bioquímica, el anabolismo del microorganismo es intenso, lo que produce una cantidad de CO2. La cantidad de CO2 causada por el anabolismo es obviamente mayor que la de la aireación según el resultado de la medición (Fig. 5) en la etapa inicial. Además, la materia orgánica produce ácido orgánico, lo que hace que el valor del pH disminuya aún más. Una menor materia orgánica residual provocó una menor producción de CO2 y ácidos orgánicos, y el predominio de la desnitrificación en la etapa media y final durante este período contribuyó a un aumento general en el valor del pH. Por lo tanto, se observó que los valores de pH disminuían o aumentaban según la diferente materia orgánica y se consideró útil para identificar la cantidad residual de DQO.

Se construyeron y agregaron al conjunto de variables independientes una serie de variables de entrada procesadas y no procesadas, como pH, temperatura, cambio de pH y temperatura en mediciones adyacentes, etc. Las variables de entrada procesadas seleccionadas se construyeron utilizando las características del perfil.

La ventaja de que el pH y la temperatura se tomaron como variables no procesadas es que es simple y fácil detectarlas. Además, los sensores de pH y temperatura no sólo son económicos sino que también tienen una precisión de medición satisfactoria.

Cada conjunto de variables incluía una colección única de variables de entrada (Tabla 4). Dentro de cada ciclo de 480 min, los datos recopilados entre 0 y 30 min y entre 361 y 480 min se excluyeron para eliminar los efectos de los períodos de llenado y asentamiento (ya que estas fases no formaban parte de las fases de reacción biológica del ciclo de tratamiento).

Se recopilaron datos de 40 ciclos de tratamiento, 12 (30%) de los cuales se separaron aleatoriamente para su uso como conjunto de datos de prueba y el resto como conjunto de datos de entrenamiento.

La eficacia del modelo de sensor blando RFR se evaluó según cinco criterios. El valor estándar de DQO del efluente se fijó en 30 mg/l. El valor estándar del efluente puede variar debido a las regulaciones locales. Los criterios de evaluación se enumeran en la Tabla 5.

La Tabla 6 muestra los parámetros relacionados de afluente y efluente.

El coeficiente de correlación de Pearson es una medida estadística que se utiliza para determinar la fuerza y la dirección de la relación lineal entre dos variables. Los elementos esenciales de la aplicación del coeficiente de correlación de Pearson en la clasificación de correlación de variables son: (1) El coeficiente de correlación de Pearson se utiliza comúnmente en el análisis de regresión múltiple para seleccionar las variables independientes más significativas calculando los coeficientes de correlación entre cada variable independiente; (2) El coeficiente de correlación varía de -1 a 1, y cuanto mayor sea el valor absoluto, más fuerte será la correlación; (3) Cuando el valor del coeficiente de correlación es cercano a 0, indica que la correlación entre las dos variables es muy débil y pueden considerarse independientes.

Para garantizar el efecto del entrenamiento del RFR, se utilizó el método del coeficiente de Pearson para estudiar la correlación de los sujetos y se eliminaron las variables con correlación débil. Para evitar la aparición de variables no válidas, evitar el sobreajuste y mejorar el rendimiento del entrenamiento del modelo, se eliminó cualquier variable con un valor del coeficiente de correlación de Pearson normalizado, que se considera la puntuación normalizada de importancia variable, inferior a 0,01. El diagrama de ordenación de la puntuación normalizada de importancia variable resultante muestra los 12 factores que afectan la concentración de DQO (Fig. 8). Se encontró que ΔT tuvo la mayor influencia en la concentración de DQO, seguido de T, Tav, pHapex-nadir, etc.

Ranking de puntuación de importancia de cada variable.

Se recogieron datos de 40 ciclos de tratamiento. El 70% de todos los datos (28 ciclos de tratamiento) se seleccionan aleatoriamente como conjunto de entrenamiento para el modelo RFR y el 30% (12 ciclos de tratamiento) se seleccionan como conjunto de prueba para verificar la precisión del modelo.

Según la clasificación de las puntuaciones de importancia de las variables, es evidente que las variables relacionadas con la temperatura ocupan las tres primeras posiciones. Por tanto, se puede concluir que las variables relacionadas con la temperatura juegan un papel dominante en el análisis de los datos. Algunos estudios han demostrado que la actividad metabólica de las comunidades microbianas en los biorreactores de tratamiento de aguas residuales puede provocar un aumento de la temperatura del agua78,79. Esto se debe a que los microorganismos del reactor producen una gran cantidad de calor a través de la degradación y metabolismo de la materia orgánica, lo que provoca un aumento de la temperatura en el interior del reactor. Además, cabe señalar que, si bien el pH es de hecho un factor contribuyente, su importancia no es tan fuerte como la del pHapex-nadir. pHapex-nadir, que se calcula mediante el valor ápice del pH menos el valor nadir del pH para cada período de aireación, cuantifica eficazmente la cantidad de dióxido de carbono generado por la actividad microbiana durante una agitación de 20 minutos.

Para seleccionar el conjunto de variables, se seleccionaron diferentes números de variables según su importancia, y luego se agregaron al modelo RFR, como se muestra en la Fig. 9. Se encontró que cuando se seleccionaron las 7 variables principales, el El R2 del conjunto de entrenamiento y el conjunto de prueba no aumentaron y el MSE no disminuyó obviamente, por lo que se seleccionaron las 7 variables principales como la variable del modelo de RF optimizado, específicas de la siguiente manera: ∆T, T, Tav, pHapex-nadir, pH, pHav y ∆pH.

Índices de evaluación con diferentes variables cuantitativas.

La Figura 10 muestra la comparación de las concentraciones de DQO previstas y medidas en el equipo de prueba.

Comparación de concentraciones de DQO previstas y reales/medidas.

La tendencia de degradación de DQO, así como la desviación entre los valores previstos y medidos, se puede observar a partir de las variaciones en las curvas representadas en la Fig. 10. Los valores previstos permiten una estimación aproximada del efecto del procesamiento y el nivel de degradación de los contaminantes dentro de un solo ciclo. Aunque la precisión entre los valores verdaderos y predichos puede no ser perfecta, la ligera discrepancia sólo existe en la etapa inicial del proceso y pronto desaparece.

En el proceso de tratamiento de aguas residuales, el cambio de DQO está influenciado por varios factores inciertos en las condiciones de operación. Estos factores pueden causar diferencias significativas en la precisión de la predicción de DQO durante las diferentes etapas del procesamiento. En la etapa inicial, estos factores inciertos tienen una influencia más fuerte, lo que resulta en un error obvio entre los valores previstos y medidos; Con el paso del tiempo, las condiciones de procesamiento tienden a estabilizarse y el impacto de los factores inciertos en los cambios de DQO disminuye gradualmente, lo que lleva a una reducción en el error entre los valores previstos y medidos.

Por lo tanto, en la metodología propuesta, la magnitud del error entre los valores predichos y medidos se ve afectada principalmente por la etapa de procesamiento. En la etapa inicial, el error puede ser relativamente grande, pero a medida que pasa el tiempo, el error disminuirá gradualmente y eventualmente alcanzará un efecto de predicción más preciso.

El resultado del modelo del sensor suave RFR, que sirve como valor previsto de la calidad del agua en el escenario dado, puede ser fundamental para optimizar el proceso de tratamiento de aguas residuales. Esto se puede lograr reduciendo el consumo de energía y mejorando la eficiencia de los procesos químicos y biológicos. Específicamente, si el valor de DQO previsto cae por debajo del nivel estándar del efluente, el proceso puede pasar al modo de asentamiento inmediatamente, con el agitador y el aireador apagados, cerrando así el ciclo. Este método permite controlar la finalización del ciclo mediante una inteligencia artificial y un sistema de control automático, a diferencia de un enfoque de control de tiempo fijo que carece de precisión. Esto se ilustra en la Fig. 11.

Condición del ciclo finaliza.

La Tabla 7 muestra los resultados de la evaluación del conjunto de pruebas 1 a 12.

RFR es un modelo de aprendizaje automático que se utiliza para tareas de análisis predictivo, particularmente para problemas de regresión. RFR es un método de aprendizaje conjunto que combina múltiples modelos de árboles de decisión para crear un predictor más sólido y preciso.

El algoritmo RFR selecciona aleatoriamente subconjuntos de variables de entrada y muestras de datos de entrenamiento para construir árboles de decisión, que luego se combinan en un bosque. Durante la predicción, el modelo RFR agrega el resultado de árboles de decisión individuales para producir una predicción final. Este enfoque ayuda a reducir el impacto del sobreajuste y mejora el rendimiento del modelo en los datos de salida.

En el contexto de las plantas de tratamiento de aguas residuales, el modelo de sensor blando RFR se puede utilizar para predecir la calidad del agua (DQO) a través de diámetros más simples, de esta manera se reemplazarán sensores complejos y costosos. Aunque un sensor de DQO genuino puede ser una opción, varias razones o factores pueden resultar en su inadecuación y causar que surjan ciertos problemas: (1) Los sensores de DQO genuinos generalmente cuestan mucho; (2) Debido a la presencia de sólidos suspendidos en las aguas residuales, el valor de DQO medido por sensores de DQO genuinos puede ser inestable y presentar fluctuaciones significativas; (3) Algunos sensores de DQO genuinos pueden detectar compuestos orgánicos con un doble enlace de manera sensible, mientras que otros compuestos orgánicos sin un doble enlace no se pueden detectar, por lo que no se puede ignorar el error.

Además, el modelo RFR supera las deficiencias de la lenta velocidad de convergencia y la gran cantidad de muestras que requieren redes neuronales. Las redes neuronales son modelos poderosos que pueden aprender patrones complejos en los datos. Sin embargo, entrenar una red neuronal puede resultar costoso desde el punto de vista computacional y requerir una gran cantidad de datos. En particular, las redes neuronales profundas o las redes a gran escala pueden tardar mucho en converger durante el entrenamiento debido a la gran cantidad de parámetros que deben aprenderse a través de múltiples iteraciones.

Por el contrario, el modelo RFR se compone de múltiples modelos de árboles de decisión, cada uno de ellos entrenado en un subconjunto aleatorio de datos. Este enfoque tiene ventajas: (1) el modelo RFR no requiere tantos datos como las redes neuronales, ya que cada modelo de árbol de decisión puede funcionar bien con conjuntos de datos más pequeños; (2) El modelo RFR se puede paralelizar fácilmente, lo que significa que se pueden entrenar más rápidamente que las redes neuronales en sistemas informáticos de múltiples núcleos.

En comparación con los métodos utilizados en la tecnología de eliminación de contaminantes (Tabla 1), la metodología propuesta requiere solo dos tipos de datos sin procesar que sean fáciles de obtener, lo que reduce en gran medida la carga de trabajo de la adquisición de datos. La debilidad de la metodología propuesta es que el valor de predicción no es tan preciso entre el valor medido y el predicho en la primera etapa del progreso. Además, incluso si el R2 y el MSE del modelo RFR no son satisfactorios, funciona bien en la predicción de la precisión en el valor umbral de corte, como se muestra en la Tabla 7, y esto es muy preocupante en el campo de la ingeniería.

En la aplicación práctica de la metodología propuesta, es posible que el valor de DQO cumpla con el estándar mientras que otros indicadores como el amoniaco o el fósforo no lo hagan. Para abordar este problema, se pueden establecer modelos de relación utilizando el pH y la temperatura como variables para predecir los demás parámetros. Sin embargo, este enfoque se limita únicamente a los métodos de inteligencia artificial. Además, se puede establecer un sistema de juicio empírico, como que el tiempo de tratamiento de aguas residuales generalmente esté dentro de un cierto rango; si los resultados previstos exceden este rango, se considera que los resultados de la metodología propuesta requieren modificación.

Aumente la conductividad u otros parámetros fácilmente disponibles como variables de entrada para mejorar la precisión de la predicción. Las siguientes son discusiones detalladas:

Variables como la conductividad, MLSS, OD y amoníaco también se pueden utilizar como premisas para predecir la DQO. El impacto en la precisión y eficiencia de la metodología propuesta puede ser: (1) En general, en el proceso de tratamiento de aguas residuales, la conductividad eléctrica de la solución muestra una tendencia a disminuir gradualmente, lo que se relaciona con la disminución del valor de DQO, por lo tanto la conductividad eléctrica puede mejorar la precisión y la eficiencia; (2) MLSS debería mostrar una tendencia de aumento gradual; sin embargo, el cambio de MLSS no es obvio en un ciclo (480 min). Además, la precisión del sensor MLSS se ve fácilmente afectada por el color de las aguas residuales, lo que obviamente aumentará la incertidumbre de los datos medidos por los sensores; (3) El SBR funciona según la periodicidad de aireación-agitación, el DO presenta un cambio de periodicidad de aumento-disminución, que obviamente no tiene correlación con la tendencia de cambio del valor de DQO; (4) Durante el proceso de tratamiento de aguas residuales, la concentración de amoníaco en la solución generalmente muestra una disminución gradual, similar a la tendencia observada en la DQO. Sin embargo, en algunos casos, como la falta de oxígeno disuelto que inhibe la nitrificación, es posible que no haya una reducción significativa en el valor de amoníaco incluso cuando se reduce la DQO. Como resultado de la naturaleza no sincrónica de los cambios en estos dos parámetros, predecir la DQO utilizando amoníaco como variable puede introducir incertidumbre en el análisis.

Cifre la frecuencia de adquisición de datos, como recopilar datos cada 5 minutos, y luego puede predecir con cinco minutos de anticipación, lo que mejora aún más la eficiencia de la metodología propuesta.

Agregue amoníaco y fósforo como objetivos de predicción para equilibrar los indicadores de aguas residuales orgánicas e inorgánicas y mejorar la practicidad.

Se utilizaron sensores simples y estables (pH, temperatura) para predecir los valores de DQO durante todo el proceso. El modelo RFR empleado en el estudio puede considerarse como un "sensor blando" que ayuda a controlar el efecto del tratamiento.

El SBR se optimizó utilizando inteligencia artificial y un sistema de control automático para aumentar la automatización, además de ahorrar tiempo y energía. Los sensores de pH y temperatura recopilaron datos, que se ingresaron en el modelo RFR, luego el modelo generó valores de DQO en tiempo real. Una vez que el valor de DQO previsto cayó por debajo del valor estándar del efluente, el ciclo finalizó cortando el agitador y el aireador, y el proceso entró directamente en el modo de asentamiento. La metodología propuesta reemplazó el control de tiempo fijo, que no estaba controlado. En 12 casos de prueba, el porcentaje de eliminación de DQO (%) fue de aproximadamente 91.075, mientras que se ahorró un promedio de 24.25% de tiempo o energía. Estos resultados demuestran que este enfoque puede aumentar la capacidad de tratamiento y reducir el consumo de energía, lo que representa una tecnología baja en carbono.

R2 en el conjunto de prueba es de alrededor de 0,791, aunque no es demasiado alto, pero la precisión en el valor umbral de corte de DQO es de alrededor del 91%, lo cual es aceptable para la predicción. Es bastante sencillo y casi preciso adquirir el efecto de procesamiento y el nivel de degradación de los contaminantes en cualquier momento. Aunque no es tan preciso entre el valor verdadero y el predicho, la vergüenza solo ocurrió en la primera mitad del progreso y pronto desapareció. La precisión de la etapa media y final es más importante que la de la etapa inicial; la razón del hecho anterior se explica a continuación. La inteligencia artificial y el sistema de control automático condujeron a una forma optimizada, pero la precisión satisfactoria de la predicción del valor de DQO es un requisito previo. De hecho, los requisitos de precisión son diferentes en cada etapa en un escenario controlado: en la etapa media y final, especialmente cuando se acerca la etapa de cumplimiento de la norma de efluentes, se pone mayor énfasis en la precisión y la exactitud. Sin embargo, en la etapa inicial, la precisión no afecta significativamente la estrategia de control.

Debido a la no linealidad y la incertidumbre de la variación del valor de pH con el tiempo en el proceso SBR, los resultados previstos son inestables debido a diferentes algoritmos y al sobreajuste del método ANN. Debido a la distribución paralela de información y el almacenamiento del preprocesamiento estructural, RFR tiene una fuerte tolerancia a fallas y la capacidad de adaptarse al entorno externo a través del aprendizaje. La capacidad de reconocimiento de patrones y razonamiento integral sin duda abre una amplia perspectiva para la investigación experimental.

Una limitación de esta investigación es su enfoque exclusivo en la metodología SBR. Sin embargo, existe la posibilidad de modificar el procedimiento para atender a otras tecnologías, en particular los sistemas de tratamiento de aguas residuales por lotes. Al aumentar la frecuencia de adquisición de datos, como recolectar datos cada 5 minutos, es posible predecir factores hasta cinco minutos antes, mejorando así aún más la eficiencia de la metodología propuesta. Para mejorar su practicidad, se podrían incluir amoníaco y fósforo como objetivos de predicción, ya que esto ayudaría a equilibrar los indicadores de aguas residuales orgánicas e inorgánicas.

Los conjuntos de datos utilizados y/o analizados durante el estudio actual están disponibles del autor correspondiente previa solicitud razonable.

Chen, P., Zhao, W., Chen, D., Huang, Z. y Zhang, C. Progreso de la investigación sobre tecnologías de tratamiento integrado de aguas residuales domésticas rurales: una revisión. Agua 14(15), 2439–2439 (2022).

Artículo de Google Scholar

Wang, C. y col. Factores reveladores que influyen en la variación espacial en la cantidad y calidad de las descargas de aguas residuales domésticas rurales en toda China. Proceso de seguridad. Reinar. Prot. 162, 200–210 (2022).

Artículo CAS Google Scholar

Srivastava, G. et al. Influencia de las variaciones en las aguas residuales en la eliminación simultánea de nutrientes en un reactor discontinuo de secuenciación a gran escala adjunto a un selector preanóxico. En t. J. Medio Ambiente. Ciencia. Tecnología. 1, 1–18 (2022).

CAS Google Académico

Masloń, A. Impacto de la distribución desigual de aguas residuales en la eficiencia tecnológica de un reactor discontinuo de secuenciación. Sostenibilidad 14(4), 2405 (2022).

Artículo de Google Scholar

Alhazmi, HE, Yin, Z., Grubba, D., Majtacz, JB y Mąkinia, J. Comparación de la eficiencia de la desamonificación bajo diferentes concentraciones de OD en un reactor discontinuo de secuenciación a escala de laboratorio. Agua 14(3), 368 (2022).

Artículo CAS Google Scholar

Chen, D. & Li, H. Rendimiento mejorado de nitrificación y desnitrificación parcial simultánea de lodos granulares aeróbicos mediante aireación cónica en un reactor discontinuo de secuenciación para el tratamiento de aguas residuales municipales de baja concentración y baja relación DQO/TN. Reinar. Res. 209, 112743 (2022).

Artículo CAS PubMed Google Scholar

Schwitalla, P. et al. Ad/desorción de NH4+ en reactores discontinuos de secuenciación: simulación, estudios de laboratorio y a escala real. Ciencia del agua. Tecnología. 58(2), 345 (2008).

Artículo CAS PubMed Google Scholar

Kauder, J., Boes, N., Pasel, C. y Herbell, JD Combinación de los modelos ADM1 y ASM2d en una simulación de reactor por lotes de secuenciación. Química. Ing. Tecnología. 30(8), 1100–1112 (2007).

Artículo CAS Google Scholar

Wang, J., Zhao, X., Guo, Z., Yan, P. & Gao, X. Un método de gestión de vista completa basado en redes neuronales artificiales para ahorrar energía y materiales en plantas de tratamiento de aguas residuales. Reinar. Res. 211, 113054 (2022).

Artículo CAS PubMed Google Scholar

Alharbi, M., Hong, P.-Y., Laleg, K. & Taous, M. Detección de bacterias basada en redes neuronales de ventana deslizante en plantas de tratamiento de aguas residuales. J. Control de procesos 110, 35–44 (2022).

Artículo CAS Google Scholar

Salim, H., Hilal, L. y Samir, F. Predicción de la demanda bioquímica de oxígeno del efluente en una planta de tratamiento de aguas residuales utilizando un enfoque basado en redes neuronales de regresión generalizada: un estudio comparativo. Reinar. Proceso. 3(1), 153–165 (2016).

Artículo de Google Scholar

Sharghi, E., Nourani, V., Ashrafi, AA y Gökçekuş, H. Monitoreo de la calidad del efluente de la planta de tratamiento de aguas residuales mediante el método de redes neuronales artificiales basado en agrupaciones. Desalinización. Tratamiento de agua. 164, 86–97 (2019).

Artículo CAS Google Scholar

Hasanlou, H., Abdolabadi, H. & Aghashahi, M. Aplicación del análisis factorial en una simulación de una planta de tratamiento de aguas residuales industriales a gran escala utilizando un enfoque híbrido de análisis de componentes principales y red neuronal artificial. Reinar. Prog. Sostener. Energía 34(5), 1322-1331 (2015).

Artículo CAS Google Scholar

Sadek, AH, Fahmy, OM, Mahmoud, N. y Mostafa, MK Predicción de la adsorción de Cu (II) a partir de soluciones acuosas en nanoaluminio de valencia cero (nZVAl) mediante técnicas de aprendizaje automático e inteligencia artificial. Sostenibilidad 15(3), 2081 (2023).

Artículo CAS Google Scholar

Faiz, AA, Mahmoud, N., Ismail, R. & Faizal, B. Red neuronal artificial y estimación tecnoeconómica con tratamiento terciario de aguas residuales a base de algas. J. Ing. de Procesos de Agua. 40, 101761 (2021).

Artículo de Google Scholar

Mohamed, GA y Mahmoud, N. Tratamiento de agua contaminada con diazinón mediante proceso electro-Fenton: efecto de los parámetros operativos y modelado de redes neuronales artificiales. Desalinización. Tratamiento de agua. 182, 277–287 (2020).

Artículo de Google Scholar

Mithil, KN y cols. Red neuronal artificial y estimación de costos para la eliminación de Cr (VI) utilizando adsorbente compuesto policatiónico. Entorno de agua. J. 34 (S1), 29–40 (2019).

Google Académico

Fmahmoud, N., Karam, M., Michael, A. & Ibrahim, MG Capítulo 9: gestión sostenible de plantas de tratamiento de aguas residuales utilizando técnicas de inteligencia artificial. Tecnología informática blanda. Gestión de aguas residuales de residuos sólidos. 1, 171–185 (2021).

Google Académico

Nashia, D. y col. Inteligencia artificial y estadística multivariante para la evaluación integral de bacterias filamentosas en plantas de tratamiento de aguas residuales que experimentan acumulación de lodos. Reinar. Tecnología. Innovación. 19, 1 (2020).

Google Académico

Alberto, P. et al. Redes neuronales: una descripción general de las investigaciones iniciales, los marcos actuales y los nuevos desafíos. Neurocomputación 214, 242–268 (2016).

Artículo de Google Scholar

Emon, M. & Mohaiminul, I. Una descripción general de la red neuronal artificial. Soy. J. Computación. Ciencia. Aplica. 3(16), 1 (2019).

Google Académico

Kudus, SA et al. Una descripción general de la aplicación actual de la red neuronal artificial en concreto. Adv. Madre. Res. 626(626), 372 (2012).

Artículo de Google Scholar

Zelin, L. et al. Aplicación de redes neuronales artificiales en el cambio climático global y la investigación ecológica: una descripción general. Mentón. Ciencia. Toro. 55(34), 3853–3863 (2010).

Artículo de Google Scholar

Bhattacharjee, A., Murugan, R., Soni, B. & Goel, T. Ada-GridRF: Un modelo de conjunto de bosque aleatorio optimizado, rápido y automatizado, basado en impulso adaptativo, para la detección de cáncer de pulmón. Física. Ing. Ciencia. Medicina. 45(3), 981–994 (2022).

Artículo PubMed Google Scholar

Sun, D., Xu, J., Wen, H. & Wang, Y. Un modelo de bosque aleatorio optimizado y su capacidad de generalización en el mapeo de susceptibilidad a deslizamientos de tierra: aplicación en dos áreas del embalse de las Tres Gargantas de China. J. Ciencias de la Tierra. 31(6), 1068–1086 (2020).

Artículo de Google Scholar

Mateo, PV, Mesa, FJM, Villanueva, BJ & Alonso, Á. C. Un modelo de bosque aleatorio para la predicción del contenido de FOG en las aguas residuales de entrada de las EDAR urbanas. Agua 13(9), 1237 (2021).

Artículo de Google Scholar

Pengxiao, Z. et al. Un modelo de bosque aleatorio para la predicción de afluencias en plantas de tratamiento de aguas residuales. Estoco. sobre Res. Evaluación de riesgos. 33(10), 1781-1792 (2019).

Artículo de Google Scholar

Olshen, RA, Leo, B. & Jerome, F. Árboles de clasificación y regresión. Chapman y Hall Press: Londres, Reino Unido 1, 10 (2017).

Google Académico

Ferrante, M., Demarco, P. & Origgi, D. OD177-Regresión forestal aleatoria en datos de TC para predecir la dosis efectiva y la clase de dosis efectiva de acuerdo con la nueva regulación italiana. Física. Medicina. 92, S138 (2021).

Artículo de Google Scholar

Srimathi, S., Yamuna, G. & Nanmaran, R. Modelo de regresión estocástica basado en umbrales con filtro Gabor para segmentación y clasificación forestal aleatoria del cáncer de pulmón. J. Computación. Teor. Nanociencia. 16(4), 1666–1673 (2019).

Artículo CAS Google Scholar

Cristina, Z. Modelado de la conexión entre el riesgo sistémico bancario y los indicadores de liquidez del balance mediante regresiones forestales aleatorias. Administración. Ciencia. 10(3), 52 (2020).

Artículo de Google Scholar

Yihui, C. & Minjie, L. Evaluación de factores que influyen en la producción de té basada en regresión forestal aleatoria y valor de impacto medio. Agrícola. Economía. 65, 340–347 (2019).

Google Académico

Luo, Y., Yan, J., Mcclure, SC y Li, F. Factores socioeconómicos y ambientales de la pobreza en China utilizando un modelo de regresión forestal aleatorio ponderado geográficamente. Reinar. Ciencia. Contaminación. Res. En t. 29(22), 33205–33217 (2022).

Artículo PubMed PubMed Central Google Scholar

Song, HE, Jianhua, WU, Wang, D. & Xiaodong, HE Modelado predictivo de la contaminación por nitratos de aguas subterráneas y evaluación de sus principales factores de impacto utilizando bosques aleatorios. Quimiosfera 290, 133388 (2021).

Google Académico

Zhangwen, SU, Lin, L., Chen, Y. & Hu, H. Comprensión de la distribución y los factores impulsores de las concentraciones de PM2,5 en el delta del río Yangtze de 2015 a 2020 mediante regresión forestal aleatoria. Reinar. Monit. Evaluar. 194(4), 284 (2022).

Artículo de Google Scholar

Wang, Q. y col. Reconstrucción espacialmente explícita de la distribución de la población en la cuenca del río Tuojiang durante 1911-2010 mediante regresión forestal aleatoria. Reg. Reinar. Cambio 22(1), 1 (2022).

Artículo de Google Scholar

Wang, F. y col. Modelado de heterogeneidad espacial de la calidad del agua basado en regresión forestal aleatoria e interpretación de modelos. Reinar. Res. 202, 111660 (2021).

Artículo CAS PubMed Google Scholar

Shijun, C. y col. Predicción de escorrentía a mediano y largo plazo basada en un modelo de regresión forestal aleatoria. Suministro de agua 20(8), 3658–3664 (2020).

Artículo de Google Scholar

Harrison, JW, Lucius, MA, Farrell, JL, Eichler, LW y Relyea, RA Predicción de concentraciones de nitrógeno y fósforo en corrientes a partir de sensores de alta frecuencia mediante regresión de bosques aleatorios. Ciencia. Medio ambiente total. 763, 143005 (2020).

Artículo ADS PubMed Google Scholar

Weiran, Y. et al. Evaluación de regresión forestal aleatoria y regresión lineal múltiple para predecir concentraciones de partículas finas en interiores en una ciudad altamente contaminada. Reinar. Contaminación. 245, 746–753 (2018).

Google Académico

Kronholm, SC, Capel, PD y Terziotti, S. extrajeron estadísticamente variables fundamentales de la cuenca para estimar las cargas de nitrógeno total en pequeños arroyos. Reinar. Modelo. Evaluar. 21(6), 681–690 (2016).

Artículo de Google Scholar

Shi, GY y cols. Modelado de la respuesta de iones negativos del aire a factores ambientales mediante regresión lineal múltiple y bosque aleatorio. Ecológico. Informar. 66, 1 (2021).

Google Académico

Keramat, JM, Saeid, MS, Mousazadeh, H., Ghasemi, VM & Rahimi, MM Estudio de la proporción de humedad en tiempo real de astillas de fruta de dátil de secado basado en atributos de imágenes en línea utilizando kNN y métodos de regresión forestal aleatoria. Medida 10, 8899 (2020).

Google Académico

Balogun, AL y Tella, A. Modelado e investigación de los impactos de las variables climáticas en la concentración de ozono en Malasia mediante análisis de correlación con bosque aleatorio, regresión de árbol de decisión, regresión lineal y regresión de vector de soporte. Quimiosfera 299, 134250 (2022).

Artículo ADS CAS PubMed Google Scholar

Wang, J. y col. Un método de gestión de vista completa basado en redes neuronales artificiales para ahorrar energía y materiales en plantas de tratamiento de aguas residuales. Reinar. Res. 211, 113054 (2022).

Artículo CAS PubMed Google Scholar

Fernandez de Canete, J. & Del Saz-Orozco, P. Estimación por detección suave de las concentraciones de efluentes de una planta de tratamiento biológico de aguas residuales utilizando una red neuronal óptima. Sistema experto. Aplica. 63, 8-19 (2016).

Artículo de Google Scholar

He, F., Wang, J. & Chen, W. Evaluación de una producción más limpia para plantas de tratamiento de aguas residuales basada en una red neuronal artificial de retropropagación. Neuro Quantol. 16(6), 1 (2018).

Google Académico

Zhao, HY, Huang, FL, Li, L. & Zhang, CY Optimización del tratamiento de digestión anaeróbica de aguas residuales basado en la red neuronal GA-BP. Desalinización. Tratamiento de agua. 122, 30–35 (2018).

Artículo CAS Google Scholar

Junfei, Q., Gaitang, H., Honggui, H. & Wei, C. Método de control del tratamiento de aguas residuales basado en una red neuronal difusa recurrente adaptativa de reglas. En t. J. Intel. Computadora. Cibern. 10(2), 94-110 (2017).

Artículo de Google Scholar

Watanabe, S. & Yamana, H. Medición de sobreajuste de redes neuronales convolucionales utilizando pesos de red entrenados. En t. J. Ciencia de datos. Anal. 14(3), 261–278 (2022).

Artículo de Google Scholar

Kai, I., Yuta, O. y Moriya, N. Sobreadaptación de un ecualizador no lineal basado en redes neuronales artificiales para señales multinivel en sistemas de comunicación óptica. Conferencia OPTO, 2020.

Oyedotun, OK, Olaniyi, EO y Khashman, A. Una revisión sencilla y práctica del sobreajuste en el aprendizaje de redes neuronales. En t. J. Aplica. Patt. Reconocer. 4(4), 307–328 (2017).

Artículo de Google Scholar

Buskirk, TD Estudio de los bosques y muestreo de los árboles: una descripción general de los árboles de clasificación y regresión y los bosques aleatorios con aplicaciones en la investigación por encuestas. Sobrevivir. Practica. 11(1), 1–13 (2018).

MathSciNetGoogle Académico

Matthias, S. & Rosie, YZ El algoritmo de bosque aleatorio para el aprendizaje estadístico. Pararse. Ciencia genómica. 20(1), 3–29 (2020).

Google Académico

Kim, B., Cha, JW, Chang, K. y Lee, C. Predicción de visibilidad sobre Corea del Sur basada en bosques aleatorios. Atmósfera 12(5), 552 (2021).

Artículo ADS CAS Google Scholar

Massimo, S. y col. Un enfoque forestal aleatorio para estimar las partículas diarias, el dióxido de nitrógeno y el ozono con una resolución espacial fina en Suecia. Atmósfera 11(3), 1 (2020).

Google Académico

Rubal, DK Evolving Método de evolución diferencial con bosque aleatorio para la predicción de la contaminación del aire. Proc. Computadora. Ciencia. 132, 824–833 (2018).

Artículo de Google Scholar

Shamsoddini, A., Aboodi, MR y Karami, J. Predicción de contaminantes del aire de Teherán basada en métodos aleatorios de selección de características forestales. En t. Arco. Fotograma. Sensores remotos Spatia 4, 483–488 (2017).

Artículo de Google Scholar

Shi, G.-Y. et al. Modelado de la respuesta de iones negativos del aire a factores ambientales mediante regresión lineal múltiple y bosque aleatorio. Ecológico. inf. 66, 1 (2021).

Artículo de Google Scholar

Min, JS y cols. Identificación de los principales efectos de las emisiones de N2O de los sistemas biológicos de eliminación de nitrógeno a gran escala utilizando un enfoque forestal aleatorio. Agua Res. 184, 116-144 (2020).

Google Académico

Vitorino, D. et al. Un algoritmo de bosque aleatorio aplicado al modelado y pronóstico del deterioro de las aguas residuales basado en la condición. Proc. Ing. 89, 401–410 (2014).

Artículo de Google Scholar

Buras, MP & Solano, DF Identificación y estimación de la localización de focos de contaminación industrial en la red de alcantarillado. Sensores 21(10), 3426 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Medl, M., Rajamanickam, V., Striedner, G. & Newton, J. Desarrollo y validación de un sensor blando de densidad óptica basado en una red neuronal artificial para un sistema de fermentación de alto rendimiento. J. Procesos 11(1), 297–307 (2023).

Artículo CAS Google Scholar

Cong, QM, Bo, G.-H. y Shi, H.-Y. Sensor soft integrado de DQO para EDAR basado en modelo ASP y red neuronal RBF. J.Meas. Control 56(1–2), 295–303 (2023).

Artículo de Google Scholar

Hema, P. y col. Sistemas robustos de sensores blandos para la industria: evaluados a través de un estudio de caso en tiempo real. J.Meas. Sens. 24, 1 (2022).

Google Académico

Severino, AGV, De, LJMM & De, AFMU Sensor suave industrial optimizado por PSO mejorado: un enfoque profundo de aprendizaje de representación. J. Sens. 22(18), 6887–6899 (2022).

ADS del artículo Google Scholar

Dimitriadis, SI y Liparas, D. ¿Qué tan aleatorio es el bosque aleatorio? Algoritmo de bosque aleatorio al servicio de biomarcadores de imágenes estructurales para la enfermedad de Alzheimer: de la base de datos de la iniciativa de neuroimagen de la enfermedad de Alzheimer (ADNI). Regeneración neuronal. Res. 13(6), 962–970 (2018).

Artículo PubMed PubMed Central Google Scholar

Jaime, LS et al. Una comparación de métodos de selección de variables de bosque aleatorio para el modelado de predicción de clasificación. Sistema experto. Aplica. 134, 93-101 (2019).

Artículo de Google Scholar

Christopher, S., Margaret, GS, Chuck, EB y Anders, K. Clasificación semiautomática de la cubierta de lecho rocoso expuesto en las montañas del sur de la Columbia Británica utilizando un enfoque de bosque aleatorio. Geomorfología 285, 214–224 (2017).

Artículo de Google Scholar

Hristos, T. & Georgia, P. Una breve revisión de bosques aleatorios para científicos y profesionales del agua y su historia reciente en los recursos hídricos. Agua 11(5), 910 (2019).

Artículo de Google Scholar

Kamakshaiah, M. & Prasada Rao, SS Aplicabilidad de la previsión de bosques aleatorios al comercio internacional de divisas: una investigación a través del lenguaje. En t. J. Autobús. Anal. Intel. 6(1), 47–57 (2018).

Google Académico

Shu, FY, Joo, HT & Yu, L. Efecto de la relación entre la demanda de nitrógeno del sustrato y oxígeno químico en la formación de gránulos aeróbicos. J. Medio Ambiente. Ing. 131(1), 86–92 (2005).

Artículo de Google Scholar

Tanwar, P., Nandy, T., Ukey, P. y Manekar, P. Correlación de parámetros de monitoreo en línea, pH, OD y ORP con la eliminación de nutrientes en un sistema de biorreactor de proceso cíclico intermitente. Biores. Tecnología. 99, 7630–7635 (2008).

Artículo CAS Google Scholar

Chang, CH y Hao, OJ Sistema de reactor por lotes de secuenciación para la eliminación de nutrientes: perfiles de ORP y pH. J. química. Tecnología. Biotecnología. En t. Res. Entorno del proceso. Tecnología limpia. 67, 27–38 (1996).

CAS Google Académico

Tong, Q., Mao, Z. y Sun, L. Variación del valor de OD y pH en el proceso de tratamiento de lixiviados de vertederos mediante SBR. Proc. Año. Encontrarse. China Silicato Soc. Reinar. Proteger. 325–328 (2007).

Shane, F., Mcdermott, J., Doherty, E., Cooney, R. y Clifford, E. Aplicación de redes neuronales y modelos de regresión para permitir el cumplimiento normativo ambiental y la optimización energética en un reactor discontinuo de secuenciación. Sostenibilidad 14, 4098 (2022).

Artículo de Google Scholar

Hao, X., Sun, S., Li, J. & Liu, R. Establecimiento y verificación de un modelo de temperatura para el proceso de tratamiento de agua. J. Medio Ambiente. Ciencia. (China) 42(12), 1–11 (2022).

CAS Google Académico

Pochwała, S. & Kotas, P. Posibilidad de obtener calor de aguas residuales de una planta depuradora mediante una bomba de calor: un estudio de caso. Conferencia web E3S. 44, 144-144 (2018).

Liang, J., Zhang, P., Cai, Y., Wang, Q. y Zhou, Z. Efectos térmicos. Entorno de agua. Res. Publ. Entorno de agua. Alimentado. 92(10), 1406–1411 (2020).

Descargar referencias

La investigación cuenta con el apoyo del Proyecto Clave de Investigación y Desarrollo del Plan Provincial de Ciencia y Tecnología de Sichuan, China (22ZDYF1876).

Departamento de Ingeniería Ambiental y de Materiales, Universidad Tecnológica de Chengdu, Chengdu, China

Qiu Cheng y Li Qianglin

Huicai Environmental Technology Co., Ltd., De Yuan Zhen, distrito de Pidu, Chengdu, Sichuan, China

Zhan Chun Hong

También puedes buscar este autor en PubMed Google Scholar.

CQ, CZ y QL escribieron el texto principal del manuscrito y todas las figuras y tablas. Todos los autores revisaron el manuscrito.

Correspondencia a Li Qianglin.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado al autor(es) original(es) y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Cheng, Q., Chunhong, Z. y Qianglin, L. Desarrollo y aplicación de un modelo de sensor blando de regresión forestal aleatoria para el tratamiento de aguas residuales domésticas en un reactor discontinuo de secuenciación. Representante científico 13, 9149 (2023). https://doi.org/10.1038/s41598-023-36333-8

Descargar cita

Recibido: 22 de febrero de 2023

Aceptado: 01 de junio de 2023

Publicado: 05 de junio de 2023

DOI: https://doi.org/10.1038/s41598-023-36333-8

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.