Aplicación de inteligencia visual en la detección de botellas de agua de plástico en medios acuáticos
Los investigadores en geociencias están aprovechando algoritmos de aprendizaje automático (ML) e inteligencia artificial (IA) para abordar una amplia gama de desafíos. En el campo de los recursos hídricos, las técnicas de IA y ML han abierto nuevas vías de investigación que incluyen modelos de gestión del agua basados en el proceso de decisión de Markov, análisis de la profundidad del agua con redes neuronales convolucionales y modelado de tasas de infiltración con el algoritmo Firefly. Un enfoque popular, conocido como visión por computadora, extrae información de imágenes o videos y tiene una aplicación generalizada en ciencias médicas, vehículos autónomos y fabricación. La visión por computadora ofrece ventajas como sensores de grabación de video de bajo costo, análisis en tiempo real y una entrada rica en datos.
La visión por computadora también ha encontrado aplicación en la detección y clasificación de basura. Por ejemplo, se utilizó una red neuronal convolucional profunda para detectar y clasificar imágenes de desechos de la carretera grabadas por una cámara montada en un vehículo. Como uno de los primeros estudios de basura, los investigadores recopilaron y anotaron casi 20,000 imágenes para su aplicación. Para mejorar la disponibilidad limitada de datos de entrenamiento, se desarrolló un conjunto de datos de escombros de basura con más de 48,000 anotaciones. Otros conjuntos de datos de basura incluyen Trash Annotations in Context (1,500 imágenes), The Plastic Bottles in the Wild (8,000 imágenes), The Unmanned Aerial Vehicle - Bottle Dataset (25,000 imágenes) y The Images of Waste (9,000 imágenes).
Las iteraciones anteriores del software de detección de basura se han centrado en soluciones generales capaces de detectar múltiples tipos de basura. Algunas de estas herramientas se han aplicado en sistemas de clasificación de residuos, incluidas las estaciones de reciclaje. Sin embargo, estas herramientas no se adaptan fácilmente al entorno exterior porque dependen de cámaras cercanas a los objetos, tienen condiciones ambientales controladas (p. ej., iluminación y fondo) y utilizan un conjunto limitado de elementos de prueba. Se han desarrollado varias herramientas de propósito general para la detección de basura en cuencas hidrográficas. Sin embargo, estas herramientas enfrentan desafíos clave como la ausencia de algoritmos de conteo, una menor precisión para detectar objetos distantes y altas tasas de falsos positivos.
El proyecto buscanba abordar estas limitaciones mediante el desarrollo de una herramienta especializada que solo cuenta las botellas de plástico en ecosistemas acuáticos a medida que se mueven por el fotograma del vídeo. El programa, denominado botell.ai , implementa un modelo de detección de objetos que encuentra la presencia y ubicación de una botella dentro de un fotograma. Luego, botell.ai compara cada elemento detectado y rastrea su movimiento. En la etapa final del posprocesamiento, se analiza el movimiento de los objetos rastreados y se filtran los elementos estacionarios del modelo. Además, este proyecto sigue las mejores prácticas de Integración, Coordinación, Apertura y Red (ICON) con un código fuente disponible públicamente, archivos de vídeo de entrada y vídeos de resultados del modelo de salida.
La cuantificación de residuos macroplásticos mediante software como botell.ai es esencial para abordar la contaminación plástica en los ecosistemas acuáticos. Las botellas de agua son una fuente común de residuos plásticos, que se encuentran frecuentemente como contaminantes en todo el mundo. Con el tiempo, estas botellas se degradan, lo que contribuye a la creciente presencia de microplásticos y nanoplásticos tanto en ambientes de agua dulce como marinos.
Este trabajo propone un enfoque automatizado para el conteo de residuos, centrándose en el uso de visión artificial, aprendizaje profundo y algoritmos de seguimiento de objetos para obtener conteos precisos de botellas de plástico a medida que se desplazan por ríos y arroyos. Mediante una combinación de varios conjuntos de datos de imágenes de basura y botellas de plástico etiquetados, disponibles públicamente, el modelo se entrenó para lograr un alto rendimiento con el modelo de detección de objetos YOLOv8. Este se complementa con la biblioteca de seguimiento de objetos Norfair y un novedoso algoritmo de postprocesamiento para filtrar falsos positivos. El modelo tuvo un rendimiento extremadamente preciso en los escenarios de prueba, con un solo falso positivo y una recuperación superior a 0,947.
botell.ai demostró un excelente rendimiento, detectando, rastreando y contando con precisión prácticamente todas las botellas durante las pruebas de ángulo óptimo (recuperación de 0,95 y 0,98). Las pruebas de ángulo subóptimo tuvieron un rendimiento deficiente (recuperación de 0,32 y 0,71) y destacaron la importancia de la calidad del video (p. ej., ángulo de la cámara, resolución, velocidad de fotogramas y distancia al objeto). Las pruebas con drones y vista lateral también arrojaron resultados prometedores. Solo se registró un falso positivo en las seis pruebas debido al algoritmo de filtrado.
[Este contenido procede de Nature Lee el original aquí]






