Mejora de la calidad de datos de sensores ciudadanos para monitoreo de contaminación atmosférica
En la última década, los sensores de calidad del aire de bajo costo se han popularizado, permitiendo una monitorización más amplia y participativa de la calidad del aire por parte de las comunidades. Investigadores y responsables políticos desean utilizar estos datos recopilados por la ciudadanía para revelar patrones de contaminación, especialmente la causada por partículas PM 2.5 (menores de 2,5 μm).
Sin embargo, los sensores de bajo costo no siempre proporcionan datos precisos que puedan integrarse con las redes y sistemas técnicos de calidad del aire existentes. Los problemas de calidad de los datos, causados por dificultades en la calibración de los sensores, variaciones en las condiciones ambientales, degradación con el tiempo y otros factores, constituyen una preocupación importante que limita el uso de los datos de ciencia ciudadana en proyectos de investigación. Por ejemplo, los investigadores han observado que los sensores suelen calibrarse para detectar partículas en condiciones controladas, pero las condiciones de campo, como los niveles de humedad, pueden interferir con las lecturas.
Estos problemas de precisión impiden que los sensores de bajo coste se utilicen para respaldar medidas oficiales como la Directiva revisada de la UE sobre la calidad del aire ambiente (2024/2881 ). Una práctica que busca solucionar este problema consiste en ubicar los sensores junto a estaciones de referencia (estaciones de medición oficiales que cumplen con los estándares de calidad de datos de la Agencia Europea de Medio Ambiente (AEMA) ) en el terreno y recalibrarlos para adaptarlos a las condiciones locales. Existen otros problemas, como el hecho de que los sensores suelen ser operados por personal no especializado, que puede no seguir los protocolos de mantenimiento u operación; además, los sensores de distintos fabricantes pueden requerir calibraciones diferentes. Para evitar la necesidad de ubicar los sensores junto a estaciones de referencia y realizar calibraciones complejas, se requiere un sistema de control de calidad.
Con esto en mente, un nuevo estudio propone un proceso de control de calidad (CC) robusto, transparente y estandarizado que corrige los datos de los sensores, basándose en datos de estaciones de referencia cercanas. Los investigadores presentan un marco de trabajo denominado FILTER (Marco para la Mejora de la Eficacia y la Fiabilidad de Tecnologías de Bajo Coste), que puede mejorar la fiabilidad de los datos de contaminación por PM2.5 obtenidos por usuarios o mediante crowdsourcing en múltiples redes. Este marco es aplicable tanto a pequeña como a gran escala geográfica y está diseñado para superar las limitaciones de otros marcos similares desarrollados previamente (que, por ejemplo, solo funcionan a escalas más pequeñas, son específicos para cada sensor o requieren una calibración sustancial).
Los investigadores aplicaron FILTER a datos de PM2.5 recopilados entre 2018 y 2023 por sensores a gran escala operados por ciudadanos en Europa, almacenados en dos bases de datos: sensor.community y PurpleAir. Estos conjuntos de datos comprendían más de 13.200 millones de observaciones en 38.294 ubicaciones únicas con una resolución subhoraria. Las observaciones se obtuvieron de más de 400 sensores, ubicados a una distancia máxima de 500 m de las estaciones de referencia.
FILTER procesó tanto datos brutos como “corregidos”, calibrados para tener en cuenta el tipo de contaminación, las condiciones meteorológicas y atmosféricas locales, y estandarizados para considerar las diferentes formas de obtener coordenadas geográficas, utilizando datos de estaciones meteorológicas.
El proceso incluyó cinco pasos de control de calidad:
- Validez del rango: verifica que cada medición se encuentre dentro de un rango físicamente plausible de concentraciones de PM 2.5 , entre 0 y 1000 μgm −3 .
- Valor constante: marca cualquier sensor que informe continuamente el mismo valor (dentro de ≤0,1 μgm −3 ) durante un período de tiempo móvil de 8 horas, ya que el sensor puede estar funcionando mal.
- Detección de valores atípicos: identifica valores atípicos estadísticos (picos o caídas extremas en PM 2.5 y desviación de los promedios en los datos de la red de monitoreo de la calidad del aire de la AEMA).
- Correlación espacial: evalúa la correlación con datos de sensores vecinos dentro de un radio de 30 kilómetros durante un período de 30 días.
- Similitud espacial: evalúa si las mediciones de un sensor son consistentes y esperadas considerando estaciones de referencia en lugar de sensores, dentro de un radio de 30 kilómetros.
FILTER pudo proporcionar valores corregidos para el 52,5% de las mediciones originales del sensor, lo que aumentó los datos útiles en el área de estudio de 224 mediciones por km 2 provenientes de estaciones de referencia a 1.428 mediciones de alta calidad por km 2, incluidos los datos de sensores de bajo costo.
Observaron que casi dos tercios de las lecturas provenían de zonas urbanas. Los países con mayor número de sensores fueron Alemania (14.002), los Países Bajos (4.541), Polonia (2.574) y Bélgica (2.484). Las ciudades con mayor número de sensores fueron Sofía (862), Berlín (792), Stuttgart (759), Bruselas (683) y Dortmund (661).
Los investigadores señalan una pérdida significativa de datos entre sus pasos de control de calidad 4 y 5, debido a la falta de puntos de referencia con los que verificar las observaciones de sensores de bajo costo; si se detienen en el paso 4, la densidad espacial de las mediciones corregidas era casi el doble (∼2750 por km 2 ).
Afirman que los datos procesados hasta el paso 4 de su proceso de control de calidad parecen fiables y, por lo tanto, podrían considerarse dignos de confianza para algunas aplicaciones, permitiendo así un equilibrio pragmático entre la disponibilidad y la calidad de los datos. Aplican tres niveles de calidad: «alta calidad» hasta el paso 5; «buena calidad» hasta el paso 4; y «otra calidad», donde no se puede garantizar la calidad.
Indican dos tipos de aplicaciones en el mundo real para los datos de los sensores controlados por FILTER: aquellas en las que los niveles relativos de PM 2.5 son suficientes (por ejemplo, para monitorear tendencias y fluctuaciones; antes y después de las medidas de control de la contaminación, para rastrear patrones diurnos o para sensibilizar al público), y aquellas en las que los niveles absolutos de PM 2.5 son esenciales (por ejemplo, para el cumplimiento normativo, la evaluación de riesgos para la salud, el modelado de emisiones o el cálculo de los índices de calidad del aire).
Entre las limitaciones del enfoque se encuentran que está diseñado para sensores exteriores fijos de bajo costo que monitorean únicamente PM 2.5 ; no puede tener en cuenta las mediciones realizadas más de una vez por hora; y supone que los datos de las estaciones de referencia cercanas son adecuados para la corrección de datos.
Sin embargo, los investigadores destacan que FILTER ha demostrado ser capaz de mejorar la precisión y la fiabilidad de los datos de PM 2.5 recopilados por sensores de bajo coste en Europa, y por lo tanto podría desempeñar un papel en la creación de un conjunto de datos armonizado y con control de calidad de observaciones de contaminantes atmosféricos para apoyar la investigación de la calidad del aire, las evaluaciones de salud pública y la política ambiental.
[Este contenido procede de European Commission Lee el original aquí]






