De datos y gráficas

En los últimos días han aparecido un montón de datos sobre la contaminación en la ciudad de México y en la Zona Metropolitana del Valle de México (ZMVM) con esto y la cobertura de los medios nos hemos enterado de cosas buenas, malas y pésimas, de como ha ido cambiando la forma en que se miden los contaminantes y de que hace nuestro gobierno para trabajar con ello, de estas dos me llamaron mucho la atención, una de un medio reconocido, Forbes y otra en Twitter.

Forbes

La de Forbes [1] con un titular por que se antoja a caza clic “Tu carne asada está asfixiando a la CDMX, aún más que los incendios” al leerla hace un buen análisis y presenta argumentos muy buenos, hasta que entra en detalle con lo de la carne asada.

[1]

En la tabla podemos ver de manera correcta las fuentes contaminantes y con subrayado el dato que da nombre al articulo, es decir cuanto aporta el asado al carbón a la contaminación, lo cual podemos ver es un montón y se nota más porque los datos de arriba son de la Ciudad de México y los datos arriba del subrayado son para toda la ZMVM es decir una zona mucho más amplia y pues no se puede comparar estos datos simplemente… como lo hacen en el trabajo, dicho sea de paso no me percate de esto hasta que fui y busque el documento de donde sacaron la información [2] ya que al copiar la gráfica olvidaron copiar, la conveniente nota al pie donde explica esto al final de la tabla.

En Twitter

 

[3]

El de Twitter lo hace el usuario @EulerEquation en varios mensajes pero especialmente este [3] ahora yo supongo que utilizo los datos de aire.cdmx.gob.mx ya que pone como fuente estos así que fui al sitio y los busque [4] lo cual no toma mucho tiempo ya que están en la barra de arriba en la sección datos / partículas, y tenia curiosidad originalmente de ver porque el valor tan alto en una serie tan larga ya que otro usuario ya le había mencionado que debía especificar que estación estaba mostrando o de cuales estaba tomando los datos y presento esta otra gráfica [5] ya intrigado agarre por supuesto excel, ya que en eso estaba trabajando mis datos del trabajo ni se me ocurrió abrir Calc por cierto replicar los resultados es más sencillo en Gnumeric que en LibreOffice Calc y obtuve las dos siguientes gráficas [6] y [7] en la primera selecciono los valores para 2019 y pido que se muestren solo los superiores a 150, digo para pensar en las contingencias, que es lo que da inicio a este hilo y resulta que al ver los datos y no tanto la gráfica los únicos valores presentes, son PST y PM10 dicho sea de paso PST significa Partículas Suspendidas Totales es todo sumado o mucho mas que sólo PM2.5 que era las que nos interesaba en todo caso los remito al catalogo [6] y en la segunda gráfica obtuve los datos que son de 2019 y en la columna parámetro incluyen PM2.5 y los grafique dando mucho más bajo que las otras gráficas… es importante notar que los datos no están al día, ni son en tiempo real la última medición de la serie es del 28 de marzo de 2019.

[5]

[6]

[7]

En fin, ¿por qué hacer tanto ruido con dos gráficas? Bueno en clase tengo con mis estudiantes al menos una sesión donde hablamos de como las gráficas pueden engañar o como uno puede caer en el error al elegir los datos de manera apresurada o por el como se ve la gráfica sin entender los datos y eso, me lo encontré hoy en gráficas del día de ayer y en información muy importante que esta surcando la red y me pareció un buen ejercicio para recordar que no solo es rollo que vemos en el salón es importante saber que información estamos obteniendo y que nos dice.

PS 17 de mayo 2019. Resulta que por la discusión y las gráficas que obtuvimos al graficar estábamos usando los datos de las estaciones [7] que resulta que tienen una periodicidad de un día y en los datos no dice a que hora hacen el corte y suponemos que es el promedio, de hecho esto dice al principio del archivo.

Red Manual
city: Ciudad de México
cityCode: MEX
country: México
mesurementAgency: SIMAT
URL: http://www.aire.cdmx.gob.mx
timeStamp: 1989/01/02 al 2019/03/28
average_interval: 001d

Ya entrado en gastos pues me puse a ver si había mediciones mayores a 150 puntos en PM2.5 y encontré más de las que había encontrado en el promedio diario, ahí fue que me dí cuenta que en el caso de los contaminantes si hay un archivo con mayor amplitud de datos y es el de contaminantes [8] y que su intervalo promedio es de una hora.

Pollutants
city: Ciudad de México
cityCode: MEX
country: México
mesurementAgency: SIMAT
URL: http://www.aire.cdmx.gob.mx
timeStamp: 2019/01/01 al 2019/12/31
average_interval: 001h
version:DT001-IAD-20190424-122436
key: M-VAP8E-XVZ6W-ERD1C-8RP3F

Con este encontré unos datos de horror en enero de este año y seguro que cuando estén disponibles los de mayo encontraremos más cosas que nos pueden quitar el sueño [9].

Por ejemplo que en enero casi llegamos a 400 en partículas…

Que para PM2.5 haciendo un filtro sólo en enero se supero los 150 ojo estos datos son solo de 2019 y solo hay datos de enero a marzo 28

De hecho me preocupa que muchos que hicimos gráficas no hayamos leído con detenimiento arriba donde viene la descripción de los mismo y que en la tabla es hasta más fácil de interpretarlos que en la gráfica, por supuesto después de aplicar un filtro =>150 sólo PM2.5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Actualización 27 de junio 2019, no es muy claro en la página pero varias de las gráficas que mostraron otros usuarios, las genera el propio sitio de de aire.cdmx.gob.mx en la sección de estadísticas en gráficos interactivos, los cuales no son malos, pero tampoco es muy claro como generarlos y que obtiene uno de ellos, por supuesto es más sencillo de utilizar que los datos y generar uno sus propias gráficas, sobre todo si no tiene uno muy claro que esta comparando y en que periodo, acá la gráfica anual de PM.25 con los datos disponibles al día de hoy. De igual forma al descargar los datos se encuentran los específicos de los datos y los limites de aplicación, pero de eso ya se escribió arriba ampliamente.

Y resulta que muchas gráficas que vi, pues son las mismas generadas por el sitio

[1] https://www.forbes.com.mx/tu-carne-asada-esta-asfixiando-a-la-cdmx-aun-mas-que-los-incendios
[2] http://www.aire.cdmx.gob.mx/descargas/publicaciones/flippingbook/inventario-emisiones-2016/mobile/inventario-emisiones-2016.pdf
[3] https://twitter.com/EulerEquation/status/1128651226541899776
[4] http://www.aire.cdmx.gob.mx/default.php?opc=%27aKBhnmE=%27&r=aHR0cDovLzE0OC4yNDMuMjMyLjExMjo4MDgwL29wZW5kYXRhL3JlZF9tYW51YWwvcmVkX21hbnVhbF9wYXJ0aWN1bGFzX3N1c3AuY3N2
[5] https://twitter.com/RasYaotl/status/1128728120801075201
[6] http://148.243.232.112:8080/opendata/catalogos/cat_parametros.csv
[7] http://148.243.232.112:8080/opendata/red_manual/red_manual_particulas_susp.csv
[8] http://148.243.232.112:8080/opendata/anuales_horarios_gz/contaminantes_2019.csv.gz
[8] https://twitter.com/vicm3/status/1129114216387010566

Esta entrada ha sido publicada en Debraye, Educación, General, Web y etiquetada como , , , , . Guarda el enlace permanente.

2 respuestas a De datos y gráficas

  1. Nodens dijo:

    Ahí te va un ‘Torito», en USA tiene un problema con las PM 2.5 muy altas… GENERADAS En ambientes interiores, hogares principalmente. Me llegó el boletín de la EPA para una reunión que harán del tema.

    • vicm3 dijo:

      Jajajaj, yo agarre esos de ocioso y porque ya pensé en remplazar un ejercicio que tenia con datos inventados por este de la contaminación para que mis estudiantes aprendan porque es importante usar los autofiltros y elegir gráficas, de lo otro, si son los datos los latosos cosa de leerlos, el reporte de EPA a menos que tenga las tablas de datos y medidas, no creo que me vaya servir mucho, esa es tu especialidad no la mía.

      ¿Pura curiosidad, en el norte, centro o sur de USA? Estoy pensando en aislamiento, calefacción, pintura y a lo mejor electrodomésticos. :D

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.