Machine Learning

Una aproximación al TDAH basada en datos abiertos del Observatori del Sistema de Salut de Catalunya.

March 16, 2017

Ramon Julià – NomarData

El trastorno de déficit de atención con hiperactividad (TDAH) es la ‘enfermedad’ de moda en la infancia. Se habla de una “prevalencia” en la infancia –proporción de niños y niñas que lo padecen en un período determinado– de entre el 5% y el 8%, aunque la cifra es ampliamente discutida. La diversidad de enfoques en el diagnóstico y el tratamiento, en algunos casos diametralmente opuestos, hace que quienes presentan esta sintomatología queden atrapados en medio de una controversia en la que juega un papel fundamental la poderosa industria farmacéutica.

¿Es una enfermedad? ¿Un trastorno de conducta?

El TDAH es un trastorno cuyos síntomas incluyen dificultad para concentrarse y prestar atención, dificultad para controlar la conducta e hiperactividad. Los primeros síntomas de esta condición fueron descritos en un artículo científico de la revista The Lancet en el año 1902. Desde entonces se han realizado muchos estudios y algunos de ellos vinculan los síntomas con una disfunción de ciertas áreas del cerebro. Sin embargo, no todos los especialistas comparten esta visión y, más un siglo después de la publicación del aquel estudio, la clasificación de estos síntomas sigue siendo objeto de controversia científica.

Las dos principales referencias que utilizan los especialistas en psiquiatría son el Manual de Diagnóstico y estadístico de los trastornos Mentales de la Asociación de Psiquiatría Americana, llamado DSM, y la Clasificación Internacional de las Enfermedades y Trastornos relacionados con la Salud Mental de la Organización Mundial de la Salud, llamado CIE. La última versión del DSM sí reconoce explícitamente el TDAH como un trastorno del neurodesarrollo. Sin embargo, en el CIE, principal referencia en Europa y adoptado por el Ministerio de Sanidad español, el llamado trastorno hipercinético se sigue considerando un trastorno de conducta.

Dificultades en el diagnóstico

Precisamente el diagnóstico es otro de los puntos controvertidos del TDAH. Los principales manuales establecen una serie de criterios para poder establecer un diagnóstico preciso, que incluye un análisis exhaustivo del entorno del niño. Sin embargo, las primeras valoraciones se hacen a través de los testimonios de terceras personas, especialmente padres y profesores, lo que, según los expertos , cuestiona la fiabilidad diagnóstica de esos criterios. Esto puede llevar a que haya muchos niños que son diagnosticados con TDAH en cuanto tienen algún tipo de problema.

TDAH y Datos Abiertos

Open Data es una filosofía que tiene por objetivo poner a disposición de la sociedad los datos que gestiona la administración pública en formatos fáciles de manipular.

Cualquier ciudadano o empresa puede analizar, reutilizar y redistribuir estos datos, generando nuevos servicios y permitiendo que la administración pública mejore en transparencia (gobierno abierto) y fomente la generación de riqueza a través de la gestión inteligente de los recursos (gobierno inteligente).

El objetivo es que ciudadanos y empresas puedan reaprovechar estos datos para generar valor económico. Podrán construir sobre ellos una nueva idea que genere nuevos datos, conocimientos o incluso la creación de nuevos servicios que reporten beneficios económicos y/o sociales.

Ante esta realidad hemos decidido hacer una aproximación a la enfermedad del TDAH utilizando los datos abiertos del Observatori del Sistema de  Salut de Catalunya para analizar su impacto en esta comunidad e intentar encontrar indicios que expliquen la controversia en torno al diagnostico y tratamiento de esta enfermedad genera en amplios sectores.

Para nuestro análisis vamos a utilizar los siguientes fuentes de datos :

  • Los datos de los indicadores socioeconómicos por área básica de salud, estandarizados por edad ( valor de referencia =1 ) del año 2015.

  • El indicador de prescripción farmacéutica por área básica de salut_2015 que recoge el consumo de fármacos de TDAH en porcentaje para la población de 6 a 17 años.

Los indicadores socioeconómicos que vamos a utilizar para nuestro estudio son :

Población exenta de copago farmacéutico, población con rentas inferiores a 18.000€, población con rentas superiores a 100.000€, población con ocupaciones manuales, población con un nivel de formación insuficiente y la tasa de mortalidad prematura para cada una de las áreas básicas de salud (369).

El indicador de prescripción farmacéutica de TDAH lo utilizaremos como “proxy” para         estimar si hay áreas básicas con mayor o menor porcentaje de prescripción farmacéutica, y por tanto de diagnostico de TDAH, siendo el valor medio del indicador para todo el conjunto de áreas 2,5.

Para nuestro análisis partiremos una vez agregados los diferentes indicadores de una tabla como la siguiente:

 

Nuestro objetivo es descubrir patrones en este conjunto de datos que nos permitan observar si la detección del TDAH en Catalunya sigue patrones homogéneos en todos los centros de salud o esta influenciada por factores socioeconómicos, para ello vamos a utilizar algoritmos de aprendizaje automático ( Machine Learning).

Dentro de los posibles algoritmos disponibles utilizaremos el de K-means (Clustering).  Este es un método de agrupamiento, que tiene como objetivo la partición de un conjunto de n observaciones en k grupos en el que cada observación pertenece al grupo cuyo valor medio es más cercano.

Los puntos centrales de estos clusters, llamados centroid, nos dan las características medias del grupo. El usuario puede etiquetar opcionalmente cada clúster con un nombre descriptivo basado en las características del centroid.

En nuestro experimento vamos a partir de las 369 observaciones de la tabla 1 y las vamos que vamos agrupar en 8 grupos o clusters.

Dado el gran volumen de observaciones procedemos a presentar una primera tabla agrupando por región sanitaria   cada uno de las áreas básicas de salud y cluster asociado. Podemos observar que no todas las regiones sanitarias están representadas en todos los cluster, lo que es un primer indicio de que el diagnostico / detección del TDAH no es homogéneo en todo el territorio.

 

                                                                                  Tabla 1

 

A continuación en la tabla 2 vemos los puntos centrales de cada cluster , llamados centroid, que nos dan la característica media del grupo

                                                                                  Tabla 2

 

De la observación de los mismos podemos agruparlos en ;

                                                        Alta Prescripción TDAH : cluster 1, cluster 2, cluster 6

                                                        Baja Prescripción TDAH : cluster 0, cluster 3, cluster 4, cluster 5, cluster 7

 

Veamos una muestra de algunas de las Áreas Básicas de Salud que integran cada cluster:

Análisis y Conclusiones

De los resultados obtenidos vemos que los clusters que presentan un alto índice de TDAH se caracterizan por :

  • Proximidad geográfica de las áreas de salud que los integran.

Engloban áreas básicas de salud que geográficamente están muy próximas, siendo especialmente destacable este hecho en el cluster 6 ( Valles occidental Oest y Valles Occidental Est) con un índice de TDHA del 6,35 frente a una media global del 2,5, y los  cluster 2 (Barcelona Esquerra) índice 3,23 y cluster 4 ( Valles occidental Oest, Valles occidental Est, y Osona) con un incide 4.

  • Niveles Socioeconómicos similares

Las variables socioeconómicas del área básica de salud parece que tienen una incidencia en el porcentaje de población diagnosticada/ medicada por TDAH. A menores niveles de renta del área de salud menores son los índices de TDAH ( cluster 0 y cluster 7) presentando además una gran dispersión territorial. Las áreas de salud con un mayor nivel de renta ( clusters 2 y 3) presentan niveles de TDAH muy superiores a la media. Las áreas de salud con un nivel de renta medio (clusters 4 y 5) presentan un nivel de TDAH medio y gran dispersión territorial, salvo los clusters 1 y 6 que presenta un nivel de TDAH alto y una fuerte concentración territorial.

Del análisis de los datos se desprende, sin que esto se pueda considerar una evidencia científica, que el diagnostico / tratamiento del TDAH en Catalunya esta fuertemente condicionados por el nivel de renta ( nivel mas alto implican niveles de tratamiento de TDAH mas altos) hecho que se puede deber a una mayor concienciación de las familias y escuelas de este estrato social ante comportamientos de los niños asociados al TDAH y a la búsqueda de especialistas privados para su diagnostico.

La componente geográfica que hace que unas pocas  áreas de salud, con un alto grado de concentración  geográfica, tengan asociadas altos índices de TDAH, es mas compleja de valorar  con los datos disponibles. Sin embargo creemos de interés el estudio del cluster 6, dado su alto grado de anomalía respecto al resto en este aspecto.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *