Big Data, ¿Big Pharma?
Javier García Correas. Abogado. Alumno del Máster en Derecho de la Salud CESIF-Eupharlaw.
Si algo distingue al sector de la industria farmacéutica es su capacidad para investigar e innovar continuamente, aplicando todas las nuevas tecnologías y los medios más punteros en aras de conseguir el mayor beneficio para la salud del paciente. Recientemente se ha generado mucha expectación en torno a las aplicaciones que puede tener el llamado Big Data en la industria farmacéutica y en la investigación en general. Por ello, para valorar el punto de desarrollo en que nos encontramos, queremos analizar en estas líneas diversos aspectos del Big Data, the Next Big Thing en el sector farmacéutico.
Conceptos previos a tener en cuenta…
¿Qué es el Big Data? Son cantidades ingentes de información obtenida a través de los nuevos medios electrónicos (dispositivos móviles, los navegadores web convencionales y desde hace poco tiempo de los wearables) sólo por el mero uso. Se almacenan datos inconexos y completamente heterogéneos, con una veracidad a menudo aproximada, a partir de los cuales la ingeniería algorítmica obtendrá información nueva, útil y relevante. Para analizar datos de esta naturaleza, incluso para volúmenes no muy grandes de datos hace falta un análisis profundo que permita obtener algo de información útil. Es por ello que se llama “Minería de Datos” al desarrollo de algoritmos a medida (de búsqueda, probabilísticos, heurísticos…) para dar solución a estos problemas de gran complejidad computacional.
Son las características de los datos almacenados y la dificultad de analizarlos y obtener resultados útiles las que los convierten en Big Data, pero no el tamaño de la muestra de datos, por lo que es tan Big Data el que maneja Google como una base de datos de un Terabyte para una empresa pequeña sin medios suficientes.
¿Qué garantizan los resultados obtenidos a partir de Big Data? La principal característica es que los algoritmos nos van a facilitar datos nuevos y de gran valor respecto de la información analizada. Es un análisis complejo aplicado a la naturaleza de los datos, aprendiendo de ellos, y dándonos datos nuevos y fiables como conclusiones. Todo ello en tiempo real y sobre una base de datos cambiante.
¿Sustituirán al humano investigador? La respuesta es claramente no, puesto que hace falta conocimiento humano para contextualizar y poder dar la aplicación e interpretación correctas a los datos obtenidos. Es una forma de inteligencia artificial aún muy inmadura, capaz de discernir y distinguir, y de procesar volúmenes ingentes de datos, pero no de razonar como un científico. Es un complemento perfecto para la capacidad del investigador, para acotar las investigaciones de campo, reducir costes y acelerar procesos.
Las aplicaciones del Big Data a la investigación en la industria farmacéutica
La principal aplicación: Desarrollar terapias personalizadas basadas en el genoma de cada paciente. Con las técnicas anteriormente descritas se puede buscar qué moléculas de las que tenemos interactúan mejor con el paciente en función de su genoma, y sobre todo en Oncología ya se está trabajando en esta dirección. Tenemos el genoma de cada vez más tipos de tumores, por lo que en el futuro próximo se podrán desarrollar fármacos personalizados y dirigidos a erradicar un tipo de tumor específico que tenga el paciente concreto. Aquí el Big Data jugará un papel fundamental para los investigadores, apuntando a las moléculas con más posibilidad de éxito en el tratamiento una vez analizados, desde la genómica, tumor y paciente.
Ya hay grandes esfuerzos en marcha en este sentido, como el programa recientemente anunciado por Barak Obama (Precision Medicine Initiative) para analizar los datos –incluido el genoma – de un millón de voluntarios en Estados Unidos, con la participación del Instituto Nacional del Cáncer norteamericano que analizará los posibles orígenes genéticos de distintos tipos de cáncer. En España hay grandes expertos mundiales como el profesor Carlos López-Otín, catedrático de Bioquímica y Biología Molecular, que trabaja desde 2008 en el Consorcio Internacional del Genoma del Cáncer (ICGC) con la Universidad de Oviedo, para descifrar el genoma de 500 tumores de pacientes con los cánceres más habituales.
Estudios clínicos que aprovecharán el Big Data obtenido de dispositivos wearables: Real World Data. Tras los ensayos pre-autorización, los datos obtenidos por este tipo de ensayos controlados podrán ser contrastados con los obtenidos mediante registro de la actividad habitual del paciente, o real world data. Recientemente la patronal británica de la industria farmacéutica, ABPI, ha propuesto un nuevo modelo de ensayo clínico en el que estos real world data obtenidos directamente de la vida cotidiana de muchos más pacientes tienen una gran relevancia. La recogida paralela y sistemática de los real world data facilitará la introducción temprana de los medicamentos, con lo que el análisis del Big Data será un complemento ideal a la investigación más tradicional.
La utilización de los real world data será de gran utilidad (más a corto plazo) para los laboratorios en los estudios post-autorización, permitiendo comprobar infinidad de datos importantes como la adherencia a tratamientos, los efectos en la vida cotidiana del paciente mediante medidas en tiempo real de constantes vitales, o incluso la interacción del fármaco con la dieta y otros hábitos sociales. Se trata de proporcionar muchos más datos de muchos más pacientes (frente a los obtenidos del 4% que participan en los ensayos clínicos).
Problemas actuales en la utilización de los datos obtenidos del Big Data
Problemas relativos a la información obtenida. La ausencia de estándares o protocolos comunes a la hora de analizar y sistematizar la información obtenida, junto al hecho de que no se compartan los resultados obtenidos en la mayoría de los casos, nos lleva a que lejos de ser un movimiento global estemos ante un panorama de islas aisladas de investigación avanzada. No obstante, proyectos como el Cancer Core Europe en el que seis hospitales públicos de Europa comparten datos anónimos de más de 60.000 pacientes, 1.500 ensayos clínicos, más de 1.000.000 de visitas y más de 300.000 tratamientos pautados, junto a otros esfuerzos privados, auguran una explosión de resultados en las próximas dos décadas.
Dificultad para encontrar dianas terapéuticas. Incluso aplicando las soluciones más avanzadas de Minería de Datos, en la investigación de fármacos (especialmente los biológicos) uno más uno no siempre es dos. Podemos obtener una gran cantidad de moléculas en las que centrar nuestra investigación por ser las más potencialmente útiles para el tratamiento que buscamos desarrollar, y que todas ellas sean inservibles. Es decir, una cosa es que nos den los datos más fiables y nos acoten el campo de búsqueda, y otra muy distinta que el análisis de Big Data arroje a día de hoy dianas terapéuticas con mayor facilidad.
Privacidad y Protección de Datos: son datos anonimizados, pero claramente trazables. Si bien son datos obtenidos de distintas fuentes y con los consentimientos aplicables en cada caso, o incluso obtenidos de forma anónima, al analizarlos de forma agregada en bases de datos pueden dejar de ser anónimos.
Por ejemplo; un usuario tiene tres aplicaciones para diversos usos pero desarrolladas por la misma compañía, y consiente por separado en cada una que los datos serán recogidos y empleados por esta empresa. Aplicando ingeniería algorítmica llegamos a la conclusión de que esta persona por sus hábitos sedentarios (horas sentado usando Internet, horas de sueño medidas por la inactividad…), sus hábitos de alimentación y de vida (tipos de restaurantes y gustos alimentarios expresados por búsquedas cruzadas en navegadores…) y por condiciones físicas (peso y altura facilitados a la aplicación, ritmo cardiaco medido, actividad registrada…), tiene un alto riesgo de sufrir un episodio cardiovascular y debe tener el colesterol alto. La empresa lo incluye en una base de datos que vende a un laboratorio sin informar al usuario, que recibe poco después un email publicitario sobre un fármaco novedoso que le ayudará a reducir el colesterol.
En conclusión, cuando hablamos de Big Data estamos ante el futuro del desarrollo de fármacos personalizados y de grandes avances en nuestros conocimientos sobre distintas enfermedades. El ahorro en costes y en tiempo sin duda incentivará la innovación, y todo ello redundará en un aumento en la calidad y la eficacia de los tratamientos, y por ende en los niveles de Salud de la población. Pero las monedas siempre tienen dos caras, por lo que deben garantizarse nuestros derechos. El camino está marcado, ya sólo hay que seguir sumando esfuerzos.
[:]