¿Cuáles son las aplicaciones de la ciencia de datos y el aprendizaje automático en la industria farmacéutica?

La siguiente es una lista de los proyectos, con los que estoy familiarizado, que han aplicado Algoritmos de Aprendizaje Automático. Algunos de ellos (marcados con *) aún no se han implementado:

  • Análisis estadístico de co-ocurrencia de medicamentos en prescripciones: el algoritmo de agrupación rápida desplegable se utilizó para crear grupos de medicamentos (como se visualiza arriba) que ocurren con frecuencia juntos en Prescripciones. Aquí cada grupo generalmente corresponde a diabetes, artritis, trastornos cardiovasculares, nutricionales o neurológicos.
  • Clasificación de documentos utilizando SVM: las consultas de los pacientes, en forma de correos electrónicos se clasificaron en función de la especialización que requiere un médico para poder responderlas. Tf-idf (frecuencia de frecuencia de documento inverso a frecuencia) y derivación se realizaron en datos anotados manualmente que se alimentaron al clasificador de texto basado en Support Vector Machines.
  • Reconocimiento óptico de caracteres para la digitalización de recetas escritas a mano: la tarea de reconocimiento de escritura cursiva se transformó de una tarea de reconocimiento fuera de línea a en línea (Recuperación de trazos), utilizando el operador morfológico de adelgazamiento en la imagen y luego obteniendo una ruta de rastreo ejecutando una primera búsqueda de profundidad Heurística en la imagen resultante. Esta ruta fue luego enviada a la API de reconocimiento de escritura de Google. Los modelos de Markov se utilizaron para mejorar el rendimiento mediante el uso de datos sobre la concurrencia de medicamentos. (Demostración simple presentada a continuación)

  • Identificación de enfermedad del paciente *: Procesamiento de transacciones médicas, resultados de pruebas de laboratorio y datos de citas médicas de usuarios individuales para identificar los trastornos / enfermedades que podrían sufrir. Debido a la falta de datos anotados, planeamos usar algoritmos de Agrupamiento no supervisados ​​(como K-Means) para agrupar a los pacientes con afecciones similares.
  • Extracción de información sobre medicamentos *: extracción de información estructurada de blobs de texto no estructurados. Esto involucraría algoritmos NER (Reconocimiento de entidad nombrada) como Max-Entropy Markov Models (MEMM) y Condition Random Fields (CRF) así como también algoritmos de IE (Information Extraction) como Bootstrapping (para aprender reglas para patrones).

Machine Learning y Data Science in Pharma sigue siendo un campo en evolución. Grandes empresas como Pfizer han empleado Machine Learning durante muchos años, como lo demuestra el trabajo realizado por Max Kuhn, que desarrolló el caret, posiblemente el paquete de Aprendizaje Automático más versátil en R. Sin embargo, tales esfuerzos se limitaron principalmente a grupos como I + D y Estudios Clínicos En los últimos tiempos, los departamentos que se enfrentan a médicos / clientes, como Market Research o Market Access, también han comenzado a aplicar el aprendizaje automático de forma creativa.

Como tal, no hay escasez de casos de uso de Aprendizaje automático en Pharma, pero las empresas pueden no estar dispuestas o no a tales técnicas, en parte debido a la falta de familiaridad con el campo pero predominantemente porque no se pueden cuantificar los resultados finales y los beneficios comerciales. En otras palabras, a menos que el proyecto Pharma Machine Learning pueda articular claramente lo que la empresa representa para beneficiarse en términos mensurables concretos, es difícil obtener tracción con tales propuestas.

En todos los casos en que (en nuestra empresa, RxDataScience) proporcionamos servicios de consultoría en ML a Pharma, la iniciativa siempre tuvo un fuerte patrocinador interno (cliente) que entendió Machine Learning y estaba dispuesto a probar un nuevo enfoque. Aunque no podemos divulgar muchos de los casos de uso (quizás más interesantes) ya que implican trabajo del cliente, he proporcionado algunos a continuación para referencia. Con un poco de suerte, pueden arrojar algo de luz sobre las diversas áreas en las que puede usar AI y / o ML para productos farmacéuticos y, en general, casos de uso de atención médica.

PREVENIR LA PROPAGACIÓN DE ENFERMEDADES

Uso de clustering y otras técnicas de aprendizaje automático en los datos de redes sociales, artículos de noticias, etc. para detectar brotes

Otras lecturas

El algoritmo detectó un brote de ébola antes de las alertas oficiales

COMPATIBILIDAD PACIENTE-DOCTOR

Machine Learning para ayudar a los pacientes a encontrar los médicos adecuados (dentro de la red o fuera de la red), comprender los costos y otros factores relevantes

Otras lecturas

Hacer sentido de las tarjetas de seguro con Deep Learning

DETECCIÓN DEL FRAUDE DEL SEGURO MÉDICO

El fraude en el seguro de salud puede costarle a los pagadores miles de millones de dólares en ingresos. La detección de fraude es un campo bien establecido de Machine Learning, especialmente en finanzas. y se puede usar para detectar casos de fraude de seguro de salud

Otras lecturas

Un enfoque de detección de fraude con extracción de datos en el seguro de salud

Uso de Minería de Datos para Detectar Fraudes y Abusos en la Atención Médica

Análisis comparativo de técnicas de aprendizaje automático para reclamos de seguros – Wipro

EMPAREJAMIENTO DEL MÉDICO

Usar técnicas de desambiguación de datos para correlacionar los registros de médicos y pacientes de conjuntos de datos dispares. Por ejemplo, si el proveedor 1 tenía registros del médico A y el vendedor 2 también tenía registros en el médico A pero utilizaba diferentes identificaciones, puede ser posible vincular los registros usando técnicas de desambiguación de datos. Dichos métodos se utilizan a menudo para vincular fuentes de datos dispares y enriquecer los conjuntos de datos existentes

La misma teoría / algoritmo también se puede aplicar a Patient Matching

Otras lecturas

Estrategias de integridad de datos para emparejamiento de pacientes, identificación

Identificación del paciente y concordancia

MENSAJERÍA DE CAMPAÑA DE VENTAS

El uso de NLP en las notas de llamada y la combinación de los datos con los registros de médicos Rx para comprender los mensajes clave que pueden conducir a aumentar / disminuir en Rx.

Otras lecturas

Aprendizaje automático avanzado para impulsar la participación de los representantes

ANÁLISIS DE ATRIBUTO DEL BIOMARCADOR

Use técnicas de agrupación para identificar la importancia de los biomarcadores. Aplicaciones diversas: desde la identificación del médico (en una prueba, el 20% de los médicos pasaron de un nivel más bajo a un nivel superior según las pruebas ALK, la identificación de los sitios de estudio clínico óptimos según los datos de laboratorio locales, etc.)

Otras lecturas

[Paywall] Aprendizaje automático para la identificación de biomarcadores en la investigación del cáncer: avances hacia su aplicación clínica

ANÁLISIS DE SEÑALES

El uso de registros EEG de datos pre-ictal, ictal e inter-ictal (sin ataques) para predecir las convulsiones antes de que ocurran.

Otras lecturas

Desafío de Predicción de Ataques de la Sociedad Americana de la Epilepsia

NUEVOS MÉTODOS DE ALIGMENTACIÓN DE TERRITORIO

Optimización y reducción de la superposición de territorio con datos sobre ubicaciones de territorio de representante y distancia recorrida mediante programación lineal y API de Google (Problema de vendedor ambulante)

IDENTIFICACIÓN DE LA NO ADHERENCIA DE MEDICAMENTOS

Comprender los factores de incumplimiento de la medicación del paciente.

Otras lecturas

pagador de servicios de salud para ahorrar $ 5 millones por incumplimiento de la medicación

LLEGAR A MÉDICOS NO VENIDOS

Usando Network Analysis para encontrar médicos conectados a médicos que no ven a fin de comercializar drogas indirectamente.

Otras lecturas

Gráfico de afinidad del médico

PATENTES

Uso de Mapas autoorganizados / Reducción de dimensionalidad para encontrar patentes similares (Litigios, ANDA, etc.)

Otras lecturas

Un sistema de análisis y clasificación de calidad de patentes que utiliza mapas autoorganizados con máquina de vectores de soporte

IMAGENES MEDICAS

Uso del reconocimiento de imágenes para identificar células malignas / segmentación celular (caso de uso muy común de ML en la atención médica)

Otras lecturas

https://www.ncbi.nlm.nih.gov/pmc

Kaggle: CT Medical Image Analysis

Kaggle: Segmentación del nervio de ultrasonido

Resúmenes rápidos sobre algunos proyectos que conozco:

Explotando la Web Social

1. Descubrir los efectos secundarios positivos de un medicamento
Se encuentra que muchos medicamentos producen efectos secundarios que no fueron probados. Las personas que usan esas drogas tienden a compartir su experiencia en los foros en línea y las redes sociales. Los efectos secundarios más comunes incluyen pérdida de peso, programa de sueño regulado (o esperado por el usuario) o efectos psicológicos.

2. Aceptación pública de drogas comerciales
Estos foros se pueden explotar nuevamente para rastrear el uso, la popularidad y los desafíos en el mercado de las drogas, especialmente cuando los competidores también fabrican y comercializan los mismos medicamentos.

Cooperación mutua y colaboración

3. Asociaciones y colaboraciones
Varios investigadores y fabricantes de medicamentos se están asociando con empresas de administración de datos como SAS para crear una nube privada accesible a nivel mundial donde la industria farmacéutica puede colaborar de forma segura en torno a la información de ensayos clínicos anónimos.

4. Goldmine para profesionales de la salud
Los médicos, pacientes y agentes de seguros pueden aprovechar buenos recursos para mejorar la eficiencia. Los colaboradores académicos pueden compartir ideas de los últimos avances científicos y poner a disposición de todos una gran cantidad de innovaciones externas.

Pruebas y pruebas de drogas

5. Modelado Predictivo
Hay grupos de investigación que aprovechan los repositorios de datos moleculares y clínicos que pueden ayudar a identificar nuevas fórmulas de fármacos candidatas potenciales. Los datos anteriores sobre interacciones y efectos se pueden utilizar para reducir el número de pruebas.

6. Pruebas más seguras
Los ensayos se controlan en tiempo real para identificar rápidamente señales operativas o de seguridad que requieren acción para evitar problemas importantes y potencialmente costosos, como eventos adversos y demoras innecesarias.

Tratamiento para el cáncer :
A través del estudio del cuerpo humano hasta el nivel del genoma puede predecir qué camino tomará el cáncer (se requeriría una gran recopilación de datos), pero creo que ya hay muchas nuevas empresas en eso.

Identificación de la enfermedad:
Los HMM se han utilizado en el pasado para identificar la enfermedad dados los síntomas

Predicción Epidémica
Al analizar las búsquedas / publicaciones en redes sociales / visitas en aplicaciones o sitios web, puede predecir si existe la posibilidad de un brote epidémico y en qué región se va a proceder

Pruebas controladas
Las pruebas A / B se han usado para ganar más confianza en el efecto de un medicamento recientemente desarrollado en los pacientes

Para ejemplificar algunas aplicaciones:

1- Puede estimar la tasa de reproducción básica (R0) y verificar si va a ser rentable desarrollar una vacuna en un área epidémica;

2- Puede establecer el área de interés usando datos espacio-temporales;

3- Puede modelar el comportamiento aleatorio de las personas enfermas para comprender los parámetros que rigen la enfermedad;

4- Incluso puede calcular estocásticamente la composición de un medicamento por sus características, cuando hacerlo analíticamente es computacionalmente imposible.

Hay mucho más que hacer, el comportamiento de la medicina y las enfermedades se rigen de forma aleatoria y la ciencia de los datos es muy importante para ayudar a la producción de productos seguros y rentables.

Este es un buen artículo de McKinsey que explica cómo la ciencia de los datos puede desempeñar un papel importante en la industria farmacéutica.

Cómo los grandes datos pueden revolucionar la I + D farmacéutica

Imagínese (confidencialmente, por supuesto) leer todas las partes de los registros y todos los días comparando el contenido de las publicaciones de los pacientes con todas las otras salas asociadas. Al hacer esto de forma automatizada, el personal local puede recibir ayuda para detectar patrones de enfermedad que pueden ser de vital importancia. Un ejemplo:

Un sistema que es sensible a la presencia de varios microorganismos que pueden mencionarse en las revistas también podrá detectar infecciones nosocomiales.

En la actualidad, la inteligencia de la máquina puede ser demasiado directa para este trabajo, pero hay otros enfoques, por ejemplo. soluciones de cola larga basadas en topologías de terminología relevante, curada por humanos.

Solicitud:

  1. Estos se usan para el tratamiento de enfermedades. Puede encontrar fácilmente enfermedades en el cuerpo humano y luego puede comenzar el tratamiento.
  2. con estos puedes estudiar el cuerpo humano y encontrar el cáncer en un cuerpo. también puede usar para el tratamiento del cáncer.
  3. Predicción de epidemias. Analice las búsquedas, Publique en las redes sociales.
  4. Detección de eficacia del fármaco

Gracias.

Ayudará en el estudio de mercado, el poder de fijación de precios, la demanda y la composición de la formulación. También puede ayudar en la eficiencia de la distribución.