¿Cómo se podría usar la ciencia de datos en registros médicos electrónicos?

OK, espera, aunque es en gran parte cierto, la mayor parte de lo que Jos Polfliet sugiere podría hacerse con datos de reclamos administrativos (diagnósticos, pedidos, identificación del beneficiario, identificador (es) del proveedor, prescripciones). Otras partes requerirían fusionarse con otros datos, por ejemplo, resultados informados por el paciente.

Creo que hay dos cuestiones distintas: una es la dificultad organizativa que conlleva acceder a los datos protegidos por HIPAA e individualmente identificables sobre salud y atención médica como Asociado Comercial; el otro es la dificultad técnica para extraer información útil de los EHR. El primero lo menciona Marcas Neal en su respuesta, el segundo que abordaré a continuación.

Lo que es único acerca de los registros médicos, y por lo tanto EHR, se encuentra en las notas de texto libre: signos y síntomas que presenta el paciente, cómo el médico piensa sobre la afección, antecedentes familiares y similares, y consulta información (informes radiológicos y películas, notas de referencia) e información contextual sobre el paciente que se captura (trabajo, estrés de vida, etc.). Además, hay datos clínicos estructurados (TA, altura / peso, resultados de pruebas y procedimientos de laboratorio) y podría haber algunos resultados limitados informados por el paciente (escala de dolor, resultados de instrumentos de evaluación como Actividades de la vida diaria). Lo más divertido de todo, cada proveedor de EHR y / o instalación estructurará estos elementos de datos de manera diferente, los llamará cosas diferentes, tendrá vocabularios restringidos o no, etc.

Entonces, el problema de extraer texto relativamente no estructurado para el significado semántico es que nuestras herramientas no son tan buenas en esto todavía, en ningún dominio. Debe separar las menciones positivas de las negativas (el paciente tiene / no tiene), las descripciones del problema actual y los síntomas del pasado o de los miembros de la familia, las drogas recetadas frente a las drogas a las que el paciente es alérgico, etc. ¿Qué herramientas tiene? necesidad de esto? La pregunta aquí es la misma que en toda la minería de datos: ¿cuáles son las compensaciones en precisión, tiempo, volumen, etc. que está dispuesto a hacer?

Jung et al (2014), la evaluación funcional de herramientas de extracción de texto listas para usar para tareas de minería de datos, por ejemplo, usan una herramienta de minería de textos lista para usar y encuentran

Creemos que es posible utilizar métodos simples, más rápidos y basados ​​en el diccionario que se adaptan bien a conjuntos de datos muy grandes, intercambiando la comprensión lingüística profunda por la eficiencia computacional. Cuando se utilizan conjuntos de datos muy grandes, los avances en los algoritmos pueden ser menos importantes que el uso de conjuntos de datos más grandes y completos

Pero, por supuesto, dependiendo del problema en cuestión, mmm. Por ahora, el enorme potencial en los datos de EHR permanece en gran medida sin explotar. Hay muchas imágenes de métodos y enfoques potenciales para extraer EHR a escala, pero hasta ahora los resultados son bastante escasos.

Si estás interesado, quizás quieras echar un vistazo a:

  • “Big Data” y el registro electrónico de salud
  • http://dmkd.cs.wayne.edu/TUTORIA…
  • Configurar sus datos EHR gratis para análisis clínicos

Oh, los registros médicos de los niños deben ser una mina de oro absoluta, no por eso, porque son muy sensibles a la privacidad y, por lo tanto, es muy difícil tenerlos en tus manos. No tengo experiencia en ellos pero puedo pensar inmediatamente en algunas cosas que me gustaría probar:

  • ¿Qué médico / clínica / hospital es el mejor en mi vecindario? ¿Cuál es el mejor en general?
  • ¿Conoces todos estos senderos aleatorios que incluyen 32 personas para probar que un medicamento funciona? Eso es lindo, ahora haga un estudio observacional con 200 mil personas (o cualquiera que sea su población) y vea cuál es el efecto real estimado de un medicamento
  • ¿Hay valores atípicos en los datos? ¿Por qué?
  • ¿Es el medicamento X caro realmente mejor que el medicamento genérico Y?
  • Punto de consumo excesivo médico
  • Correlacione la mierda de las estadísticas de mortalidad con los barrios y la política local. ¿Tasa de mortalidad local doble en un radio de 5 millas de un incinerador de basura local? ¡Que comiencen los escándalos!
  • Trazar patrones de propagación de enfermedades a lo largo del tiempo y en ubicaciones
  • Publique el efecto real estimado de los medicamentos farmacéuticos en las enfermedades. Deje que los escándalos continúen!
  • ¿Qué enfermedades están sobrefinanciadas, que están subfinanciadas? (Modele la tasa de incidencia, la población, las becas de investigación)
  • Entrena un modelo de supervivencia. Publique el código de puntaje en un sitio web donde puede ingresar sus propias covariables, datos demográficos, etc. para obtener una gráfica de probabilidad de supervivencia personalizada con algunas estadísticas geniales.

¡Diviértete y sigue explorando!

Debido a HIPAA, no podrá usar ciencia de datos mucho en EMR. Usted * PODÍA * obtener datos no identificados de los EMR para ayudar en el análisis estadístico, pero es poco probable que obtenga el nivel de acceso necesario para hacer las cosas que Jos Polfliet menciona en su respuesta.

Casi todos los datos que obtendrá provienen de otras fuentes no identificadas, como las aseguradoras y CMMS (Centros de Servicios de Medicare y Medicaid).

Incluso aquí, la investigación realizada por personas como Daniel Barth-Jones (Twitter) muestra que a menudo es imposible desidentificar lo suficiente para garantizar la usabilidad, porque a menudo, los datos y las reglas son intrincados.

Por ejemplo, cuando mi empresa intentó estimar el nuevo método de pago combinado basado en datos de CMMS, descubrimos que era imposible. Esta es una de las razones por las que el congreso simplemente entregó el proyecto completo a los fabricantes de Mathimatica como una caja negra completa.

Para identificar tendencias, las relaciones ayudan a los proveedores a ser más proactivos en la atención de sus pacientes.