OK, espera, aunque es en gran parte cierto, la mayor parte de lo que Jos Polfliet sugiere podría hacerse con datos de reclamos administrativos (diagnósticos, pedidos, identificación del beneficiario, identificador (es) del proveedor, prescripciones). Otras partes requerirían fusionarse con otros datos, por ejemplo, resultados informados por el paciente.
Creo que hay dos cuestiones distintas: una es la dificultad organizativa que conlleva acceder a los datos protegidos por HIPAA e individualmente identificables sobre salud y atención médica como Asociado Comercial; el otro es la dificultad técnica para extraer información útil de los EHR. El primero lo menciona Marcas Neal en su respuesta, el segundo que abordaré a continuación.
Lo que es único acerca de los registros médicos, y por lo tanto EHR, se encuentra en las notas de texto libre: signos y síntomas que presenta el paciente, cómo el médico piensa sobre la afección, antecedentes familiares y similares, y consulta información (informes radiológicos y películas, notas de referencia) e información contextual sobre el paciente que se captura (trabajo, estrés de vida, etc.). Además, hay datos clínicos estructurados (TA, altura / peso, resultados de pruebas y procedimientos de laboratorio) y podría haber algunos resultados limitados informados por el paciente (escala de dolor, resultados de instrumentos de evaluación como Actividades de la vida diaria). Lo más divertido de todo, cada proveedor de EHR y / o instalación estructurará estos elementos de datos de manera diferente, los llamará cosas diferentes, tendrá vocabularios restringidos o no, etc.
Entonces, el problema de extraer texto relativamente no estructurado para el significado semántico es que nuestras herramientas no son tan buenas en esto todavía, en ningún dominio. Debe separar las menciones positivas de las negativas (el paciente tiene / no tiene), las descripciones del problema actual y los síntomas del pasado o de los miembros de la familia, las drogas recetadas frente a las drogas a las que el paciente es alérgico, etc. ¿Qué herramientas tiene? necesidad de esto? La pregunta aquí es la misma que en toda la minería de datos: ¿cuáles son las compensaciones en precisión, tiempo, volumen, etc. que está dispuesto a hacer?
Jung et al (2014), la evaluación funcional de herramientas de extracción de texto listas para usar para tareas de minería de datos, por ejemplo, usan una herramienta de minería de textos lista para usar y encuentran
Creemos que es posible utilizar métodos simples, más rápidos y basados en el diccionario que se adaptan bien a conjuntos de datos muy grandes, intercambiando la comprensión lingüística profunda por la eficiencia computacional. Cuando se utilizan conjuntos de datos muy grandes, los avances en los algoritmos pueden ser menos importantes que el uso de conjuntos de datos más grandes y completos
TI de atención médica: ¿Por qué tan pocos médicos actualizan sus perfiles en HealthGrades y Vitals?
Cómo calcular la frecuencia cardíaca a partir de los datos del sensor de ECG emitidos en milivoltios
¿Hay algo así como tecnología “libre de errores”?
¿Es posible detectar si una mujer es madre por su foto o incluso solo por retrato?
Pero, por supuesto, dependiendo del problema en cuestión, mmm. Por ahora, el enorme potencial en los datos de EHR permanece en gran medida sin explotar. Hay muchas imágenes de métodos y enfoques potenciales para extraer EHR a escala, pero hasta ahora los resultados son bastante escasos.
Si estás interesado, quizás quieras echar un vistazo a:
- “Big Data” y el registro electrónico de salud
- http://dmkd.cs.wayne.edu/TUTORIA…
- Configurar sus datos EHR gratis para análisis clínicos