¿Cómo se extrae la información significativa de los registros médicos?

Ooh, ¿puedo elegir esto? Tres respuestas glib inmediatamente me vienen a la mente:

  1. Con dificultad;
  2. De manera cuidadosa;
  3. GIGO.

La respuesta larga podría llenar un libro. Aww diablos, demos una oportunidad. Hay algunos problemas:

En primer lugar, existe una opinión prevalente de los datos médicos de que de alguna manera son confiables y autoorganizados: “Deje que los datos hablen”. * Si solo acumulamos suficientes datos, podemos llegar casi mágicamente a las conclusiones correctas sobre las afecciones médicas. encuentre tratamientos innovadores, y básicamente haga todo menos hablarle a Dios. (Quizás incluso eso también).

En realidad, las cosas son un poco más complicadas. Considere un nivel de sodio sérico (sal) que obtiene de un laboratorio. Digamos que es bastante alto, a “155 mmol / L”. Efectivamente, esto significa que el laboratorio ha realizado algunas pruebas de control de calidad serias, y podrá asegurarle que, al menos el 95% del tiempo, el sodio está en el rango de (digamos) 150-160 mm0l / L, adecuado para la toma de decisiones clínicas. (Si nos fijamos en cuán difícil es el análisis incluso para algo tan ‘simple’, los datos que obtenemos son bastante buenos).

Pero muchos, posiblemente la mayoría de los datos médicos no se originan en un laboratorio y están mal calibrados o incluso no calibrados . No solo existe un gran componente aleatorio de los datos (que se puede minimizar acumulando más y más datos), sino que aún peor, a menudo hay un sesgo .

Un buen ejemplo de una medición fuera del laboratorio es ir a su médico de familia y obtener su presión arterial (BP). Hay muchos factores que afectarán la confiabilidad de esa presión: no permitirle sentarse y relajarse en una silla de respaldo recto en un área silenciosa durante cinco minutos antes de que se le presione, uso de un manguito de tamaño incorrecto, que tome la medición, qué tan bien entrenados están, etc. Pero también está la calibración de la máquina BP (esfigmomanómetro o ‘sphyg’).

Debería haber una cadena ininterrumpida de calibración desde el estándar de referencia para presión, a un estándar de referencia nacional, a un estándar de referencia regional, a una referencia local que (esperamos) se usó recientemente para calibrar el esfigma en el consultorio de su médico. En cada paso de la cadena, podemos saber cuánta variación se introduce, y también, esto es importante, si la máquina utilizada para medir la presión sanguínea era parcial en comparación con la norma.

En su próxima visita, puede preguntarle a su médico cuándo se calibró por última vez su esfigma.

Piensa sobre esto. Si su presión arterial promedio (‘usual’) es 144/92, entonces (en base a todos los factores aleatorios mencionados anteriormente, y la variación natural en su PA de una visita a otra) la presión arterial en una visita puede ser, por ejemplo, 130 / 86 y la próxima visita bien podría ser 158/101. Pero si tomamos múltiples presiones, el promedio de estas presiones se acercará más a su 144/92 habitual.

Pero digamos que el sphyg está sesgado para leer bajo, en promedio, lee presiones 6 mm más bajas que la presión real. Entonces su promedio medido será de aproximadamente 138/86. Si muchos pacientes asisten a la misma práctica, y el sphyg está sesgado de esta manera, menos serán tratados por presión arterial alta. No importa cuántas lecturas se tomen, este sesgo perjudicará la medición y cambiará la toma de decisiones.

De manera similar, si el sesgo está en la otra dirección, se “diagnosticará en exceso” la presión arterial alta. Los datos son simplemente incorrectos. Pero sutilmente así.

Este ejemplo trata de algo que hemos medido durante años, con un éxito razonable, casi como el mejor de los casos fuera del laboratorio.

Luego, considere el caso en que un médico describe (y registra) algo así como “un hígado agrandado”. ¿Dónde está la calibración? ¿Cómo se entrenó ese médico para palparse? ¿Cuándo fue la última vez que se verificó esta habilidad?

Puede que no te sorprenda saber que esos datos son a menudo un poco dudosos. Se pone peor. Hablemos del diagnóstico, que se hace sobre la base de múltiples observaciones y mediciones, algunas bastante confiables y otras no. Incluso con la moderna tecnología sofisticada, sabemos (a partir de autopsias en países como Suiza) que los médicos diagnostican incorrectamente algo entre el 8 y el 30% del tiempo. Sin embargo, estos son los diagnósticos que se registran en su sistema informático.

Lo que nos lleva a nuestro próximo problema.

Nuestro segundo problema es uno de codificación. Hay muchos problemas aquí. Primero, los modernos sistemas de codificación de computadoras como ICD-10 y SNOMED CT son bastante complejos. Estoy tentado de decir “increíblemente complejo”. Y el mismo problema de calibración se extiende desde la arena clínica a la codificación. Si no confiamos en los datos clínicos, ¿cuánto podemos confiar en la codificación? Especialmente si la persona que hace la codificación es apresurada, parcial (esa palabra otra vez), o simplemente ignorante. Y doblemente si los códigos en sí mismos son un poco dudosos. Tome SNOMED CT, internacionalmente considerado por muchos como el sistema de codificación de enfermedades.

Si observa cuidadosamente cómo funciona SNOMED CT, hará algunas observaciones perturbadoras. Echemos un vistazo a los 30,000 términos anatómicos que incluye. Si eres médico, es posible que encuentres ciertos “términos anatómicos” un poco extraños: “secundines enteros”, “cornezuelo de la pierna” e incluso “psique completa”. Luego está mi favorito, el punto “Yamamoto”, un punto de acupuntura, algo que no tiene ninguna base en la anatomía.

Pero hay otras cosas raras pasando aquí. SNOMED CT está organizado como una ‘jerarquía’, donde las partes componentes caen dentro de otras estructuras ‘más grandes’. Esto se relaciona con la idea de ‘ontología’, donde la principal forma de construir estructuras de datos es a menudo describir las cosas ‘A es un B’ y ‘B tiene un (n) A’. Superficialmente esto parece estar bien, pero si miras más de cerca, encontrarás que los arquitectos han construido algo llamado “herencia múltiple”, de modo que si tomas (digamos) una estructura en el cerebro, puede haber 10,000 caminos que puedes rastrear volver a la raíz ‘estructura anatómica’, algo así como el árbol de Banyan más extraño que puedas imaginar. Pero espera hay mas.

Ahora tenemos que preguntarnos cómo nuestros códigos pobremente calibrados, a veces incoherentes, se juntan en una base de datos. Este es nuestro tercer problema, porque encontrará que muchas, tal vez la mayoría de las bases de datos médicas son estructuras enormes. Pueden tener diez mil o más tablas diferentes (o en el caso de bases de datos no SQL como Epic, estructuras que pueden traducirse en un número similar de tablas convencionales). Si conoce un poco acerca de las bases de datos, pronto se dará cuenta de que esta complejidad maligna afectará enormemente su capacidad de extraer algo significativo.

Lo que nos lleva a nuestro cuarto problema: las relaciones integradas en los datos. Ya hemos hablado sobre sistemas de codificación complejos y almacenamiento incoherente en múltiples tablas, pero seguramente hay una arquitectura simple y básica integrada en toda esta complejidad que nos permite afirmar cosas como “Hice el diagnóstico de insuficiencia cardíaca en base a estos datos”. , y estoy 99% seguro de que esto es correcto “, o” Elegí nadolol para este paciente porque tienen hipertensión portal y su efecto bloqueo beta no selectivo es muy probable que sea favorable en esta condición “. Lamentablemente, descubrirá que tales capacidades a menudo son ajenas a los desarrolladores del sistema. (Facturación, lo hacemos).

De hecho, a menudo encontrará que la arquitectura real de todo el registro de salud se construye utilizando el enfoque ” es un ” descrito anteriormente. De modo que está efectivamente reducido a utilizar un lenguaje compuesto por sustantivos y un solo verbo.

Y luego está el quinto problema. Los médicos acosados ​​son intimidados cada vez más para cumplir los objetivos . Los gobiernos o la alta gerencia establecen a los administradores estos objetivos habitualmente arbitrarios (con las mejores intenciones) y los administradores los obligan a cumplir sus objetivos. Se impondrán sanciones severas si los objetivos no se cumplen. Enfrentados a objetivos definidos, interfaces de usuario que a menudo son activamente hostiles, un “lenguaje” inexpresivo, codificación extraña y un “aliento” frenético de parte de los gerentes, ¿qué crees que harán los clínicos? Sí, ignora al paciente, pero cumple el objetivo. Marque las múltiples casillas en un ritual de aplacamiento. **

Una pregunta ahora. ¿Puedes confiar en estos datos? (Sugerencia: GIGO).

Entonces, ahora tenemos que revertir el proceso y extraer los datos. ¿Puedes ver el problema?

No es imposible, es simplemente increíblemente difícil. Por lo menos, necesitas:

  1. Comprenda los procesos subyacentes, las restricciones, los mecanismos de captura de datos y el contexto en el que se ingresaron los datos. Necesita sentir algo del sufrimiento del clínico, codificador o capturador de datos al ingresar los datos. Cuando los datos son automáticos, debe comprender la calibración (o la falta de ella).
  2. Explore los datos. Encuentre maneras de “verificar”. ¿Hay alguna forma de que pueda asegurarse de que este es el paciente correcto, para empezar? Si se registró una marca de tiempo, ¿está registrada en otro lugar, por lo que puede verificar? ¿Los datos tienen sentido cuando se juntan? Por ejemplo, ¿pareció que la cirugía comenzó antes de que el paciente fuera anestesiado? ¿Qué datos faltan?
  3. Comprenda cómo funciona el sistema de codificación y qué prejuicios pueden ser operativos. ¿Cómo se almacenan los datos? ¿Qué errores podrían haberse infiltrado, errores de software, así como errores de codificación y de entrada? ¿Hay varias fuentes de datos que deben conciliarse?

Entonces, si sabe lo que está buscando, por qué lo necesita, qué uso le puede dar, y el sesgo y la precisión de sus datos, puede sentarse y extraer cuidadosamente un conjunto limitado de datos precisos. Puedes hacer algo bueno.

De lo contrario, solo estás pescando, y solo los dioses saben qué cosa extraña podrías sacar de las profundidades.

Mi 2c, Jo.

* Me he abstenido de debatir otro tema más, la sabia idea de que las teorías siempre preceden a los datos, en lugar de la más convencional “al revés”. El margen es insuficiente para contener tal discusión 🙂

** Ni siquiera mencionemos los sesgos introducidos por la remuneración que depende precisamente del código de diagnóstico ingresado.

Por lo general, hay dos tipos de información almacenada en un registro médico electrónico (EMR); estructurado y no estructurado.

Los datos estructurados tienen un tipo de datos (entero, número de punto flotante, booleano, cadena, etc.) y, como tal, un valor definido (o NULO). Estos se almacenan en una base de datos y si conoce el esquema de la base de datos, puede encontrarlos. Para conocer el significado del valor, debe conocer (o descubrir) el diccionario de la base de datos. En EMR, algunos, pero no todos, los datos estructurados se refieren a terminologías controladas utilizadas por las organizaciones de desarrollo estándar y esto facilita su interpretación.

Los datos no estructurados suelen ser texto, aunque pueden ser datos estructurados bastardizados en cadenas de texto. El significado se extrae de datos no estructurados mediante un proceso de software conocido como procesamiento de lenguaje natural (NLP). Esto generalmente ocurre en un proceso de canalización donde el texto se divide en palabras y oraciones, palabras aburridas eliminadas, palabras mapeadas a terminologías controladas y luego tareas de nivel superior para extraer significado. Esta puede ser una tarea desalentadora, a menudo específica del contexto y desafiante incluso con el mejor software.

Píldora de bolsillo (Diccionario de drogas fuera de línea – Aplicaciones de Android en Google Play) – Una plataforma de adherencia a medicamentos creció orgánicamente hasta 130k + descargas.
Care Circle (Software de gestión de prácticas, facturación médica directamente desde su móvil): el mejor amigo del médico: práctica en la nube y herramienta de gestión clínica para médicos. Facilita que tanto médicos como pacientes se conecten en una plataforma privada, con más de 150 médicos en funcionamiento. tablero ya.

dos caminos:

1- Con el caso de EHR (registros de salud electrónicos), el registro está borrado por los conjuntos de datos, y por lo tanto, como cualquier base de datos se puede consultar.

2- Con los campos narrativos (texto libre) de EHR, así como los gráficos en papel, solo espero que el creador de la tabla pueda escribir / escribir, y tenga mucho tiempo porque eso consume mucho tiempo.