Se compilan a través de toneladas de datos de libros de medicina y literatura médica y se analizan con métodos de minería de datos para que correspondan a un diagnóstico específico.
Por ejemplo, ¿cuál es la probabilidad de que una persona tenga parkinson si la EMR describe temblor, etc.? Algunos de estos sistemas se basan en probabilidades bayesianas, al igual que los métodos de clasificación de spam, pero un poco más complejos.
Watson es un gran ejemplo que usa otro tipo de procesamiento del lenguaje natural.