Estoy tratando de encontrar un conjunto de datos de síntomas y enfermedades para un proyecto de bioinformática. ¿Dónde puedo encontrar uno de estos? ¿Qué usa Isabel Symptom Checker o Healthline?

Creo que solo necesitas las palabras clave correctas. Desde una búsqueda en google de “base de datos de síntomas de enfermedad nih diagnóstico médico” y con un poco de navegación de los principales éxitos:
Información de fuente de la base de datos de enfermedades
Enciclopedia médica: MedlinePlus

La información no está en un buen formato de base de datos. Lo más probable es que esas bases de datos curadas sean más difíciles de encontrar debido a que no son populares y probablemente sean privadas. Sospecho que Isabel y Healthline mantienen sus propias bases de datos privadas , aunque las obtuvieron o extrajeron de fuentes públicas. Puede continuar buscando estos datos formateados, pero para mejorar sus posibilidades, me limitaría a recursos públicos como NIH.

La extracción requerirá cierto trabajo pero, como sabrá, una gran cantidad de bioinformática está adquiriendo y formateando los datos. No estoy seguro de dónde se encuentra en desarrollo pero si fuera yo haría algo como lo siguiente: descargue las fuentes de la página web como texto, extraiga los enlaces usando expresiones regulares, descárguelos todos automáticamente usando cURL, y luego extraiga y formatee ellos para síntomas / enfermedades.

¡Buena suerte!

Consulte ApiMedic.com (Integre una calculadora de probabilidad para condiciones médicas). Lo desarrolla una startup suiza con clientes en Europa. Como puede ver en las referencias en el sitio web anterior, la API ya es utilizada por algunos de los principales clientes de atención médica. El servicio se describe de la siguiente manera:

ApiMedic ofrece un corrector de síntomas médicos principalmente para pacientes. En función de los síntomas ingresados, le informa qué posibles enfermedades tiene. Le dirige a más información médica y le muestra el médico adecuado para obtener más aclaraciones. El corrector de síntomas se puede integrar a través de la API flexible (interfaz de programación de aplicaciones) . Esta es una interfaz de programación modular, que ofrece las funciones de comprobación de síntomas para un programa principal.

Intentamos realmente muy duro encontrar un conjunto de datos de síntomas mientras trabajábamos en un proyecto de Pediction de enfermedades durante mi MS … y no pudimos encontrar nada que fuera exactamente lo que estábamos buscando. Finalmente terminamos raspando web WebMD seguido de minería de texto para crear pares de enfermedad-síntoma con una puntuación similar.

Creo que tienes la mejor respuesta de Austin Quach, sin embargo, tus habilidades de minería de datos deben mejorar, esa es la primera y la principal cosa que una persona en bioinformática debe aprender. Internet es un gran recurso. Sin embargo, puedes echar un vistazo al siguiente enlace. También debería ser rentable para usted.

Base de Datos de Enfermedades / Síntomas

Puede consultar Data.gov (EE. UU.) Y Open Government Data (OGD) Platform India (India). Ambos sitios tienen datos de atención médica.