¿Qué porcentaje del registro de salud promedio es texto y números o se puede reducir a texto y números?

Es probable que sea un porcentaje bastante alto en general, sin embargo, ciertas especialidades pueden tener un porcentaje menor que otras. Por ejemplo, cirugía plástica, dermatología, ortopedia, etc. tendrán una mayor cantidad de imágenes.
Además, a menudo se agregan imágenes escaneadas a los cuadros para obtener copias del papel recogido de otras fuentes. Según el método utilizado para escanear esa información, la conversión a texto puede ser difícil.

Finalmente, si el registro de salud también incluye datos financieros, es probable que haya imágenes escaneadas de todo tipo de tarjetas y documentación.

Si está convirtiendo el texto de texto que no es texto, tenga en cuenta que cometer un error en la conversión a texto en un registro médico podría significar la diferencia en la vida o la muerte. Aceptar cualquier cosa menos que perfecta podría ser letal.

No sé el porcentaje exacto pero es bastante grande, fácilmente más del 95% en términos de páginas.

Principalmente porque los registros de salud electrónicos generan páginas de basura inútil cuando una sola línea de texto sería suficiente.

Las imágenes de radiología y otras imágenes (EKG, fotografías, escaneos de retina, etc.) no constituyen una gran parte del registro. Y los resultados de laboratorio a menudo son páginas de texto y números.