Como ingeniero de software, ¿cómo puedo ayudar a acelerar la investigación para encontrar una cura para el cáncer? ¿Cuáles son las fases en las que la investigación podría evolucionar rápidamente? ¿Qué tipo de algoritmos se requieren para ser desarrollados?

De vuelta en mi juventud (es decir, estudiante universitario), te habría contado genómica y plegamiento de proteínas. Diablos, hice ARN plegable durante varios años y actualmente estoy financiado por una subvención de genómica. Podríamos usar la ayuda.

Sin embargo, donde realmente podríamos usar la mejora es el desarrollo y la estandarización de algunas herramientas básicas de investigación en biociencias.

Así es como funciona actualmente el mundo del software científico.

  1. Estudiante de posgrado comienza a trabajar en un proyecto
  2. Los fondos de los estudiantes de posgrado se están acabando y él (s) necesita graduarse
  3. El estudiante de posgrado rápidamente reúne su código y lo coloca en un sitio web
  4. El sitio web se publica en el número anual de NAR Web Server Issue
  5. El graduado se gradúa y obtiene un buen trabajo bien remunerado en Wall Street o un trabajo de baja remuneración como postdoctorado
  6. El sitio web nunca más se toca y ahora solo funciona en IE6.

Hay muchas metodologías y algoritmos buenos por ahí. Sin embargo, en la prisa de graduarse, la mayoría de este software es terrible e indocumentado . Un buen ejemplo es un software que personalmente escribí: HiTRACE. Soy un programador bastante pobre con poca o ninguna formación formal en CS. Sin embargo, este es el software de análisis de ARN de vanguardia. Para ilustrar los problemas de tener un código de escritura científico, lea La diferencia entre el código científico y el código del programador .

Solo en el raro caso en que el alumno se convierta con éxito en profesor o el software se convierta en el alma de un laboratorio, seguirá sobreviviendo. BLAST, Folding @ Home y Rosetta / Fold.it son ejemplos poco comunes en los que grandes equipos dedicados se dedican a mantener y actualizar los servidores y garantizar la existencia y supervivencia continuas del algoritmo.

En cuanto al resto, se vuelven obsoletos. Aquí hay una lista “breve” de software de uso común Lista de software de Bioinformática

Hace un año, estaba intentando una predicción de estructura ab initio . Para tener un buen comienzo utilicé la Lista de software de predicción de estructura de proteínas de Wikipedia. Lamentablemente, algunos de estos programas no se han actualizado en años.

Aquí están algunos ejemplos:

  • seq2struct última actualización 9/06
  • ESyPred3D última actualización 9/02
  • PHYRE2 Protein Fold Recognition Server última actualización 2/11
  • FUGUE 4/07
  • HHpred 08
  • psipred 5/12
  • FoldX 08
  • YASSPP 5/07
  • NAST 8/10
  • MC-Fold | MC-Sym 8/09
  • Entrenamiento condicional 08
  • RnaViz 2/03

(Actualización, traté de usar ProtorP, que fue un servidor creado en 2009 y funciona muy bien. Ya no existe cuando tuve que hacer algunos cálculos el otro día).

Está realmente desactualizado. Los secuenciadores ABI 3100 CE (el caballo de batalla de la secuenciación de ADN del día siguiente) aún se ejecutan en Windows NT y no se pueden actualizar. Tuve que usar una unidad Zip para extraer mis datos.

Modernizar todo este software sería de gran ayuda para la comunidad científica. Un buen modelo a seguir sería Warren Lyford DeLano. Warren se graduó con un doctorado en Biofísica de UCSF y trabajó en el importante tema de las interacciones proteína-proteína. Sin embargo, su mayor contribución nos ha estado dando PyMOL.


Se como Warren. Danos otro PyMOL.

A medida que la química computacional y el diseño de medicamentos asistidos por computadora evolucionan día a día, el papel de un ingeniero de software es inmenso en el campo de la búsqueda de una cura para el cáncer.
1. Puede intentar diseñar algunos softwares de acoplamiento y hacerlos de código abierto para acelerar el descubrimiento de fármacos contra el cáncer (inspirándose en autodock, GLIDE, GOLD y crear un software de modelado molecular y de acoplamiento de fuente abierta)
2. Diseña un programa que pueda predecir ADME y toxicidad de cualquier molécula para acelerar el descubrimiento de fármacos contra el cáncer.
3. Diseñe un programa para el plegamiento de proteínas que ayudará a identificar nuevos objetivos para el cáncer.
4. Cree una plataforma de descubrimiento de fármacos de código abierto dedicada al descubrimiento de fármacos contra el cáncer.
5. Diseña un software para el análisis del genoma y hazlo de código abierto

Los programas computacionales mencionados anteriormente no solo ayudarán a la investigación del descubrimiento de fármacos contra el cáncer, sino que también acelerarán el proceso de descubrimiento de fármacos para el VIH, la tuberculosis, el dengue, la malaria y muchas otras enfermedades mortales.

Hay muchas cosas que puede hacer con sus habilidades de programación y diseño de software para acelerar el descubrimiento de medicamentos contra el cáncer.

Genómica. A medida que el genoma y exonerar la secuencia se vuelve más popular y accesible, habrá una gran demanda de análisis de datos de gran tamaño. Habrá una necesidad computacional para descubrir la correlación de ciertas variantes genómicas con la predisposición al cáncer y otras enfermedades.

En mi opinión, necesitamos mejores predictores de mutaciones del conductor ( http://www.nature.com/nature/jou …). Especialmente ahora que estaremos secuenciando más genomas completos. Se han detectado tantas mutaciones durante la secuenciación del genoma completo, que es muy difícil determinar cuáles son los “conductores”, cuáles son los “pasajeros” y cuáles pueden ser beneficiosos para el paciente en el sentido de que pueden ser perjudiciales para el cáncer. supervivencia celular

Existen muchos algoritmos para predecir mutaciones del controlador ( http://omictools.com/driver-muta …) pero, en mi opinión, hay mucho margen de mejora. Muy a menudo estas herramientas no concuerdan entre sí; es difícil saber cuáles son los mejores en los que confiar, antes de decidir qué mutaciones o mejores genes son los objetivos más relevantes para encontrar fármacos (u otras formas de terapia).

Habiendo dicho eso, si eres un ingeniero de software no podrás tener un gran impacto en este mar, incluso si eres el mejor programador del mundo: necesitarás formar parte de un equipo de investigación de clase mundial. para descubrir cuáles serán los mejores predictores: ¿es una selección positiva? ¿Es el tipo de cambio de estructura de proteína, etc.?

Como ingeniero de software, tal vez podría diseñar una interfaz de usuario para los programas de estadísticas extremadamente buenos y complicados, de modo que no necesiten un grado en estadísticas para usarlos (piense en autos: compárelos o compárelos). Luego, esto podría ser utilizado por los pacientes con cáncer de auto-seguimiento para mejorar los tratamientos dirigidos por el paciente: de arriba hacia abajo en lugar de investigación de laboratorio de abajo hacia arriba.

Desarrollar un buen software / herramientas y metodologías de automatización de biodiseño, especialmente para biología de sistemas y biología sintética (incluido el diseño de ARN y el diseño de proteínas).

Ver la respuesta del usuario Quora a ¿Qué es una buena disciplina académica para un aspirante a polímata para estudiar en la escuela de posgrado?

Protein plegable

Ni siquiera estoy calificado para expandirme, excepto para decir que desbloquear esta bestia tendría profundos efectos que irían más allá de la investigación del cáncer.

Únase a un laboratorio o compañía que está haciendo un análisis de secuencia.

El Broad Institute de harvard / MIT sería un buen lugar para comenzar.