Bioinformática: ¿Qué debería hacer para convertirme en bioinformática?

Aprende tantas como puedas, al menos una en cada categoría:

  • Lenguajes de programación: C / C ++, Python (con numpy, pandas, scipy …). Opcional: R, MATLAB.
  • Matemáticas: algoritmos básicos, álgebra lineal, ecuaciones diferenciales, probabilidad.
  • Análisis de Datos: Regresión, Aprendizaje Automático (Agrupación, Clasificación, Redes Neuronales, Métodos Bayesianos, Impulso), métodos MCMC, Modelos Ocultos de Markov.
  • Informática: computación en paralelo, optimización, sistemas distribuidos, métodos numéricos.
  • Biología (estándar): Genética Molecular, Bioquímica, Termodinámica Bio-phyiscal (o Mecánica Estadística).
  • Biología (teoría): Genética de poblaciones, teoría coalescente, teoría de juegos evolutiva, teoría de redes.

También intente aprender todo lo que pueda sobre el proceso desde el que recibe los datos. Comprender los procesos como la RT-PCR, los métodos de secuenciación de próxima generación, los transcriptómicos de células individuales y similares pueden ayudarlo mucho.

Lea estas revistas:

  • Bioinformática, Genome Research, Nature Biotechnology, Nature Genetics, PLOS Comp Bio, BMC bioinformatics.

“Como un campo interdisciplinario de la ciencia, la bioinformática combina la informática, las estadísticas, las matemáticas y la ingeniería para estudiar y procesar datos biológicos” – Wikipedia.

Como bioinformático, necesitará equiparse con conocimientos básicos en todas estas áreas.

Ciencias de la Computación
• Python, C / C ++, Perl, R o algún otro lenguaje de programación.
• Conceptos básicos de Unix – (ordenar, cortar, grep, awk, sed, ..)
• Algoritmos de búsqueda y clasificación
• Manipulación de cadenas, por ejemplo, editar distancia, alineación, etc. (usado en la alineación del genoma)

Estadística

  • Prueba de hipótesis, por ejemplo, prueba χ2, prueba t, prueba exacta de Fisher. (Utilizado en estudios de asociación)
  • Teorema de Bayes y suposición de Bayes Naive.
  • Estimación de máxima verosimilitud (MLE) y estimación máxima a posteriori (MAP) (genética estadística).
  • Expectativa – Algoritmo de maximización. (utilizado en HMM, GMM)
  • Métodos de Markov Chain Monte – Carlo

Aprendizaje automático

  • Regresión lineal y logística (utilizada en métodos GWAS)
  • Agrupación
  • K vecinos más cercanos, bosques aleatorios, etc.

Matemáticas
• Álgebra lineal: ecuaciones lineales y factorizaciones matriciales
• Teoría de grafos: senderos eulerianos y hamiltonianos (utilizados en el ensamblaje del genoma)

Genética

  • Genética poblacional
  • La biología molecular también es muy útil.

Secuenciando

  • NGS: Jay Shendure, Hanlee Ji (2008) Secuenciación de ADN de próxima generación Nature Biotechnology 26 , 1135-1145 (2008)

Tres pasos muy importantes en biología computacional / estudios bioinformáticos son:

  • Alineación
  • Montaje
  • Llamadas de variante

Escribí sobre algunas referencias sobre estos temas y lecturas introductorias para alguien nuevo en bioinformática en otra publicación – Buceando en bioinformática: estudios introductorios para un matemático / estadístico o un científico de la computación por Janu Verma sobre Ripples in Water

Si bien la mayoría de las respuestas aquí son muy valiosas y ciertas, pero voy a agregar otra perspectiva, la bioinformática se ha expandido a un trabajo computacional más avanzado que los algoritmos simples y ha evolucionado más allá de las estadísticas / aprendizaje automático simple, mientras que muchas personas lo ven así camino. Si quieres convertirte en un bioinformático muy fuerte con habilidades únicas que aún no es muy común, tener un fuerte fondo algorítmico es muy largo. Muchas preguntas realmente desafiantes y abiertas en bioinformática requieren una comprensión profunda de los algoritmos y el análisis probabilístico más allá de los métodos estadísticos comunes. Eche un vistazo a la popular página de especialización en bioinformática de Coursera en coursera.org. Es un curso gratuito completo y bien redondeado que trabaja en muchos aspectos de la bioinformática y es instruido por uno de los líderes del campo. La bioinformática es un campo interdisciplinario que puede abordar desde muchos ángulos diferentes, pero hoy en día un buen bioinformático tiene un conocimiento decente de los componentes de biología computacional y molecular, trabajando en uno o en ambos será muy útil.

Desde el punto de vista de la programación, los lenguajes de scripting como python, perl y R (muchas personas no consideran el lenguaje de scripting R) son muy comunes en bioinformática y son un buen lugar para comenzar si eres nuevo en la programación. Pero si migró al desarrollo real de herramientas de Bioinformática que la robustez y la velocidad es un tema importante, entonces iniciar C / C ++ (y a veces Java) es muy beneficioso.

Hola cariño,

Bionivid Technology, una empresa de Genome “IT” Bangalore (India) presenta 3 meses del programa dedicado ” Genomics Summer Schoo l” para cubrir casi todos los temas de genómica como Exome seq, RNA Seq, RNA Re-Seq y Whole Genome Sequencing Data Análisis con un trabajo de proyecto. Aquí aprenderá cómo un Científico de Datos Genómicos maneja BIG DATA. Así que ven y únete a la Revolución Genómica. Al finalizar con éxito este programa, podrá manejar sus propios datos de Genomics.

Si está interesado, escriba a [email protected] o visite nuestro sitio web oficial http://bionivid.com/genomics-sum

Atentamente
Piyush

Si tiene conocimientos profundos en C, Java o C ++ o conocimientos básicos de ruby, python o tales idiomas de alto nivel, puede trabajar muy bien en bioinformática.
Puede resolver problemas en http://rosalind.info/
Puede tomar cursos coursera https://www.coursera.org/course/
Puedes contribuir a scikit-bio (si eres un programador python)
Puede contribuir con el proyecto del genoma Afra https://github.com/wurmlab/afra
Creo que esto debe ser suficiente para trabajar entre 5 y 6 años.
Completar solo cursos (alrededor de 5-6 cursos) tomará 1 año si acaba de comenzar la programación.

Encuentra un mentor
He visto a muchos recién llegados progresar simplemente por tener una charla con un mentor en el campo. Los beneficios de chatear con un mentor son ilimitados, pero algunos beneficios clave son:

  1. Obtenga información privilegiada
  2. Aprenda qué cosas clave realmente funcionan para salir adelante
  3. Red

Si quieres encontrar un mentor, mira:

  • Plataforma de asesoramiento profesional | Wisewords – 5,000+ mentores disponibles para una llamada (nuestro sitio)
  • Página en http://www.mentors.ca – gran lista de recursos de mentores

Aprender un lenguaje de programación definitivamente vale la pena, si tienes un don para el lenguaje, a partir de ahora la torta caliente en el campo de Bioinformática es Python, Perl y R. Definitivamente JAVA, C y C ++ no necesitan ser descartadas, pero depende de la estación de trabajo serás empleado y qué prácticas de estándares de oro tienen. Lo más importante que necesitas para tener interés en Biología (no es necesario que tengas que ser bueno en Biología eventualmente podrás conectar todo con él) y pensar todo en términos de 0 y 1 (patrón numérico) y encontrar un patrón que pueda estar asociado con él e intentar ajustar la característica estadística a él. Esto te ayudará a sobresalir en el campo. Siempre tenga la capacidad de aprender cosas nuevas y aceptar desafíos.

El consejo minimalista: Learn R y Python.