La bioinformática con papel y lápiz: construcción de un árbol filogenético Teach article

Traducido por Sonia Fernández Alba. La bioinformática es generalmente llevada a cabo con un ordenador potente. Con la ayuda de Cleopatra Kozlowski, puedes investigar nuestra ascendencia primate- utilizando nada más que un papel y lápiz.

Imagen cortesía de
hometowncd / iStockphoto

Como resultado de los recientes avances tecnológicos es relativamente rápido y fácil determinar una secuencia de ADN o de proteínas. Estas secuencias de por sí, por supuesto que nos dicen muy poco: GAATCCA, como por ejemplo. Necesitamos conocer el significado de esas secuencias. ¿Qué proteínas están codificadas por esa secuencia de ADN? ¿Codifica la secuencia de hecho una proteína? ¿Qué efecto tiene un pequeño cambio en la secuencia de ADN sobre la estructura de la proteína codificada? ¿Qué función tiene esa proteína en la célula? Y por supuesto, ¿qué puede decirnos nuestra secuencia de ADN sobre nuestra historia evolutiva?

Éstas y otras cuestiones biológicas importantes pueden ser abordadas con la bioinformática: esencialmente, mediante la comparación de ADN o secuencias de proteínas – por ejemplo, a través de la comparación de secuencias recién descubiertas con secuencias de las cuales ya tenemos mucha información (¿quizás tengan una función similar?) o comparando secuencias similares en diferentes especies.

La bioinformática se desarrolla por supuesto con la ayuda de un ordenador potente generalmente. Sin embargo, es muy fácil dejar que el ordenador haga todo el trabajo sin el conocimiento de los principios subyacentes implicados. Por esta razón, estas actividades están diseñadas para ser realizadas sobre el papel, para así conseguir que los estudiantes entiendan cómo funciona el análisis bioinformático.

Este artículo incluye un grupo de cuatro actividades. Las dos actividades preliminares (“hallazgo de genes” y “mutaciones”) y la actividad final (“ADN móvil”) pueden ser descargadas desde la página web del Laboratorio Europeo de Aprendizaje para las Ciencias de la Vida (ELLS)w1. Todas las tablas necesarias para que los estudiantes completen esta actividad, junto con el procedimiento paso a paso y las respuestas a las preguntas de comprensión, pueden ser descargadas desde la página web Science in Schoolw2.

Construcción de un árbol filogenético

La acumulación de mutaciones provoca que las secuencias de ADN cambien a través de generaciones. La siguiente actividad demuestra como esto puede ser utilizado para deducir las relaciones evolutivas entre organismos. Se tarda unos 90 min y no requiere más que un lápiz y las tablas, las cuales pueden ser descargadas desde la página web Science in Schoolw2.

árbol de la vida de Haeckel
de The Evolution of Man
(1879)
. Haga clic sobre la
imagen para ampliarla

Imagen de dominio público;
origen de la imagen: Wikimedia
Commons

Introducción

Piensa en como clasificarías diversos animales. Tradicionalmente, las diferencias físicas entre organismos fueron utilizadas para deducir las relaciones evolutivas entre ellos, por ejemplo, si un organismo tiene una columna vertebral, o si tiene alas. Sin embargo, esto puede causar problemas. Por ejemplo, aves, murciélagos e insectos tienen todos ellos alas, pero ¿están estrechamente relacionados? ¿Cómo calculas el tiempo que ha pasado desde que los organismos divergieron de un ancestro común?

Sabemos por estudios de secuenciación de ADN que las mutaciones ocurren aleatoriamente a un ritmo muy lento y son transmitidas de padres a hijos. De este modo, si asumes que todos los organismos tienen un ancestro común, puedes utilizar las diferencias en secuencias homólogas para medir el tiempo que ha pasado desde que los organismos divergieron. En otras palabras, cuanto más tiempo haya pasado desde que dos especies divergieron de un ancestro común, más diferentes serán sus secuencias de ADN.

Las secuencias homólogas se definen como aquellas secuencias en dos organismos que tienen un origen común. En realidad no tenemos pruebas de que dos secuencias son homólogas (no estuvimos allí para observar el cambio del ADN con el tiempo), pero si son suficientemente similares, a menudo asumimos que son “homólogas”. Para conocer la similitud de dos secuencias, necesitas alinearlas correctamente (pero esto no forma parte de esta actividad).

Hay que tener en cuenta que las diferentes regiones del ADN – regiones codificantes y no codificantes – evolucionan a diferentes velocidades. En general, las regiones codificantes evolucionan más lentamente, ya que una mutación que provoca un cambio en una proteína es generalmente más costoso para el organismo – es menos probable sobrevivir y dejar descendencia. Esto es analizado en la actividad “ADN móvil”.

Para ilustrar el concepto de homología, puedes utilizar el ejemplo de filología – el estudio de la evolución de las lenguas. De hecho, hay muchos paralelismos entre los métodos usados para estudiar la evolución de las lenguas y la de los organismos.

el árbol de las lenguas indoeuropeas. Hay que tener en cuenta que aunque las lenguas indias, las germánicas, las romances y muchas otras lenguas europeas pertenecen a esta familia, el finés, el estonio y el húngaro no pertenecen al grupo de las lenguas urálicas. Haga clic sobre la imagen para ampliarla
Fuente de información: www.linguatics.com/indoeuropean_languages.htm

El uso de las diferencias entre fragmentos de secuencias de ADN es como comparar una palabra que significa lo mismo en diferentes idiomas, para ver lo estrechamente que están emparentadas.

Tabla 1: Lista de “gato” en las lenguas indoeuropeas
Fuente de información: http://cats-cat.blogspot.com

Armenio gatz
Vasco katu
Holandés kat
Inglés cat
Estonio kass
Finés kissa
Islándico kottur
Italiano gatto
Noruego katt
Polaco kot
Portugués gato
Ruso kot
Español gato
Sueco katt

Puedes ver que las palabras “gato” en italiano, español y portugués son casi iguales: gatto, gato y gato. Tanto en sueco como en noruego, la palabra es “katt”, pero puedes ver que en finés es diferente: “kissa”. Aunque Finlandia es un país nórdico como Suecia y Noruega, la palabra finés “cat” es más parecida a la palabra en estonio “kass”. De hecho, las dos lenguas están estrechamente relacionadas. Así que puedes aprender un poco sobre las relaciones lingüísticas mediante el estudio de cómo las palabras han cambiado con el paso del tiempo.

Imagen cortesía de Stephan
Franz Xaver Dietl / pixelio.de

Construcción de un árbol filogenético de primates

En esta actividad, construiremos un árbol filogenético utilizando cinco secuencias homólogas de ADN de primates. Debido a que las secuencias han sido inventadas, no podemos deducir ninguna real estimación de la distancia genética; para crear un significativo árbol filogenético a partir de datos reales se requeriría secuencias mucho más largas. No obstante, las secuencias ficticias (en Tabla 2) han sido elegidas para dar una imagen bastante aproximada de las relaciones en los primates.

Nota: todas las tablas necesarias para que los estudiantes completen esta actividad pueden ser descargadas desde la página web Science in Schoolw2.

Primate Secuencia

Table 2: cinco secuencias de ADN de primates

Neandertal (n) TGGTCCTGCAGTCCTCTCCTGGCGCCCCGGGCGCGAGCGGTTGTCC
Humano (h) TGGTCCTGCTGTCCTCTCCTGGCGCCCTGGGCGCGAGCGGATGTCC
Chimpancé (c) TGATCCTGCAGTCCTCTTCTGGCGCCCTGGGCGCGTGCGGTTGTCC
Gorila (g) TGGACCTGCAGTCATCTTCTGCCCGCCCGAGCGCTTGCCGATGTCC
Orangután (o) ACAACCTGCACTCCTATTCTGCCGAGCCGGGCGCGTGGCAAAGTCC
  1. Cuenta el número de diferencias entre cada par de secuencias y anótalo en la Tabla 4. Esto es fácil de hacer si comparas cada secuencia una al lado de la otra. Por ejemplo, neandertales y humanos se diferencian en tres nucleótidos en la secuencia (Tabla 3a), mientras que chimpancés y gorilas se diferencian en 11 puntos (Tabla 3b).

Table 3a: una comparación de las secuencias de neandertal y humano

Neandertal TGGTCCTGCAGTCCTCTCCTGGCGCCCCGGGCGCGAGCGGTTGTCC
Humano TGGTCCTGCTGTCCTCTCCTGGCGCCCTGGGCGCGAGCGGATGTCC

Tabla 3b: una comparación de las secuencias de chimpancé y gorila

Chimpancé TGATCCTGCAGTCCTCTTCTGGCGCCCTGGGCGCGTGCGGTTGTCC
Gorila TGGACCTGCAGTCATCTTCTGCCCGCCCGAGCGCTTGCCGATGTCC

Las tablas de comparación para todos los pares de especies y la tabla completa de diferencias entre las secuencias (Tabla 4) pueden ser descargadas desde la página web Science in Schoolw2.

Neandertal Humano Chimpancé Gorila Orangután

Tabla 4: diferencias entre las secuencias de primates

Neandertal 0 3      
Humano 3 0      
Chimpancé     0 11  
Gorila     11 0  
Orangután          

El número de nucleótidos diferentes entre dos secuencias dividido por el número total de nucleótidos en cada secuencia (en este caso, 46) da la distancia proporcional entre dos secuencias.

  1. Considera las dos especies que son más similiares en secuencias: neandertal y humano. En la Tabla 5, anota el número de nucleótidos diferentes (3) y la diferencia proporcional (3/46 = 0.065).
Diferencias Diferencia proporcional
Tabla 5: distancias evolutivas entre los ancestros de primates y primates
Neandertal y humano 3 3/46 = 0.065
Neandertal / humano y chimpancé    
Neandertal / humano / chimpancé y gorila    
Neandertal / humano / chimpancé / gorila y orangután    

La “secuencia promedio” de dos especies se asume que es el ancestro de ambos. En este ejercicio, no calculamos directamente la secuencia promedio, por ejemplo de neandertales y humanos, pero sí la distancia evoulitva entre el ancestro de neandertal / humano y todos los otros primates en el grupo.

  1. Calcula la distancia entre la secuencia promedio de los neandertales y humanos, y de las otras especies de primates y registra los datos en la Tabla 6a.
    Hay cuatro diferencias entre neandertal y chimpancé, y cinco diferencias entre humano y chimpancé. Por consiguiente, la distancia promedio entre neandertal / humano y chimpancé es de 4.5.
    Hay 11 diferencias entre neandertal y gorila, y 12 diferencias entre humano y gorila. De este modo, la distancia promedio entre neandertal / humano y gorila es de 11.5.
  Neandertal / humano Chimpancé Gorila Orangután
Tabla 6a: diferencias entre las secuencias del ancestro de neandertal / humano y los otros primates
Neandertal / humano 0 (4+5)/2 = 4.5 (11+12)/2=11.5  
Chimpancé (4+5)/2 = 4.5 0    
Gorila (11+12)/2=11.5   0  
Orangután        
  1. Como antes, estas distancias pueden ser transformadas en diferencias proporcionales dividiéndolas por el número de nucleótidos en cada secuencia (46). Calcula las distancias proporcionales entre la secuencia media de neandertales / humanos, y las otras especies de primates. Introduce las cifras en la Tabla 5.
    Para chimpancés, la distancia proporcional con el ancestro neandertal / humano es 4.5/46 = 0.98.

Usando la Tabla 5, puedes empezar a construir el árbol evolutivo.

  1. Conecta neandertales y humanos con una línea. La longitud de las ramas debe corresponder con el tiempo que pasó desde que los humanos y neandertales divergieron de su ancestro común.

    Vamos a suponer que se necesitarían 20 millones de años para que cada uno de los nucleótidos de esta particular secuencia de ADN cambien. De este modo, para que la secuencia de ADN cambie un 0.065, se necesitarían 0.065*20 millones = 1.3 millones de años. La rama debe medir por lo tanto, 1.3 millones de años en la escala de tiempo (ver Figura 2).

  2. Para calcular cuánto tiempo hace que el ancestro de los chimpancés divergió del ancestro de los humanos (longitud de la rama), sumar las diferencias proporcionales en la Tabla 5.
    Recuerda que la distancia proporcional entre el ancestro del neandertal/humano y el chimpancé era de 0.98. Por consiguiente, el tiempo desde que chimpancés, humanos y neandertales divergieron de un ancestro común es:
    (0.065 + 0.098) * 20 milliones
    = 0.163 * 20 milliones
    = 3.3 millones de años.
Figura 2: árbol filogenético incompleto
Imagen cortesía de Nicola Graf
  1. Continúa los cálculos. Repite los pasos de 3 a 6 para calcular cuánto tiempo hace que el ancestro neandertal/humano/chimpancé divergió del gorila y del orangután. A continuación, calcula cuánto tiempo hace que el ancestro neandertal/humano/chimpancé/gorila divergió del orangután. Introduce los resultados en la Tabla 5.
    Si necesitas ayuda, puedes descargarte el procedimiento paso a paso desde la página web de Science in School.
  2. Utiliza la Tabla 5 completada para terminar el árbol filogenético, como se muestra abajo.
Figura 3: completar el árbol filognético
Imagen cortesía de Nicola Graf

Preguntas

A continuación hay algunas preguntas que podrías utilizar para comprobar si tus alumnos comprendieron la actividad. Las respuestas pueden ser descargadas desde la página weg de Science in Schoolw2.

  1. En tu árbol filogenético, ¿cuántos años hace que los gorilas y humanos divergieron de un ancestro común? ¿Y con los orangutanes y humanos?
  2. ¿Puedes averiguar si éstas y las otras estimaciones en tu árbol son correctas?
  3. ¿Por qué pueden parecer diferentes los árboles filogenéticos que han sido construidos usando diferentes regiones del ADN?
  4. ¿Qué regiones del ADN deberías utilizar para comparar los organismos que están estrechamente relacionados?
  5. ¿Qué tipo de genes deberías utilizar para comparar organismos que están evolutivamente distantes unos de otros?
  6. ¿Qué deberías hacer si estás comparando dos secuencias, pero una de ellas presenta huecos debido a deleciones (o inserciones en la otra secuencia)?
  7. ¿Puedes pensar en las razones por las que este método de simple comparación del número de diferencias entre nucleótidos podría no funcionar si estás comparando organismos que son muy diferentes? Recuerda que estamos asumiendo que se tarda 20 millones de años para que cada nucleótido mute en una secuencia.
  8. ¿Puedes pensar otras razones por las que podría no ser tan bueno usar este método para calcular las distancias evolutivas? ¿Qué simplificaciones hemos hecho?
  9. ¿Puedes pensar las razones por las que si estás estudiando organismos más distantes, es mejor comparar las secuencias de aminoácidos que las secuencias de ADN?
  10. En este ejercicio, nos hemos concentrado en entender cuándo las cinco especies de primates divergieron unas de las otras (la escala del árbol). A menudo, sin embargo, ni siquiera conocemos el orden en el cual las especies divergieron unas de las otras (la forma del árbol). ¿Cómo sabemos, por ejemplo, que humanos y chimpancés están más estrechamente relacionados que los gorilas y chimpancés? Si esto último fuera cierto, ¿cómo se distinguirían las diferencias de secuencia (Tabla 4)?

Agradecimientos

Esta actividad fue realizada en colaboración especial entre el Laboratorio Europeo de Aprendizaje para las Ciencias de la Vida (ELLS)w1 y miembros del E-STAR Laboratorio Europeo de Biología Molecular para el desarrollo de recursos didácticos para escuelas. Cleopatra Kozlowski fue respaldada mediante una beca E-STAR financiada por la Comisión Europea en el marco de su programa 6 (beca Marie Curie de acogida para formación de jóvenes investigadores), bajo el número de contrato MEST-CT-2004-504640.


Web References

  • w1 – El Laboratorio Europeo de Aprendizaje para las Ciencias de la Vida (ELLS) es un centro de educación, el cual introduce a los profesores de secundaria en el laboratorio de investigación para un encuentro práctico exclusivo con la tecnología punta en técnicas de biología molecular. ELLS también da la oportunidad a los científicos de trabajar con profesores, ayudando a cerrar la brecha entre la investigación y escuelas. La actividad descrita en este artículo fue diseñada como un recurso didáctico para el programa de desarrollo profesional para profesores europeos del ELLS. Para más infomación sobre ELLS, ver: www.embl.org/ells
  • w2 – Descarga todas las tablas requeridas para que los estudiantes completen esta actividad, junto con el procedimiento paso a paso y las respuestas de las preguntas de comprensión, aquí.

Resources

Institutions

Review

Cuando pensamos en la bioinformática, nos imaginamos probablemente enormes ordenadores y máquinas de secuenciación, pero los métodos de esta nueva ciencia pueden ser presentados por medio de actividades sencillas en el aula que son llevadas a cabo con papel y lápiz, como Cleopatra Kozlowski hace en este artículo.

El autor nos desafía con la construcción del árbol genealógico de humanos y otros primates que se basa en las diferencias genéticas entre secuencias cortas (falso) de ADN. La actividad propuesta puede ser (y de forma divertida) aprovechada en las escuelas de secundaria para abordar algunos temas complicados de biología como es el uso de los relojes moleculares en el estudio de la evolución.

El artículo está dirigido a los profesores de ciencias, quienes encontrarán ejercicios útiles de comprensión al final del texto; los estudiantes pueden también usar las preguntas para profundizar en su comprensión del tema. Las citadas webs de referencias proporcionan más información y recursos.

Giulia Realdon, Italia

License

CC-BY-NC-SA