Cómo se estableció el triplete del código genético
La descripción inicial de la estructura lineal dúplex del DNA por James Watson y Francis Crick a principios de la década de los 1950s fue verdaderamente un avance monumental. En ese tiempo, no existía la tecnología para aislar un gen, determinar su secuencia de nucleótidos o relacionar dicha secuencia con la secuencia de aminoácidos de la proteína correspondiente. El RNA mensajero no había sido descubierto y se sabía muy poco sobre la síntesis de proteínas. Era evidente que había muchas proteínas en las células de cada organismo y se estaba volviendo aparente que la mayoría de las proteínas consisten de una secuencia lineal de aminoácidos.
George Beadle y Edward Tatum, en sus estudios pioneros con el hongo Neurospora había sugerido una relación 1:1:1 entre gen, enzima y reacción bioquímica. Pero la forma en que secuencia de nucleótidos de cada gen estaba relacionada a la secuencia de aminoácidos de su proteína codificada permanecía como una pregunta sin responder.
En el artículo de 1961 en Nature titulado “Naturaleza General del Código Genético para Proteínas”, Francis Crick, Leslie Barnett, Sydney Brenner y Richard Watts-Tobin finalmente resolvieron el acertijo. Concluyeron de manera correcta que el código genético es un código de tripleta, el código es redundante (también llamado degenerado: la redundancia o degeneración es una característica del código genético, la regla de correspondencia entre la secuencia de nucleótidos de los ácidos nucleicos y la secuencia de aminoácidos de los polipéptidos; se refiere a que existen más codones distintos de los necesarios para guardar la información genética), las tripletas no se traslapan, no hay comas (aunque los intrones fueron subsecuentemente descubiertos) y cada secuencia de nucleótidos se lee de a partir de un punto específico de inicio.
En 1961 el único procedimiento analítico que podría ser utilizado para ordenar la secuencia de nucleótidos presumida de un gen era el mapeo de estructuras genéticas utilizando mutantes con alteraciones en dicho gen. Los sitios mutacionalmente alterados mapeados por este procedimiento eran supuestos sitios de cambios en nucleótidos.
Afortunadamente para Crick y sus colaboradores, Seymour Benzer había desarrollado, a finales de los 1950s, un elegante ensayo utilizando mutaciones en la región rII del fago T4 (que tiene 2 genes adyacentes, llamados cistrones A y B –cistrón es la unidad más pequeña de material genético capaz de ser responsable de la síntesis de un polipéptido). Con este sistema, Benzer proporcionó el primer mapa estructural detallado de una región genética, en este caso del genoma del fago.
A pesar de la incapacidad para secuenciar el DNA, Crick y sus colegas estaban convencidos de que podría utilizar la mutagénesis y la recombinación genética con el sistema T4 rII para mapear sitios alterados en este región genética y establecer la naturaleza general del código genético.
El mapa de Benzer sobre la región T4 rII era consistente con la conclusión de que cada gen estaba formado por una secuencia lineal de nucleótidos, cada uno de los cuales podía experimentar un cambio heredable que podría alterar el producto proteínico. Que los polipéptidos también consistían de secuencias lineales de aminoácidos había sido establecido previamente por Fred Sanger y otros.
Entonces, en 1958 Vernon Ingram demostró que un polipéptido mutante de hemoglobina humana tenía solamente el cambio en un aminoácido. La conclusión lógica derivada de estos y otros estudios relacionados era que cada gen consistía de una secuencia lineal única de nucleótidos y que dicha secuencia era traducida en una secuencia lineal única de aminoácidos. Si esta interpretación era correcta entonces tenía que haber un “código genético” relacionando la secuencia de nucleótidos de cada gen con la secuencia de aminoácidos de su proteína codificada.
Crick había propuesto la hipótesis del “adaptador” –que moléculas específicas (posteriormente identificadas como tRNAs) eran responsables de “traducir” una secuencia específica de nucleótidos en un aminoácido específico. Brenner a su vez había comparado las secuencias conocidas de aminoácidos de proteínas y concluyó que el código genético no podría estar traslapado (una de varias posibilidades) porque cada aminoácido podría estar localizado adyacente de cada uno de los otros 19 aminoácidos.
La estrategia de Crick para determinar cuál de los “códigos” potenciales era el correcto, se basaba en su creencia de que una clase de mutágenos, las tinturas de acridina (como proflavina) causaban adiciones o disminuciones de pares base en el DNA. Esta no era la visión predominante en la época pero estaba apoyada por sus datos. Consistente con esta interpretación estaba la observación de que las mutaciones en el DNA inducidas por acridina tenían una inusual característica: eran totales o non-leaky (esto es, la mutación llevaba a la pérdida completa de la función del gen). Esto sugería que dichas mutaciones evitaban la traducción apropiada de la región codificadora hacia el extremo 3’ (downstream) del sitio de la mutación.
Crick y sus colegas razonaron además que una mutación causada por la adición de un par base podría ser suprimida por un cambio mutacional cercano del tipo opuesto, la eliminación de un par base. Este segundo cambio restauraría el marco de lectura “natural”, hacia el extremo 3’ del sitio de la segunda mutación. Así, solamente el segmento de polipéptido especificado por la secuencia de DNA entre los sitios de los 2 cambios mutacionales sería alterado.
Ellos probaron estas predicciones utilizando un T4 rII mutante inducido por proflavina que designaron FC0. Arbitrariamente asumieron que este mutante surgía como resultado de la adición de un par base (llamado “+”). Esta mutación mapeó a un sitio en un segmento específico del cistrón B de la región T4 rII que de acuerdo a Benzer no era esencial para la función rII B. El significado de seleccionar esta región genética para sus análisis era la expectativa de que una secuencia alterada de aminoácidos especificada por el segmento de DNA entre los cambios + (adición de par base) y – (eliminación de par base) en la región B seleccionada no sería dañino.
En efecto, cuando realizaron sus análisis iniciales con FC0 seleccionando por mutaciones que restablecieran la función rII+, observaron muchos cambios supresores en el segundo sitio; estos mapearon a sitios vecinos en cualquiera de los lados del sitio de mutación FC0. Entonces separaron estos cambios supresores de la mutación FC0 por recombinación genética y observaron que cada cambio supresor, cuando estaba solo en rII B, también tenía un fenotipo mutante. Estos cambios supresores separados eran generalmente totales, consistente con la expectativa de que cada uno era debido a la eliminación de un par base.
Los investigadores aislaron supresores de estos supresores; estos debía ser adiciones de par base, dado que ellos invertían el fenotipo mutante de los supresores previamente aislados y que se presumían “eliminadores”. Combinando cambios mutaciones en los varios juegos, observaron que había solamente 2 clases: aquellos que parecían tener la adición de un par base y aquellos que parecían tener la eliminación de un par base.
Así, un cambio mutaciones en una clase, cuando se combinaba con un cambio mutacional en la misma clase, debía producir un fenotipo mutante, mientras que cuando se combinaba con un cambio mutacional vecino en la segunda clase se observaría el fenotipo rII+. Eso fue precisamente lo que encontraron: la mayoría de las mutaciones supresoras estaban localizadas en sitios relativamente cercanos al sitio de la mutación “supresora” primaria.
Parecía que el error de lectura resultante en la adición de un par base podría solamente se corregida por la eliminación de un par base vecino. Esto sugería la presencia de un código de triplete de nucleótido y que algunos tripletes codificantes no podían ser traducidos, sirviendo tal vez como “altos” de traducción. Los autores también observaron que algunas de sus combinaciones +/- tenían un fenotipo pseudo-silvestre, consistente con la expectativa de que algunas de las secuencias de aminoácidos especificadas por el segmento de DNA entre los sitios de los 2 cambios mutacionales podrían contener un aminoácido que era solamente parcialmente funcional aceptable en dicha posición.
En seguida realizaron un análisis adicional, enfocándose en su principal objetivo, determinar la naturaleza general del código genético. Razonaron que si el código genético es un código en triplete entonces combinando 3 cambios mutacionales + o 3 cambios mutacionales – producirían un fago con un fenotipo silvestre o pseudo-silvestre. Exactamente eso encontraron. En estos mutantes triples, un aminoácido fue presumiblemente adicionado o eliminado de la proteína B. Estos hallazgos proporcionaron evidencia convincente en apoyo a su conclusión de que código genético era un código en triplete.
Crick, Barnett, Brenner y Watts-Tobin diseñaron una prueba adicional de la lógica de sus interpretaciones, explotando lo que parecía ser una fusión de gen. Introdujeron cambios mutacionales + y – en el cistrón A de un mutante de eliminación especial llamado 1589 en el cual el segmento no eliminado del cistrón rII A se presumía como fundido a la porción remanente del cistrón B. Sin embargo, este mutante de eliminación retuvo la función de la proteína B sugiriendo que la sección remanente del DNA en el cistrón B era traducida en forma de lectura apropiada, produciendo un polipéptido A-B que retenía la función B.
Normalmente, las mutaciones en el cistrón A o en B no tienen efecto en la expresión del otro cistrón, consistente con el hecho de que rII A y rII B son genes separados. Introduciendo cambios mutacionales + o – en la porción remanente de rII A del mutante de eliminación 1589, como se predijo, eliminó la actividad rII B. Sin embargo, cuando los cambios + y – fueron combinados con la región rII A de 1589, la actividad B era restaurada. Estos resultados eran consistentes con la conclusión de que la secuencia de nucleótido de un gen es traducida linealmente, comenzando en un punto de inicio fijo y procediendo hasta que se encontraba una señal de alto para la traducción.
Posteriormente realizaron experimentos adicionales para probar si la relación codificadora DNA-proteína podía ser de 6 nucleótidos por aminoácido en lugar de 3 nucleótidos por aminoácido, que ellos favorecían de acuerdo a sus datos.
Todos sus hallazgos fueron consistentes con la conclusión de que cada mutación inducida por acridina involucraba la adición o eliminación de un único par base y no la adición o eliminación de 2 pares base. Sin embargo, reconocieron que estos estudios no eliminaban por completo la posibilidad de los 6 nucleótidos. También argumentaron que sus resultados eran más consistentes con que el código fuera redundante. Dado que había 64 (4x4x4) diferentes secuencias de triplete y solamente 20 aminoácidos, 44 de estos tripletes codificaría presumiblemente secuencias de alto o podrían servir para alguna otra función si el código no fuera redundante. Si 44 tripletes eran codones de alto, los autores creyeron que habrían experimentado mayor dificultad en restaurar la función rII al combinar cambios mutacionales + y -. Como muchos de los cambios mutacionales de adición y eliminación se rescataban por mutaciones de supresión, un codón de alto no podría haber estado introducido entre los dos. La explicación más plausible era que el código genético es altamente redundante.
Los análisis experimentales descritos en su artículo son extremadamente convincentes. Mencionan en uno de los últimos párrafos el anuncio por Marshall Nirenberg en el Congreso de Bioquímica en Moscú de 1961 que él y Matthaei habían agregado un ácido poliuridilico de RNA a un sistema de síntesis de proteína in vitro libre de célula, produciendo fenilalanina. Esto implicaba la existencia de alguna secuencia de códigos de uridinas para fenilalanina y, más importante, que RNAs sintéticos podrían ser traducidos en proteínas utilizando este sistema libre de células.
Crick y los demás también se refirieron a otro artículo de Nirenberg y Matthaei en que estos mencionan en una nota adicional que “el ácido policitidílico específicamente media la incorporación de L-prolina en un producto precipitable por TCA (ácido tricloroacético)”.
El documento de Crick y colaboradores de 1961 es asombroso pues dedujeron correctamente la naturaleza general del código genético a pesar de su incapacidad para descifrar el código genético por análisis experimental directo. Sus análisis fueron brillantes y sus conclusiones fueron adiciones invaluables a nuestro conocimiento del contenido informativo del DNA. Sin duda, sus conclusiones debieron tener un gran impacto en los científicos del campo en su época.
Este es un perfecto ejemplo del uso del pensamiento y la lógica para resolver problemas biológicos básicos, combinando conocimiento y sabiduría para dar respuesta a importantes preguntas científicas.