Un regalo simbólico

Una imagen vale mil genes

Así se guarda una foto en ADN.
Foto guardada en ADN

El 23 de mayo, en el marco del Día de la Investigación, la Ciencia y la Tecnología, José Sotelo, vicepresidente del Consejo Directivo del instituto, le entregó al presidente de la República Yamandú Orsi una foto de Clemente Estable guardada en ADN.

Este regalo simbólico, que vincula el mundo científico con muchos otros mundos —como el de la fotografía, el de la biología, el de las aplicaciones tecnológicas y productivas, y hasta el mundo del almacenamiento de datos— tiene mucha ciencia detrás.

Hoy en día la industria del almacenamiento es enorme y ya se están buscando alternativas a las plataformas y soportes donde solemos guardar información. Una de las opciones en las que se viene trabajando hace un tiempo es el almacenamiento en ADN, por su gran capacidad de acumulación de información en mucho menos espacio del que ocupa en soportes convencionales.

¿Qué quiere decir almacenar información en ADN?

Vayamos un paso atrás, o millones de pasos para atrás: almacenar información en ADN es el método más antiguo para hacerlo, precede a todos los actuales por mucho. Cada cadena de ADN está compuesta por unidades más pequeñas llamadas nucleótidos o bases, moléculas que contienen bases emparejadas. Hay cuatro tipos de bases: adenina (A), timina (T), citosina (C) y guanina (G). Estas bases se emparejan siempre de la misma forma: A con T, y C con G. 

La secuencia en la que están ordenadas estas bases es lo que forma el código genético, y esa información se usa principalmente para fabricar proteínas, que son las moléculas que realizan la mayoría de las funciones, dentro y fuera de las células, en el cuerpo, como construir tejidos, digerir alimentos o defendernos de enfermedades.

Los datos primarios de los sistemas digitales que usamos hoy constantemente se codifican como ceros y unos, que para el almacenaje de información en ADN se transcriben en secuencias similares a las del ADN genético: en pares AT y CG.

Segmentos de esta cadena de pares de bases (genes) se van a traducir finalmente en proteínas: tres pares de bases codifican un aminoácido, las tres siguientes codifican otro, y así sucesivamente formando una cadena polipeptídica: una proteína. Esa es la forma natural de guardar información en el ADN, se guarda en genes.

Cada gen tiene una combinación única que se traduce en un orden de aminoácidos. Los aminoácidos son moléculas químicas que dotan de estructura tridimensional y de actividad funcional a la proteína. La secuencia de bases de cada gen codifica la información estructural tridimensional final de cada proteína. Es interesante reflexionar acerca de estas transformaciones, un orden específico de bases puede ser utilizado para codificar la estructura tridimensional de las proteínas, nanomáquinas moleculares que dependen de esa estructura tridimensional para hacer sus funciones.

¿Cómo se guarda una foto en ADN?

Aunque actualmente la gran mayoría de las fotografías son digitales, una foto impresa, una de Clemente Estable, por ejemplo, es realizada con métodos más antiguos, en papel fotográfico químicamente sensibilizado, expuesto a un negativo o a una fuente de luz controlada, y luego procesado con soluciones químicas para revelar la imagen. Los granos de plata reducidos son pequeñas partículas de plata metálica que se forman cuando los cristales de haluro de plata son expuestos a la luz y luego revelados. Estos granos, aunque diminutos, son los responsables de la imagen que vemos en la fotografía. Se codifica la imagen en cantidades de plata reducida.

Un archivo digital de esa imagen es una escala de grises codificada en bits, en píxeles que tienen la escala de grises codificada en 256 valores. Cada píxel tiene una forma de codificar esa intensidad o escala de grises en ceros y unos. Los granos de plata reducida pasaron a ser ceros y unos.

Entonces, para guardar una foto en ADN, lo que se hace es una transcripción de esa información en ceros y unos a su equivalente en el código genético, a la codificación en pares de AT y CG.

La información es la misma: posición e intensidad de cada píxel de la foto pasada de ceros y unos al idioma que usa el ADN. Esa codificación se realiza de forma artificial, a través de una conversión que se hace con una ecuación, un algoritmo aplicado por un software que genera y ejecuta un ingeniero de sistemas. Un biólogo molecular toma esa información y sintetiza artificialmente el ADN para guardarlo a largo plazo.

El tubo que se le entregó a Orsi contiene la información de la foto de Clemente Estable en ADN. Y guardada con redundancia, duplicada en varias hebras diferentes, para asegurarse de que la información se pueda recuperar completa. 

Lo que genera el ingeniero de sistemas es un texto con secuencias de doscientos nucleótidos de largo, dos mil combinaciones distintas de los pares de bases AT y CG, que son cadenas de ADN. La foto está guardada varias veces, con leves combinaciones diferentes.

Ese archivo de texto con las secuencias se utiliza para sintetizar ADN, se pasa del archivo de texto a algo físico, algo concreto, cadenas de bases. Este proceso de síntesis aún es caro, pero día a día se innova, en cambios que bajarán los costos de todo el proceso en un futuro no tan lejano

Una vez que el ADN está sintetizado, para leer la información se usa el secuenciador masivo, una tecnología disponible en el instituto, que también se utiliza para muchos otros fines.

En el tubo que se llevó el presidente lo que hay son un montón de cadenas simples de nucleótidos. El lugar que ocupan es mínimo y pueden, en teoría, durar más de un siglo.

Toda la información digital del mundo podría entrar en ochenta kilos de ADN, que equivaldría a varias pirámides de espacio en el sistema de ceros y unos al que estamos habituados.

Etiquetas