Avui dia, està més que assumit que la vida està formada per cèl·lules. Aquestes contenen informació genètica en forma d’àcids nucleics, majoritàriament DNA, que es transmet de generació en generació i defineix les característiques dels individus. També sabem que, almenys en animals, el cervell és el gran centre de processament d’informació extragenètica. Però, parlem de números, quanta informació contenen les nostres cèl·lules?

Definint el genoma

El DNA és el programa on la cèl·lula pot accedir a la informació necessària per portar a terme totes les funcions. Des del metabolisme cel·lular a la morfologia dels teixits, el DNA defineix el funcionament de l’organisme.

Cada molècula de DNA constitueix un cromosoma, i el nombre de cromosomes pot variar entre espècies. Per exemple, l’ésser humà té 46 cromosomes. El total d’informació genètica de tots els cromosomes conforma el genoma. Cada cèl·lula de l’organisme conté tot el genoma (llevat els gàmetes, que en tenen la meitat), encara que el seu ús estigui regulat.

El DNA està compost per quatre blocs diferents que es van unint com anelles formant una cadena. Cada cadena s’associa amb una altra per complementarietat formant la molècula helicoidal de DNA. Aquestes anelles són els nucleòtids, i es diferencien pel tipus de base nitrogenada que contenen: A (adenina), T (timina), C (citosina) i G (guanina). En definitiva, podem dir que som un llibre escrit per 4 lletres.

Genoma

La mida del genoma: de lletres a bits

La seqüenciació del genoma humà ha posat al descobert una seqüència de 4.500 milions de parells de bases. Per quantificar aquesta informació, preguntem-nos quin espai necessitaríem a un disc dur per ficar el genoma humà.

La quantitat d’informació ve representada per unitats anomenades bits (binary digits), és a dir, 0 i 1. Suposant que haguéssim de reescriure el nostre material genètic en dígits binaris, el nombre de bits per cada lletra seria de 2. Esquematitzant:

A00
T01
C10
G11
Assignació de cada lletra del genoma a una combinació única de dos bits.

En 4.500 milions de parells de bases hi ha 9.000 milions de bases (recordem que una molècula de DNA són dues cadenes complementàries). Cada base ocupa dos bits, pel que tindríem 18.000 milions de bits. Arrodonirem a 20.000 milions de bits.

Per imaginar-nos aquest número inimaginable, ho podem posar en diners, 20.000 milions d’euros. És el pressupost que el govern d’Espanya va aprovar pels avals dels autònoms al nostre país durant l’inici de la crisi de la COVID-19.

Però bé, si ho volem comparar amb una cosa més bonica, es calcula que el nombre d’estrelles a la galàxia d’Andròmeda és de 1.000 milions. Cadascuna de les nostres cèl·lules té 20 vegades més bits d’informació que estrelles una petita galàxia.

En conclusió, si fem la conversió, els 20.000 milions de bits es queden en 20 Gb (Gigabits). I als nostres dispositius? La informació es maneja en bytes, on 1 bit = 0,125 bytes. Així doncs, en 20 Gb tenim 2,5 GB i per fer-nos una idea, necessitem 16 GB lliures per instal·lar els Sims 4 a l’ordinador.

Escrivint un llibre

Per si no ens ha quedat clara l’escala, imaginem que volem escriure un llibre amb tota aquesta informació. Quantes pàgines tindria?

L’alfabet català té 26 lletres, amb vocals que poden ser modificades per signes diacrítics (9 en total). Sumant a tots aquests caràcters els signes de puntuació, alguns caràcters especials (com el guionet, l’apòstrof, etc.) i fins i tot els dígrafs, podem arribar a més de 50 caràcters. Però per facilitar l’exemple, suposarem que arriben a 64.

Per saber quants bits necessitàriem per emmagatzemar un sol caràcter, hauríem de desglossar la quantitat d’aquests caràcters en paquets de 2 números (0 o 1). Si 2x2x2x2x2x2 = 64, cada caràcter podria estar recollit en un codi de 6 bits, com si cadascun tingués el seu propi carnet d’identitat en 1 i 0.

Per terme mitjà, podríem dir que una paraula està composta per 6 caràcters, és a dir, 36 bits. Així doncs, el genoma de 20.000 milions de bits podria transcriure’s a uns 555 milions de paraules. Si la pàgina d’un llibre té unes 300 paraules, el nostre genoma ocuparia un llibre d’uns 1,9 milions de pàgines. Si cada tom de Joc de Trons té aproximadament 1.000 pàgines, això suposaria tenir una saga de 1.900 llibres. Tanmateix, tothom sap que George R.R. Martin no va tan de pressa.

I què?

El resum seria que cadascuna de les nostres cèl·lules té una quantitat descomunal d’informació en un espai nuclear d’uns 5 µm de mitjana. I per fer funcionar una màquina tan complexa com la nostra, és necessària molta informació.

Els organismes menys complexos, com els bacteris, tenen menys funcions i, per tant, necessiten menys informació. I en general, a la natura trobem que l’increment de la complexitat ve acompanyat de l’increment en la quantitat d’informació, tot i que se sap que hi ha parts dels genomes que, aparentment, no contenen informació útil. És el que ens ha ensenyat l’evolució.


Ja per acabar…

Però a l’ésser humà no li basta amb els 20.000 milions de bits d’informació. Per sobreviure necessitem diverses desenes de milers de milions de bits. La velocitat amb què es desenvolupen els genomes, a través de les mutacions, és molt lenta. Això ens diu que el suplement d’informació ha de venir de sistemes no genètics, i aquí entra el nostre estimat cervell.

Per saber-ne més

NIH Terminación del Proyecto Genoma Humano

TED TALKHow to read the genome and build a human being

Carl SaganLos dragones del Edén