Ácido desoxirribonucleico

De Wikipedia, la enciclopedia libre

(Redirigido desde ADN)
«ADN» redirige aquí. Para otras acepciones véase ADN (desambiguación).
«DNA» redirige aquí. Para otras acepciones véase DNA (desambiguación).
Situación del ADN dentro de una célula.

El ácido desoxirribonucleico, frecuentemente abreviado como ADN (y también DNA, del inglés DeoxyriboNucleic Acid), es un tipo de ácido nucleico, una macromolécula que forma parte de la mayoría de las células. Contiene la información genética usada en el desarrollo y el funcionamiento de los organismos vivos conocidos y de algunos virus, siendo el responsable de su transmisión hereditaria.

Desde el punto de vista químico el ADN es un polímero de nucleótidos, es decir, un polinucleótido. Un polímero es un compuesto formado por muchas unidades simples conectadas entre sí, como si fuera un largo tren formado por vagones. En el ADN, cada vagón es un nucleótido, y cada nucleótido, a su vez, está formado por un azúcar (la desoxirribosa), una base nitrogenada (que puede ser adeninaA, timinaT, citosinaC o guaninaG) y un grupo fosfato que actúa como enganche de cada vagón al siguiente. Lo que distingue a un vagón (nucleótido) de otro es, entonces, la base nitrogenada, y por ello la secuencia del ADN se especifica nombrando sólo la secuencia de sus bases. La disposición secuencial de estas cuatro bases a lo largo de la cadena (el ordenamiento de los cuatro tipos de vagones a lo largo de todo el tren) es la que codifica la información genética: por ejemplo, una secuencia de ADN puede ser ATGCTAGATCGC... En los organismos vivos, el ADN se presenta como una doble cadena de nucleótidos, en la que las dos hebras están unidas entre sí por unas conexiones denominadas puentes de hidrógeno.

Para que la información que contiene el ADN pueda ser utilizada por la maquinaria celular, debe copiarse en primer lugar en unos trenes de nucleótidos, más cortos y con unas unidades diferentes, llamados ARN. Las moléculas de ARN se copian exactamente del ADN mediante un proceso denominado transcripción. Una vez procesadas en el núcleo celular, las moléculas de ARN pueden salir al citoplasma para su utilización posterior. La información contenida en el ARN se interpreta usando el código genético, que especifica la secuencia de los aminoácidos de las proteínas, según una correspondencia de un triplete de nucleótidos (codón) para cada aminoácido. O sea, la información genética (esencialmente: qué proteínas se van a producir en cada momento del ciclo de vida de una célula) se halla codificada en las secuencias de nucleótidos del ADN y debe traducirse para poder ser empleada. Tal traducción se realiza empleando el código genético a modo de diccionario. El diccionario "secuencia de nucleótido-secuencia de aminoácidos" permite el ensamblado de largas cadenas de aminoácidos (las proteínas) en el citoplasma de la célula. Por ejemplo, el caso anterior ATGCTAGATCGC... se convertiría primero a una molécula de ARN que se leería AUG-CUA-GAU-CGC-... y ésta a su vez, utilizando el código genético se traduciría como la secuencia de aminoácidos metionina-leucina-ácido aspártico-arginina-...

Las secuencias de ADN que constituyen la unidad fundamental, física y funcional, de la herencia se denominan genes. Cada gen contiene una parte que se transcribe a ARN y otra que se encarga de definir cuándo y dónde deben expresarse. La información contenida en los genes (genética) se emplea para generar ARN y proteínas, que son los componentes básicos de las células, los "ladrillos" que se utilizan para la construcción de los orgánulos celulares, entre otras funciones.

Dentro de las células, el ADN está organizado en estructuras llamadas cromosomas que, durante el ciclo celular, se duplican antes de que la célula se divida. Los organismos eucariotas (por ejemplo, animales, plantas, y hongos) almacenan la inmensa mayoría de su ADN dentro del núcleo celular y una mínima parte en los elementos celulares llamados mitocondrias, y en los plastos, en caso de tenerlos; los organismos procariotas (bacterias y arqueas) lo almacenan en el citoplasma de la célula, y, por último, los virus ADN lo hacen en el interior de la cápsida de naturaleza proteica. Existen multitud de proteínas, como por ejemplo las histonas y los factores de transcripción, que se unen al ADN dotándolo de una estructura tridimensional determinada y regulando su expresión. Los factores de transcripción reconocen secuencias reguladoras del ADN y especifican la pauta de transcripción de los genes. El material genético completo de una dotación cromosómica se denomina genoma y, con pequeñas variaciones, es característico de cada especie.

Contenido

Historia

Véase también: Historia de la genética
Friedrich Miescher, médico suizo fallecido en 1895.

El ADN fue aislado por vez primera durante el invierno de 1869 por el médico suizo Friedrich Miescher mientras trabajaba en la Universidad de Tubinga. Miescher realizaba experimentos acerca de la composición química del pus de vendas quirúrgicas desechadas cuando notó un precipitado de una sustancia desconocida que caracterizó químicamente más tarde.[1] [2] Lo llamó "nucleína", debido a que lo había extraído a partir de núcleos celulares.[3] Se necesitaron casi 70 años de investigación para poder identificar los componentes y la estructura de los ácidos nucleicos.

En 1919 Phoebus Levene identificó que un nucleótido está formado por una base, un azúcar y un fosfato.[4] Levene sugirió que el ADN formaba una estructura con forma de solenoide (muelle) con unidades de nucleótidos unidos a través de los grupos fosfato. En 1930 Levene y su maestro Albrecht Kossel probaron que la nucleína de Miescher es un ácido desoxirribonucleico (ADN) formado por cuatro bases nitrogenadas (citosina (C), timina (T), adenina (A) y guanina (G)), el azúcar desoxirribosa y un grupo fosfato, y que, en su estructura básica, el nucleótido está compuesto por un azúcar unido a la base y al fosfato.[5] Sin embargo, Levene pensaba que la cadena era corta y que las bases se repetían en un orden fijo. En 1937 William Astbury produjo el primer patrón de difracción de rayos X que mostraba que el ADN tenía una estructura regular.[6]

Maclyn McCarty con Francis Crick y James D Watson.

La función biológica del ADN comenzó a dilucidarse en 1928, con una serie básica de experimentos de la genética moderna realizados por Frederick Griffith, quien estaba trabajando con cepas "lisas" (S) o "rugosas" (R) de la bacteria Pneumococcus (causante de la neumonía), según la presencia (S) o no (R) de una cápsula azucarada que es la que confiere virulencia (véase también experimento de Griffith). La inyección de neumococos S vivos en ratones produce la muerte de éstos, y Griffith observó que si inyectaba ratones con neumococos R vivos o con neumococos S muertos por calor, los ratones no morían. Sin embargo, si inyectaba a la vez neumococos R vivos y neumococos S muertos, los ratones morían, y en su sangre se podían aislar neumococos S vivos. Como las bacterias muertas no pudieron haberse multiplicado dentro del ratón, Griffith razonó que debía producirse algún tipo de cambio o transformación de un tipo bacteriano a otro por medio de una transferencia de alguna sustancia activa, que denominó "principio transformante". Esta sustancia proporcionaba la capacidad a los neumococos R de producir una cápsula azucarada y transformarse así en virulentas. En los siguientes 15 años, estos experimentos iniciales fueron duplicados mezclando distintos tipos de cepas bacterianas muertas por el calor con otras vivas, tanto en ratones (in vivo) como en tubos de ensayo (in vitro).[7] La búsqueda del «factor transformante» que era capaz de hacer virulentas a cepas que inicialmente no lo eran continuó hasta 1944, año en el cual Oswald Avery, Colin MacLeod y Maclyn McCarty realizaron un experimento hoy clásico. Estos investigadores extrajeron la fracción activa (el factor transformante), y mediante análisis químicos, enzimáticos y serológicos, observaron que no contenía proteínas, ni lípidos no ligados, ni polisacáridos activos, sino que estaba constituido principalmente por "una forma viscosa de ácido desoxirribonucleico altamente polimerizado", es decir, ADN. El ADN extraído de las cepas bacterianas S muertas por el calor lo mezclaron "in vitro" con cepas R vivas: el resultado fue que se formaron colonias bacterianas S, por lo que se concluyó inequívocamente que el factor o principio transformante era el ADN.[8] A pesar de que la identificación del ADN como principio transformante aún tardó varios años en ser universalmente aceptada, este descubrimiento fue decisivo en el conocimiento de la base molecular de la herencia, y constituye el nacimiento de la genética molecular. Finalmente, el papel exclusivo del ADN en la heredabilidad fue confirmado en 1952 mediante los experimentos de Alfred Hershey y Martha Chase, en los cuales comprobaron que el fago T2 transmitía su información genética en su ADN, pero no en su proteína[9] (véase también experimento de Hershey y Chase).

Erwin Chargaff, científico que estableció la equimolecularidad de las bases en el ADN.
Rosalind Elsie Franklin (1920 – 1958), química y cristalógrafa inglesa que hizo importantes contribuciones en la comprensión de la estructura fina del ADN, los virus, el carbón y el grafito.

En cuanto a la caracterización química de la molécula, en 1940 Chargaff realizó algunos experimentos que le sirvieron para establecer las proporciones de las bases nitrogenadas en el ADN. Descubrió que las proporciones de purinas eran idénticas a las de pirimidinas; la "equimolecularidad" de las bases ([A]=[T], [G]=[C]) y que la cantidad de G+C en una determinada molécula de ADN no siempre es igual a la cantidad de A+T y puede variar desde el 36% al 70% del contenido total.[5] Con esta información y junto con los datos de difracción de rayos X proporcionados por Rosalind Franklin; James Watson y Francis Crick propusieron en 1953 el modelo de la doble hélice de ADN para representar la estructura tridimensional del polímero.[10] En una serie de cinco artículos en el mismo número de Nature se publicó la evidencia experimental que apoyaba el modelo de Watson y Crick.[11] De éstos, el artículo de Franklin y Raymond Gosling fue la primera publicación con datos de difracción de rayos X que apoyaba el modelo de Watson y Crick,[12] [13] y en dicho número de Nature también aparecía un artículo sobre la estructura del ADN de Maurice Wilkins y sus colaboradores.[14]

En 1962, después de la muerte de Franklin, los científicos Watson, Crick y Wilkins recibieron conjuntamente el Premio Nobel en Fisiología o Medicina.[15] Sin embargo, el debate continúa sobre quién debería recibir crédito por el descubrimiento.[16]

Propiedades físicas y químicas

Estructura química del ADN: dos cadenas de nucleótidos conectadas mediante puentes de hidrógeno, que aparecen como líneas punteadas.

El ADN es un largo polímero formado por unidades repetitivas, los nucleótidos.[17] [18] Una doble cadena de ADN mide de 22 a 26 Ångströms (2,2 a 2,6 nanómetros) de ancho, y una unidad (un nucleótido) mide 3,3 Å (0,33 nm) de largo.[19] Aunque cada unidad individual que se repite es muy pequeña, los polímeros de ADN pueden ser moléculas enormes que contienen millones de nucleótidos. Por ejemplo, el cromosoma humano más largo, el cromosoma número 1, tiene aproximadamente 220 millones de pares de bases.[20]

En los organismos vivos, el ADN no suele existir como una molécula individual, sino como una pareja de moléculas estrechamente asociadas. Las dos cadenas de ADN se enroscan sobre sí mismas formando una especie de escalera de caracol, denominada doble hélice. El modelo de estructura en doble hélice fue propuesto en 1953 por James Watson y Francis Crick (el artículo Molecular Structure of Nucleic Acids: A Structure for Deoxyribose Nucleic Acid fue publicado el 25 de abril de 1953 en Nature).[21] El éxito de éste modelo radicaba en su consistencia con las propiedades físicas y químicas del ADN. El estudio mostraba además que la complementariedad de bases podía ser relevante en su replicación, y también la importancia de la secuencia de bases como portador de información genética.[22] [23] [24] Cada unidad que se repite, el nucleótido, contiene un segmento de la estructura de soporte (azúcar + fosfato), que mantiene la cadena unida, y una base, que interacciona con la otra cadena de ADN en la hélice. En general, una base ligada a un azúcar se denomina nucleósido y una base ligada a un azúcar y a uno o más grupos fosfatos recibe el nombre de nucleótido. Cuando muchos nucleótidos se encuentran unidos, como ocurre en el ADN, el polímero resultante se denomina polinucleótido.[25]

Componentes

Estructura de soporte: La estructura de soporte de una hebra de ADN está formada por unidades alternas de grupos fosfato y azúcar.[26] El azúcar en el ADN es una pentosa, concretamente, la desoxirribosa.

Enlace fosfodiéster. El grupo fosfato une el carbono 5' del azúcar de un nucleósido con el carbono 3' del siguiente.
Su fórmula química es H3PO4. Cada nucleótido puede contener uno (monofosfato: AMP), dos (difosfato: ADP) o tres (trifosfato: ATP) grupos de ácido fosfórico, aunque como monómeros constituyentes de los ácidos nucléicos sólo aparecen en forma de nucleósidos monofosfato.
Es un monosacárido de 5 átomos de carbono (una pentosa) derivado de la ribosa, que forma parte de la estructura de nucleótidos del ADN. Su fórmula es C5H10O4. Una de las principales diferencias entre el ADN y el ARN es el azúcar, pues en el ARN la 2-desoxirribosa del ADN es reemplazada por una pentosa alternativa, la ribosa.[24]
Las moléculas de azúcar se unen entre sí a través de grupos fosfato, que forman enlaces fosfodiéster entre los átomos de carbono tercero (3′, «tres prima») y quinto (5′, «cinco prima») de dos anillos adyacentes de azúcar. La formación de enlaces asimétricos implica que cada hebra de ADN tiene una dirección. En una doble hélice, la dirección de los nucleótidos en una hebra (3′ → 5′) es opuesta a la dirección en la otra hebra (5′ → 3′). Esta organización de las hebras de ADN se denomina antiparalela; son cadenas paralelas, pero con direcciones opuestas. De la misma manera, los extremos asimétricos de las hebras de ADN se denominan extremo 5′ («cinco prima») y extremo 3′ («tres prima») respectivamente.
Las cuatro bases nitrogenadas mayoritarias que se encuentran en el ADN son la adenina (abreviado A), citosina (C), guanina (G) y timina (T). Cada una de estas cuatro bases está unida al armazón de azúcar-fosfato a través del azúcar para formar el nucleótido completo (base-azúcar-fosfato). Las bases son compuestos heterocíclicos y aromáticos con dos o más átomos de nitrógeno, y, dentro de las bases mayoritarias, se clasifican en dos grupos: las bases púricas o purinas (adenina y guanina), derivadas de la purina y formadas por dos anillos unidos entre sí, y las bases pirimidínicas o pirimidinas (citosina y timina), derivadas de la pirimidina y con un solo anillo.[24] En los ácidos nucléicos existe una quinta base pirimidínica, denominada uracilo (U), que normalmente ocupa el lugar de la timina en el ARN y difiere de ésta en que carece de un grupo metilo en su anillo. El uracilo no se encuentra habitualmente en el ADN, sólo aparece raramente como un producto residual de la degradación de la citosina por procesos de desaminación oxidativa.
Timina: 2, 4-dioxo, 5-metilpirimidina.
En el código genético se representa con la letra T. Es un derivado pirimidínico con un grupo oxo en las posiciones 2 y 4, y un grupo metil en la posición 5. Forma el nucleósido timidina (siempre desoxitimidina ya que sólo aparece en el ADN) y el nucleótido timidilato o timidina monofosfato (dTMP). En el ADN, la timina siempre se empareja con la adenina de la cadena complementaria mediante 2 puentes de hidrógeno, T=A. Su fórmula química es C5H6N2O2 y su nomenclatura 2, 4-dioxo, 5-metilpirimidina.
Citosina: 2-oxo, 4-aminopirimidina.
En el código genético se representa con la letra C. Es un derivado pirimidínico, con un grupo amino en posición 4 y un grupo oxo en posición 2. Forma el nucleósido citidina (desoxicitidina en el ADN) y el nucleótido citidilato o (desoxi)citidina monofosfato (dCMP en el ADN, CMP en el ARN). La citosina siempre se empareja en el ADN con la guanina de la cadena complementaria mediante un triple enlace, C≡G. Su fórmula química es C4H5N3O y su nomenclatura 2-oxo, 4 aminopirimidina. Su masa molecular es de 111,10 unidades de masa atómica. La citosina fue descubierta en 1894 cuando fue aislada en tejido del timo de carnero.
Adenina: 6-aminopurina.
En el código genético se representa con la letra A. Es un derivado de la purina con un grupo amino en la posición 6. Forma el nucleósido adenosina (desoxiadenosina en el ADN) y el nucleótido adenilato o (desoxi)adenosina monofosfato (dAMP, AMP). En el ADN siempre se empareja con la timina de la cadena complementaria mediante 2 puentes de hidrógeno, A=T. Su fórmula química es C5H5N5 y su nomenclatura 6-aminopurina. La adenina, junto con la timina, fue descubierta en 1885 por el médico alemán Albrecht Kossel.
Guanina: 6-oxo, 2-aminopurina.
En el código genético se representa con la letra G. Es un derivado púrico con un grupo oxo en la posición 6 y un grupo amino en la posición 2. Forma el nucleósido (desoxi)guanosina y el nucleótido guanilato o (desoxi)guanosina monofosfato (dGMP, GMP). La guanina siempre se empareja en el ADN con la citosina de la cadena complementaria mediante tres enlaces de hidrógeno, G≡C. Su fórmula química es C5H5N5O y su nomenclatura 6-oxo, 2-aminopurina.

También existen otras bases nitrogenadas (las llamadas bases nitrogenadas minoritarias), derivadas de forma natural o sintética de alguna otra base mayoritaria. Lo son por ejemplo la hipoxantina, relativamente abundante en el tRNA, o la cafeína, ambas derivadas de la adenina; otras, como el aciclovir, derivadas de la guanina, son análogos sintéticos usados en terapia antiviral; otras, como una de las derivadas del uracilo, son antitumorales.

Las bases nitrogenadas tienen una serie de características que les confieren unas propiedades determinadas. Una característica importante es su carácter aromático, consecuencia de la presencia en el anillo de dobles enlaces en posición conjugada. Ello les confiere la capacidad de absorber luz en la zona ultravioleta del espectro en torno a los 260 nm, lo cual puede ser aprovechado para determinar el coeficiente de extinción del ADN y hallar la concentración existente de los ácidos nucléicos. Otra de sus características es que presentan tautomería o isomería de grupos funcionales debido a que un átomo de hidrógeno unido a otro átomo puede migrar a una posición vecina; en las bases nitrogenadas se dan dos tipos de tautomerías: tautomería lactama-lactima, donde el hidrógeno migra del nitrógeno al oxígeno del grupo oxo (forma lactama) y viceversa (forma lactima), y tautomería imina-amina primaria, donde el hidrógeno puede estar formando el grupo amina (forma amina primaria) o migrar al nitrógeno adyacente (forma imina). La adenina sólo puede presentar tautomería amina imina, la timina y el uracilo muestran tautomería doble lactama-lactima, y la guanina y citosina pueden presentar ambas. Por otro lado, y aunque se trate de moléculas apolares, las bases nitrogenadas presentan suficiente carácter polar como para establecer puentes de hidrógeno, ya que tienen átomos muy electronegativos (nitrógeno y oxígeno) presentando carga parcial negativa, y átomos de hidrógeno con carga parcial positiva, de manera que se forman dipolos que permiten que se formen estos enlaces débiles.

Se estima que el genoma humano haploide tiene alrededor de 3.000 millones de pares de bases. Para indicar el tamaño de las moléculas de ADN se indica el número de pares de bases, y como derivados hay dos unidades de medida muy utilizadas, la kilobase (kb), que equivale a 1.000 pares de bases, y la megabase (Mb), que equivale a un millón de pares de bases.

Apareamiento de bases

Véase también: Par de bases
Un par de bases C≡G con tres puentes de hidrógeno.
Un par A=T con dos puentes de hidrógeno. Los puentes de hidrógeno se muestran como líneas discontinuas.

La dóble hélice de ADN se mantiene estable mediante la formación de puentes de hidrógeno entre las bases asociadas a cada una de las dos hebras. Para la formación de un enlace de hidrógeno una de las bases debe presentar un "donador" de hidrógenos con un átomo de hidrógeno con carga parcial positiva (-NH2 o -NH) y la otra base debe presentar un grupo "aceptor" de hidrógenos con un átomo cargado electronegativamente (C=O o N). Los puentes de hidrógeno son uniones más débiles que los típicos enlaces químicos covalentes, como los que conectan los átomos en cada hebra de ADN, pero más fuertes que interacciones hidrófobas individuales, enlaces de Van der Waals, etc. Como los puentes de hidrógeno no son enlaces covalentes, pueden romperse y formarse de nuevo de forma relativamente sencilla. Por esta razón, las dos hebras de la doble hélice pueden separarse como una cremallera, bien por fuerza mecánica o por alta temperatura.[27] La doble hélice se estabiliza además por el efecto hidrofóbico y el apilamiento, que no están influenciados por la secuencia de bases del ADN.[28]

Cada tipo de base en una hebra forma un enlace únicamente con un tipo de base en la otra hebra, lo que se denomina "complementariedad de las bases". Según esto, las purinas forman enlaces con las pirimidinas, de forma que A se enlaza sólo con T, y C sólo con G. La organización de dos nucleótidos apareados a lo largo de la doble hélice se denomina apareamiento de bases. Este emparejamiento corresponde a la observación ya realizada por Erwin Chargaff (1905-2002),[29] que mostró que la cantidad de adenina era muy similar a la cantidad de timina, y que la cantidad de citosina era igual a la cantidad de guanina en el ADN. Como resultado de esta complementariedad, toda la información contenida en la secuencia de doble hebra de la hélice de ADN está duplicada en cada hebra, lo cual es fundamental durante el proceso de replicación del ADN. En efecto, esta interacción reversible y específica entre pares de bases complementarias es crítica para todas las funciones del ADN en los organismos vivos.[17]

Como se ha indicado anteriormente, los dos tipos de pares de bases forman un número diferente de enlaces de hidrógeno: A=T forman dos puentes de hidrógeno, y C≡G forman tres puentes de hidrógeno (ver imágenes). El par de bases GC es por tanto más fuerte que el par de bases AT. Como consecuencia, tanto el porcentaje de pares de bases GC como la longitud total de la doble hélice de ADN determinan la fuerza de la asociación entre las dos hebras de ADN. Las dobles hélices largas de ADN con alto contenido en GC tienen hebras que interaccionan más fuertemente que las dobles hélices cortas con alto contenido en AT.[30] Por esta razón, las zonas de la doble hélice de ADN que necesitan separarse fácilmente tienden a tener un alto contenido en AT, como por ejemplo la secuencia TATAAT de la Caja de Pribnow de algunos promotores.[31] En el laboratorio, la fuerza de esta interacción puede medirse buscando la temperatura requerida para romper los puentes de hidrógeno, la temperatura de fusión (también denominado valor Tm, del inglés melting temperature). Cuando todas las pares de bases en una doble hélice se funden, las hebras se separan en solución en dos hebras completamente independientes. Estas moléculas de ADN de hebra simple no tienen una única forma común, sino que algunas conformaciones son más estables que otras.[32]

Otros tipos de pares de bases

Par de bases A=T de tipo Watson-Crick. En azul el donador de hidrógenos y en rojo el aceptor.
Par de bases A=T de tipo Watson-Crick reverso. En azul el donador de hidrógenos y en rojo el aceptor. Nótese que la pirimidina ha sufrido un giro de 180º sobre el eje del carbono 6.

Existen diferentes tipos de pares de bases que se pueden formar según cómo se forman los puentes de hidrógeno. Los que encontramos en la doble hélice de ADN son los llamados pares de bases Watson-Crick, pero también existen otros posibles pares de bases, como los denominados Hoogsteen y Wobble u oscilante, que pueden aparecer en circunstancias particulares. Además, para cada tipo existe a su vez el mismo par reverso, es decir, el que se da si se gira la base pirimidínica 180º sobre su eje.

  • Watson-Crick (pares de bases de la doble hélice): los grupos de la base púrica que intervienen en el enlace de hidrógeno son los que corresponden a las posiciones 1 y 6 (N aceptor y -NH2 donador si la purina es una A) y los grupos de la base pirimidínica los que se encuentran en las posiciones 3 y 4 (-NH donador y C=O aceptor si la pirimidina es una T). En el par de bases Watson-Crick reverso participarían los grupos de las posiciones 2 y 3 de la base pirimidínica (ver imágenes).
  • Hoogsteen: en este caso cambian los grupos de la base púrica, que ofrece una cara diferente (posiciones 6 y 7) y que forman enlaces con los grupos de las pirimidinas de las posiciones 3 y 4 (como en Watson-Crick). También puede haber Hoogsteen reversos. Con este tipo de enlace pueden unirse A=U (Hoogsteen y Hoogsteen reverso) y A=C (Hoogsteen reverso).
  • Wobble u oscilante: este tipo de enlace permite que se unan guanina y citosina con un doble enlace (G=T). La base púrica (G) forma enlace con los grupos de las posiciones 1 y 6 (como en Watson-Crick) y la pirimidina (T) con los grupos de las posiciones 2 y 3. Este tipo de enlace no funcionaría con A=C, ya que quedarían enfrentados los 2 aceptores y los 2 donadores, y sólo se podría dar en el caso inverso. Encontramos pares de bases de tipo oscilante en el ARN, durante el apareamiento de codón y anticodón. Con este tipo de enlace pueden unirse G=U (oscilante y oscilante reverso) y A=C (oscilante reverso).

En total, en su forma tautomérica mayoritaria, existen 28 posibles pares de bases nitrogenadas: 10 posibles pares de bases purina-pirimidina (2 pares Watson-Crick y 2 Watson Crick reverso, 1 par Hoogsteen y 2 pares Hoogsteen reverso, 1 par oscilante y 2 pares oscilante reverso), 7 pares homo purina-purina (A=A, G=G), 4 pares A=G y 7 pares pirimidina-pirimidina. Esto sin contar con los pares de bases que pueden formarse si también tenemos en cuenta las otras formas tautoméricas minoritarias de las bases nitrogenadas; éstos, además, pueden ser responsables de mutaciones puntuales por sustitución de tipo transición.

Estructura

El ADN es una molécula bicatenaria, es decir, está formada por dos cadenas dispuestas de forma antiparalela y con las bases nitrogenadas enfrentadas. En su estructura tridimensional, se distinguen distintos niveles:[33] [34]

  1. Estructura primaria:
    • Secuencia de nucleótidos encadenados. Es en estas cadenas donde se encuentra la información genética, y dado que el esqueleto es el mismo para todos, la diferencia de la información radica en la distinta secuencia de bases nitrogenadas. Esta secuencia presenta un código, que determina una información u otra, según el orden de las bases.
  2. Estructura secundaria:
    • Es una estructura en doble hélice. Permite explicar el almacenamiento de la información genética y el mecanismo de duplicación del ADN. Fue postulada por Watson y Crick, basándose en la difracción de rayos X que habían realizado Franklin y Wilkins, y en la equivalencia de bases de Chargaff, según la cual, la suma de adeninas más guaninas es igual a la suma de timinas más citosinas.
    • Es una cadena doble, dextrógira o levógira, según el tipo de ADN. Ambas cadenas son complementarias, pues la adenina y la guanina de una cadena se unen, respectivamente, a la timina y la citosina de la otra. Ambas cadenas son antiparalelas, pues el extremo 3´ de una se enfrenta al extremo 5´ de la homóloga.
    • Existen tres modelos de ADN. El ADN de tipo B es el más abundante y es el descubierto por Watson y Crick.
  3. Estructura terciaria:
    1. En procariotas el ADN se pliega como una súper-hélice, generalmente en forma circular y asociada a una pequeña cantidad de proteínas. Lo mismo ocurre en organelos celulares como las mitocondrias y en los cloroplastos.
    2. En eucariotas, dado que la cantidad de ADN de cada cromosoma es muy grande, el empaquetamiento ha de ser más complejo y compacto; para ello se necesita la presencia de proteínas, como las histonas y otras proteínas de naturaleza no histónica (en los espermatozoides estas proteínas son las protaminas).[33]

Estructuras en doble hélice

De izquierda a derecha, las estructuras de ADN A, B y Z.

El ADN existe en muchas conformaciones.[26] Sin embargo, en organismos vivos sólo se han observado las conformaciones ADN-A, ADN-B y ADN-Z. La conformación que adopta el ADN depende de su secuencia, la cantidad y dirección de superenrrollamiento que presenta, la presencia de modificaciones químicas en las bases y las condiciones de la solución, tales como la concentración de iones de metales y poliaminas.[35] De las tres conformaciones, la forma "B" es la más común en las condiciones existentes en las células.[36] Las dos dobles hélices alternativas del ADN difieren en su geometría y dimensiones.

La forma "A" es una espiral que gira hacia la derecha más amplia que la "B", con una hendidura menor superficial y más amplia, y una hendidura mayor más estrecha y profunda. La forma "A" ocurre en condiciones no fisiológicas en formas deshidratadas de ADN, mientras que en la célula puede producirse en apareamientos híbridos de hebras ADN-ARN, además de en complejos enzima-ADN.[37] [38]

Segmentos de ADN en los que las bases han sido modificadas por metilación pueden sufrir cambios conformacionales mayores y adoptar la forma "Z". En este caso, las hebras giran alrededor del eje de la hélice en una espiral que gira a mano izquierda, lo opuesto a la forma "B" más frecuente.[39] Estas estructuras poco frecuentes pueden ser reconocidas por proteínas específicas que se unen a ADN-Z y pueden estar implicadas en la regulación de la transcripción.[40]

Estructuras en cuádruplex

Estructura de un ADN en cuádruplex formada por repeticiones en los telómeros. La conformación de la estructura de soporte del ADN difiere significativamente de la típica estructura en hélice.[41]

En los extremos de los cromosomas lineales existen regiones especializadas de ADN denominadas telómeros. La función principal de estas regiones es permitir a la célula replicar los extremos cromosómicos utilizando la enzima telomerasa, puesto que las enzimas que replican el resto del ADN no pueden copiar los extremos 3' de los cromosomas.[42] Estas terminaciones cromosómicas especializadas también protegen los extremos del ADN, y previenen que los sistemas de reparación del ADN en la célula los procesen como ADN dañado que debe ser corregido.[43] En las células humanas, los telómeros son largas zonas de ADN de hebra sencilla que contienen algunos miles de repeticiones de una única secuencia TTAGGG.[44]

Estas secuencias ricas en guanina pueden estabilizar los extremos cromosómicos mediante la formación de estructuras de juegos apilados de unidades de cuatro bases, en lugar de los pares de bases encontrados normalmente en otras estructuras de ADN. En este caso, cuatro bases guanina forman unidades con superficie plana que se apilan una sobre otra, para formar una estructura cuádruplex-G estable.[45] Estas estructuras se estabilizan formando puentes de hidrógeno entre los extremos de las bases y la quelatación de un metal iónico en el centro de cada unidad de cuatro bases.[46] También se pueden formar otras estructuras, con el juego central de cuatro bases procedente, o bien de una hebra sencilla plegada alrededor de las bases, o bien de varias hebras paralelas diferentes, de forma que cada una contribuye una base a la estructura central.

Además de estas estructuras apiladas, los telómeros también forman largas estructuras en lazo, denominadas lazos teloméricos o lazos-T (T-loops en inglés). En este caso, las hebras simples de ADN se enroscan sobre sí mismas en un amplio círculo estabilizado por proteínas que se unen a telómeros.[47] En el extremo del lazo-T, el ADN telomérico de hebra sencilla se sujeta a una región de ADN de doble hebra porque la hebra de ADN telomérico altera la doble hélice y se aparea a una de las dos hebras. Esta estructura de triple hebra se denomina lazo de desplazamiento o lazo-D (D-loop).[45]

Hendiduras mayor y menor

Animación de la estructura de una sección de ADN. Las bases se encuentran horizontalmente entre las dos hebras en espiral. Versión ampliada[48]
Doble hélice: a) Dextrógira, b) Levógira

La doble hélice es una espiral dextrógira, esto es, cada una de las cadenas de nucleótidos gira a derechas; esto puede verificarse si nos fijamos, yendo de abajo a arriba, en la dirección que siguen los segmentos de las hebras que quedan en primer plano. Si las dos hebras giran a derechas se dice que la doble hélice es dextrógira, y si giran a izquierdas, levógira (esta forma puede aparecer en hélices alternativas debido a cambios conformacionales en el ADN). Pero en la conformación más común que adopta el ADN, la doble hélice es dextrógira, girando cada par de bases respecto al anterior unos 36º.[49]

Cuando las dos hebras de ADN se enrollan una sobre la otra (sea a derechas o a izquierdas), se forman huecos o hendiduras entre una hebra y la otra, dejando expuestos los laterales de las bases nitrogenadas del interior (ver la animación). En la conformación más común que adopta el ADN aparecen, como consecuencia de los ángulos formados entre los azúcares de ambas cadenas de cada par de bases nitrogenadas, dos tipos de hendiduras alrededor de la superfície de la doble hélice: una de ellas, la hendidura o surco mayor, que mide 22 Å (2,2 nm) de ancho, y la otra, la hendidura o surco menor, que mide 12 Å (1,2 nm) de ancho.[50] Cada vuelta de hélice, que es cuando ésta ha realizado un giro de 360º o lo que es lo mismo, de principio de hendidura mayor a final de hendidura menor, medirá por tanto 34 Å, y en cada una de esas vueltas hay unos 10,5 pb.

Hendiduras mayor y menor de la doble hélice.

La anchura de la hendidura mayor implica que los extremos de las bases son más accesibles en ésta, de forma que la cantidad de grupos químicos expuestos también es mayor lo cual facilita la diferenciación entre los pares de bases A-T, T-A, C-G, G-C. Como consecuencia de ello, también se verá facilitado el reconocimiento de secuencias de ADN por parte de diferentes proteínas sin la necesidad de abrir la doble hélice. Así, proteínas como los factores de transcripción que pueden unirse a secuencias específicas, frecuentemente contactan con los laterales de las bases expuestos en la hendidura mayor.[51] Por el contrario, los grupos químicos que quedan expuestos en la hendidura menor son similares, de forma que el reconocimiento de los pares de bases es más difícil; por ello se dice que la hendidura mayor contiene más información que la hendidura menor.[49]

Sentido y antisentido

Artículo principal: Antisentido

Una secuencia de ADN se denomina "sentido" (en inglés, sense) si su secuencia es la misma que la secuencia de un ARN mensajero que se traduce en una proteína. La secuencia de la hebra de ADN complementaria se denomina "antisentido" (antisense). En ambas hebras de ADN de la doble hélice pueden existir tanto secuencias sentido, que codifican ARNm, como antisentido, que no lo codifican. Es decir, las secuencias que codifican ARNm no están todas presentes en una sola de las hebras, sino repartidas entre las dos hebras. Tanto en procariotas como en eucariotas se producen ARNs con secuencias antisentido, pero la función de esos ARNs no está completamente clara.[52] Se ha propuesto que los ARNs antisentido están implicados en la regulación de la expresión génica mediante apareamiento ARN-ARN: los ARNs antisentido se aparearían con los ARNm complementarios, bloqueando de esta forma su traducción.[53]

En unas pocas secuencias de ADN en procariotas y eucariotas (este hecho es más frecuente en plásmidos y virus), la distinción entre hebras sentido y antisentido es más difusa, debido a que presentan genes superpuestos.[54] En estos casos, algunas secuencias de ADN tienen una función doble, codificando una proteína cuando se lee a lo largo de una hebra, y una segunda proteína cuando se lee en la dirección contraria a lo largo de la otra hebra. En bacterias, esta superposición puede estar involucrada en la regulación de la transcripción del gen,[55] mientras que en virus los genes superpuestos aumentan la cantidad de información que puede codificarse en sus diminutos genomas.[56]

Superenrollamiento

Estructura de moléculas de ADN lineales con los extremos fijos y superenrolladas. Por claridad, se ha omitido la estructura en hélice del ADN.

El ADN puede retorcerse como una cuerda en un proceso que se denomina superenrollamiento del ADN («supercoiling», en inglés). Cuando el ADN está en un estado "relajado", una hebra normalmente gira alrededor del eje de la doble hélice una vez cada 10,4 pares de bases, pero si el ADN está retorcido las hebras pueden estar unidas más estrechamente o más relajadamente.[57] Si el ADN está retorcido en la dirección de la hélice, se dice que el superenrollamiento es positivo, y las bases se mantienen juntas de forma más estrecha. Si el ADN se retuerce en la dirección opuesta, el superenrollamiento se llama negativo, y las bases se alejan. En la naturaleza, la mayor parte del ADN tiene un ligero superenrollamiento negativo que es producido por enzimas denominadas topoisomerasas.[58] Estas enzimas también son necesarias para liberar las fuerzas de torsión introducidas en las hebras de ADN durante procesos como la transcripción y la replicación.[59]

Modificaciones químicas

citosina 5-metil-citosina timina
Estructura de la citosina con y sin el grupo metilo. Tras la desaminación, la 5-metil-citosina tiene la misma estructura que la timina.

Modificaciones de bases

Véase también: Metilación

La expresión de los genes está influenciada por la forma en la que el ADN está empaquetado en cromosomas, en una estructura denominada cromatina. Las modificaciones de bases pueden estar implicadas en el empaquetamiento del ADN: las regiones que presentan una expresión génica baja o nula normalmente contienen niveles altos de metilación de las bases citosina. Por ejemplo, la metilación de citosina produce 5-metil-citosina, que es importante para la inactivación del cromosoma X.[60] El nivel medio de metilación varía entre organismos: el gusano Caenorhabditis elegans carece de metilación de citosina, mientras que los vertebrados presentan un nivel alto - hasta 1% de su ADN contiene 5-metil-citosina.[61] A pesar de la importancia de la 5-metil-citosina, ésta puede desaminarse para generar una base timina. Las citosinas metiladas son por tanto particularmente sensibles a mutaciones.[62] Otras modificaciones de bases incluyen la metilación de adenina en bacterias y la glicosilación de uracilo para producir la "base-J" en kinetoplastos.[63] [64]

Daño del ADN

Véase también: Mutación
Benzopireno, el mayor mutágeno del tabaco, unido al ADN.[65]

El ADN puede resultar dañado por muchos tipos de mutágenos, que cambian la secuencia del ADN: agentes alquilantes, además de radiación electromagnética de alta energía, como luz ultravioleta y rayos X. El tipo de daño producido en el ADN depende del tipo de mutágeno. Por ejemplo, la luz UV puede dañar al ADN produciendo dímeros de timina, que se forman por ligamiento cruzado entre bases pirimidínicas.[66] Por otro lado, oxidantes tales como radicales libres o el peróxido de hidrógeno producen múltiples daños, incluyendo modificaciones de bases, sobre todo guanina, y roturas de doble hebra (double-strand breaks).[67] En una célula humana cualquiera, alrededor de 500 bases sufren daño oxidativo cada día.[68] [69] De estas lesiones oxidativas, las más peligrosas son las roturas de doble hebra, ya que son difíciles de reparar y pueden producir mutaciones puntuales, inserciones y deleciones de la secuencia de ADN, así como translocaciones cromosómicas.[70]

Muchos mutágenos se posicionan entre dos pares de bases adyacentes, por lo que se denominan agentes intercalantes. La mayoría de los agentes intercalantes son moléculas aromáticas y planas, como el bromuro de etidio, la daunomicina, la doxorubicina y la talidomida. Para que un agente intercalante pueda integrarse entre dos pares de bases, éstas deben separarse, distorsionando las hebras de ADN y abriendo la doble hélice. Esto inhibe la transcripción y la replicación del ADN, causando toxicidad y mutaciones. Por ello, los agentes intercalantes del ADN son a menudo carcinógenos: el benzopireno, las acridinas, la aflatoxina y el bromuro de etidio son ejemplos bien conocidos.[71] [72] [73] Sin embargo, debido a su capacidad para inhibir la replicación y la transcripción del ADN, estas toxinas también se utilizan en quimioterapia para inhibir el rápido crecimiento de las células cancerosas.[74]

El daño en el ADN inicia una respuesta que activa diferentes mecanismos de reparación que reconocen lesiones específicas en el ADN, que son reparadas en el momento para recuperar la secuencia original del ADN. Asimismo, el daño en el ADN provoca una parada en el ciclo celular, que conlleva la alteración de numerosos procesos fisiológicos, que a su vez implica síntesis, transporte y degradación de proteínas (véase también Checkpoint de daños en el ADN). Alternativamente, si el daño genómico es demasiado grande para que pueda ser reparado, los mecanismos de control inducirán la activación de una serie de rutas celulares que culminarán en la muerte celular.

Funciones biológicas

Las funciones biológicas del ADN incluyen el almacenamiento de información (genes y genoma), la codificación de proteínas (transcripción y traducción) y su autoduplicación (replicación del ADN) para asegurar la transmisión de la información a las células hijas durante la división celular.

Genes y genoma

Véase también: Núcleo celular, Cromatina, Cromosoma, y Genoma

El ADN se puede considerar como un almacén cuyo contenido es la información (mensaje) necesaria para construir y sostener el organismo en el que reside, la cual se transmite de generación en generación. El conjunto de información que cumple esta función en un organismo dado se denomina genoma, y el ADN que lo constituye, ADN genómico.

El ADN genómico (que se organiza en moléculas de cromatina que a su vez se ensamblan en cromosomas) se encuentra en el núcleo celular de los eucariotas, además de pequeñas cantidades en las mitocondrias y cloroplastos. En procariotas, el ADN se encuentra en un cuerpo de forma irregular denominado nucleoide.[75]

El ADN codificante

ARN polimerasa T7 (azul) produciendo un ARNm (verde) a partir de un molde de ADN (naranja).[76]
Véase también: Gen

La información genética de un genoma está contenida en los genes, y al conjunto de toda la información que corresponde a un organismo se le denomina su genotipo. Un gen es una unidad de herencia y es una región de ADN que influye en una característica particular de un organismo (como el color de los ojos, por ejemplo). Los genes contienen un "marco de lectura abierto" (open reading frame) que puede transcribirse, además de secuencias reguladoras, tales como promotores y enhancers, que controlan la transcripción del marco de lectura abierto.

Desde este punto de vista, las obreras de este mecanismo son las proteínas. Estas pueden ser estructurales, como las proteínas de los músculos, cartílagos, pelo, etc., o funcionales, como la hemoglobina o las innumerables enzimas del organismo. La función principal de la herencia es la especificación de las proteínas, siendo el ADN una especie de plano o receta para producirlas. La mayor parte de las veces la modificación del ADN provocará una disfunción proteica que dará lugar a la aparición de alguna enfermedad. Pero en determinadas ocasiones, las modificaciones podrán provocar cambios beneficiosos que darán lugar a individuos mejor adaptados a su entorno.

Las aproximadamente treinta mil proteínas diferentes en el cuerpo humano están constituidas por veinte aminoácidos diferentes, y una molécula de ADN debe especificar la secuencia en que se unen dichos aminoácidos.

En el proceso de elaborar una proteína, el ADN de un gen se lee y se transcribe a ARN. Este ARN sirve como mensajero entre el ADN y la maquinaria que elaborará las proteínas y por eso recibe el nombre de ARN mensajero o ARNm. El ARN mensajero sirve de molde a la maquinaria que elabora las proteínas, para que ensamble los aminoácidos en el orden preciso para armar la proteína.

El dogma central de la biología molecular establecía que el flujo de actividad y de información era: ADN → ARN → proteína. No obstante, en la actualidad ha quedado demostrado que este "dogma" debe ser ampliado, pues se han encontrado otros flujos de información: en algunos organismos (virus de ARN) la información fluye de ARN a ADN; este proceso se conoce como "transcripción inversa o reversa", también llamada "retrotranscripción". Además, se sabe que existen secuencias de ADN que se transcriben a ARN y son funcionales como tales, sin llegar a traducirse nunca a proteína: son los ARN no codificantes, como es el caso de los ARN interferentes.[33] [34]

El ADN no codificante ("ADN basura")

El ADN del genoma de un organismo puede dividirse conceptualmente en dos: el que codifica las proteínas (los genes) y el que no codifica. En muchas especies, sólo una pequeña fracción del genoma codifica proteínas. Por ejemplo, sólo alrededor del 1,5% del genoma humano consiste en exones que codifican proteínas (20.000 a 25.000 genes), mientras que más del 90% consiste en ADN no codificante.[77]

El ADN no codificante (también denominado ADN basura o junk DNA) corresponde a secuencias del genoma que no generan una proteína (procedentes de transposiciones, duplicaciones, translocaciones y recombinaciones de virus, etc.), incluyendo los intrones. Hasta hace poco tiempo se pensaba que el ADN no codificante no tenía utilidad alguna, pero estudios recientes indican que eso es inexacto. Entre otras funciones, se postula que el llamado "ADN basura" regula la expresión diferencial de los genes.[78] Por ejemplo, algunas secuencias tienen afinidad hacia proteínas especiales que tienen la capacidad de unirse al ADN (como los homeodominios, los complejos receptores de hormonas esteroides, etc.), con un papel importante en el control de los mecanismos de trascripción y replicación. Estas secuencias se llaman frecuentemente "secuencias reguladoras", y los investigadores suponen que sólo se ha identificado una pequeña fracción de las que realmente existen. La presencia de tanto ADN no codificante en genomas eucarióticos y las diferencias en tamaño del genoma entre especies representan un misterio que es conocido como el "enigma del valor de C".[79] Recientemente, un grupo de investigadores de la Universidad de Yale ha descubierto una secuencia de ADN no codificante que sería la responsable de que los seres humanos hayan desarrollado la capacidad de agarrar y/o manipular objetos o herramientas.[80]

Por otro lado, algunas secuencias de ADN desempeñan un papel estructural en los cromosomas: los telómeros y centrómeros contienen pocos o ningún gen codificante de proteínas, pero son importantes para estabilizar la estructura de los cromosomas. Algunos genes no codifican proteínas, pero sí se transcriben en ARN: ARN ribosómico, ARN de transferencia y ARN de interferencia (ARNi, que son ARN que bloquean la expresión de genes específicos). La estructura de intrones y exones de algunos genes (como los de inmunoglobulinas y protocadherinas) son importantes por permitir los cortes y empalmes alternativos del pre-ARN mensajero que hacen posible la síntesis de diferentes proteínas a partir de un mismo gen (sin esta capacidad no existiría el sistema inmune, por ejemplo). Algunas secuencias de ADN no codificante representan pseudogenes que tienen valor evolutivo, ya que permiten la creación de nuevos genes con nuevas funciones.[34] Otros ADN no codificantes proceden de la duplicación de pequeñas regiones del ADN; esto tiene mucha utilidad, ya que el rastreo de estas secuencias repetitivas permite estudios sobre el linaje humano.

Transcripción y traducción

En un gen, la secuencia de nucleótidos a lo largo de una hebra de ADN se transcribe a un ARN mensajero (ARNm) y esta secuencia a su vez se traduce a una proteína que un organismo es capaz de sintetizar o "expresar" en uno o varios momentos de su vida, usando la información de dicha secuencia.

La relación entre la secuencia de nucleótidos y la secuencia de aminoácidos de la proteína viene determinada por el código genético, que se utiliza durante el proceso de traducción o síntesis de proteínas. La unidad codificadora del código genético es un grupo de tres nucleótidos (triplete), representado por las tres letras iniciales de las bases nitrogenadas (por ej., ACT, CAG, TTT). Los tripletes del ADN se transcriben en sus bases complementarias en el ARN mensajero, y en este caso los tripletes se denominan codones (para el ejemplo anterior, UGA, GUC, AAA). En el ribosoma cada codón del ARN mensajero interacciona con una molécula de ARN de transferencia (ARNt o tRNA) que contenga el triplete complementario, denominado anticodón. Cada ARNt porta el aminoácido correspondiente al codón de acuerdo con el código genético, de modo que el ribosoma va uniendo los aminoácidos para formar una nueva proteína de acuerdo con las "instrucciones" de la secuencia del ARNm. Existen 64 codones posibles, por lo cual corresponde más de uno para cada aminoácido; algunos codones indican la terminación de la síntesis, el fin de la secuencia codificante; estos codones de terminación o codones de parada son UAA, UGA y UAG (en inglés, nonsense codons o stop codons).[33]


Replicación del ADN

Esquema representativo de la replicación del ADN.