Nucleic acid

L'ADN és el material genètic dels organismes vius

Introducció

Els àcids nucleics són biomolècules orgàniques encarregades d’emmagatzemar i difondre la informació genètica. Hi ha dos tipus fonamentals d’àcids nucleics, l’àcid desoxiribonucleic (ADN), i l’àcid ribonucleic (ARN).

Els àcids nucleics són macromolècules compostes d’unitats anomenades nucleòtids.

Hi ha dos tipus: àcid desoxirribonucleic (ADN) i àcid ribonucleic (ARN).

ADN

L’ADN és el material genètic dels organismes vius, des dels bacteris unicel·lulars fins als mamífers multicel·lulars com tu i jo.

Alguns virus utilitzen l’ARN com el seu material genètic, però no es consideren éssers vius, ja que no es poden reproduir sense l’ajuda d’un hoste.

L’ADN es divideix en cromosomes, i cada cromosoma pot contenir desenes de milers de gens.

En organimes procariotes, com els bacteris, l’ADN es troba en una regió especialitzada de la cèl·lula anomenada nucleoide, i els cromosomes són molt més petits i sovint circulars (en forma d’anell).

En cèl·lules eucariotes, com les de les plantes i animals, l’ADN es troba al nucli, una càmera especialitzada envoltada de membrana dins de la cèl·lula, així com en certs tipus diferents d’orgànuls (com els mitocondris i els cloroplasts de les plantes).

Gen

Encara que l’ADN sigui enorme, nomeś una part és codificant, i un dels reptes dels bioinformàtics es descobrir aquells segments d’ADN que proporcionen instruccions sobre com fer un producte particular que necessita la cèl·lula.

L’ADN no s’utilitza directament, sinó que es fan còpies en ARN de la part que codifica el gen cada cop que es necessita.

Molts gens indiquen la seqüència d’aminoàcids que es fan servir per sintetitzar una proteïna en un ribosoma mitjançant ARN missatger (ARNm).

Com hem dit abans, no tots els gens codifiquen per a productes proteics.

A continuació tens alguns exemples de diferents tipus d’ARN:

ARN ribosòmic (ARNr): Serveix com a component estructural dels ribosomes
ARN de transferència (ARNt). Són molècules d’ARN en forma de trèvol que transporten aminoàcids al ribosoma per a la síntesi de proteïnes.
Micro ARN (coneguts com a miRNA). Actuen com a reguladors d’altres gens.

Nucleòtids

L’ADN i l’ARN són polímers (en el cas de l’ADN solen ser polímers molt llargs) i es componen de monòmers coneguts com nucleòtids (A,C,G…). Quan aquests monòmers es combinen, la cadena resultant es diu polinucleòtid (poli- = “molts”).

Cada nucleòtid es compon de tres parts:

Un sucre de cinc carbonis que té una posició central.
Una estructura anular que conté nitrogen anomenada base nitrogenada.
Almenys un grup fosfat.

La molècula de sucre té una posició central al nucleòtid, la base es connecta a un dels seus carbonis i el grup (o grups) fosfat, a un altre. Vegem cada part d’un nucleòtid alhora.

Imatge dels components de l’ADN i l’ARN, que inclouen el sucre (desoxiribosa o ribosa), el grup fosfat i la base nitrogenada. Les bases comprenen les bases pirimidines que tenen un anell (citosina i timina a l’ADN, i uracil a l’ARN) i les bases purines amb dos anells (adenina i guanina). El grup fosfat s’uneix al carboni 5’. El carboni 2’ té un grup hidroxil a la ribosa, però només hidrogen (no hidroxil) a la desoxiribosa.

Bases nitrogenades

Les bases nitrogenades dels nucleòtids són molècules orgàniques (basades en carboni), compostes per estructures anulars que contenen nitrogen. Per què es diuen bases? Atès que alguns dels nitrogens de la base poden protonar-se (rebre un ió H+), les bases nitrogenades disminueixen la concentració d’ions hidrogen en una solució i per tant són bases en el sentit àcid-base.

Cada nucleòtid a l’ADN conté una de quatre possibles bases nitrogenades: adenina (A), guanina (G) citosina (C) i timina (T).

L’adenina i la guanina són purines, el que significa que les seves estructures contenen dos anells fusionats de carboni i nitrogen.

En canvi, la citosina i la timina són pirimidines i tenen només un anell de carboni i nitrogen.

Els nucleòtids d’ARN també poden contenir bases d’adenina, guanina i citosina, però tenen una altra base tipus pirimidina anomenada uracil (U) en lloc de la timina. Com es mostra a la figura anterior, cada base té una estructura única, amb el seu conjunt de grups funcionals units a l’estructura anular.

Com a abreviatures a la biologia molecular, les bases nitrogenades se solen anomenar pels seus símbols d’una lletra: A, T, G, C i U.

L’ADN conté A, T, G i C, mentre que l’ARN conté A, U, G i C (és a dir, la U s’intercanvia per T).

Els sucres

A més de tenir conjunts de bases lleugerament diferents, els nucleòtids d’ADN i ARN també tenen sucres lleugerament diferents. El sucre de cinc carbonis de l’ADN s’anomena desoxiribosa, mentre que a l’ARN el sucre és la ribosa. Aquestes dues molècules són semblants en estructura, només amb una diferència: el segon carboni de la ribosa té un grup hidroxil, mentre que el carboni equivalent a la desoxiribosa té un hidrogen al seu lloc.

Els àtoms de carboni d’una molècula de sucre es numeren 1’, 2’, 3’, 4’ i 5’ (1’ es llegeix “una cosina”), com es mostra a la figura anterior.

En un nucleòtid, el sucre ocupa la posició central, la base s’uneix al carboni 1’ i el grup (o grups) fosfat s’uneix al carboni 5’.

El fosfat

Els nucleòtids només poden tenir un grup fosfat o una cadena de fins a tres grups fosfat que s’uneixen al carboni 5’ del sucre. Algunes fonts d’informació química utilitzen el terme “nucleòtid” només per al cas d’un fosfat, però en biologia molecular s’accepta generalment la definició més àmplia.

En una cèl·lula, el nucleòtid que cal afegir al final d’una cadena de polinucleòtids contindrà una sèrie de tres grups fosfat. Quan el nucleòtid s’uneix a la cadena creixent d’ADN o ARN perd dos grups fosfat. Per tant, en una cadena d’ADN o ARN, cada nucleòtid només té un grup fosfat.

Cadenes de polinucleòtids

Una conseqüència de l’estructura dels nucleòtids és que una cadena de polinucleòtids té direccionalitat, és a dir té dos extrems que són diferents entre si.

Al extrem 5’, o inici de la cadena, sobresurt el grup fosfat unit al carboni 5’ del primer nucleòtid. A l’altre extrem, anomenat extrem 3’, està exposat l’hidroxil unit al carboni 3’ de l’últim nucleòtid.

Les seqüències d’ADN generalment s’escriuen a l’adreça 5’ a 3’, cosa que significa que el nucleòtid de l’extrem 5’ és el primer i el nucleòtid de l’extrem 3’ és l’últim.

Conforme s’agreguen nous nucleòtids a una cadena d’ADN o ARN, aquesta creix a l’extrem 3’, quan s’uneix el fosfat 5′ del nucleòtid entrant al grup hidroxil a l’extrem 3’ de la cadena. Això produeix una cadena on cada sucre s’uneix als seus veïns per una sèrie d’enllaços anomenats enllaços fosfodièster.

Característiques de l’ADN

A l’àcid desoxiribonucleic, o ADN, les cadenes es troben normalment en una doble hèlix, una estructura en què dues cadenes aparellades (complementàries) s’uneixen entre si, com es mostra al diagrama.

Les dues cadenes de l’hèlix corren en adreces oposades, cosa que significa que l’extrem 5′ d’una cadena s’uneix al extrem 3′ de la seva cadena corresponent. Això es coneix com a orientació antiparal·lela i és important a l’hora de replicar l’ADN.

Aleshores, dues bases qualsevol poden decidir unir-se i formar un parell a la doble hèlix? La resposta és un no definitiu. A causa de les mides i els grups funcionals de les bases, l’aparellament de les bases és summament específic: A només es pot unir amb T i G només es pot unir amb C, com es mostra a continuació.

Per exemple, si sabeu que la seqüència d’una cadena és 5'-AATTGGCC-3', la cadena complementària ha de tenir la seqüència 3'-TTAACCGG-5'.

Això permet a cada base unir-se amb la parella: els parells A-T estan units per dos ponts d’hidrogen i els parells G-C per tres.

Es diu que dues seqüències d’ADN són complementaris quan les seves bases poden aparellar-se i unir-se entre si de forma antiparal·lela, formant una hèlix.

Les cadenes d’ADN s’uneixen en una doble hèlix de cadenes antiparal·leles mitjançant ponts d’hidrogen entre les bases complementàries. La timina forma dos ponts d’hidrogen amb l’adenina i la guanina forma tres ponts d’hidrogen amb la citosina.

Replicació de l’ADN.

La replicació de l'ADN és el procés pel qual es produeix a partir d’una molècula original d’ADN dues còpies idèntiques. La replicació té lloc en tots els organismes vius i és la base biològica de l’herència, és a dir, que és la molècula que serà transmesa a la descendència.

Durant la replicació de l’ADN, la doble hèlix es divideix en dues parts: les bases nitrogenades de cada meitat s’acoblen amb la base homòloga, formant així la cadena mancant. Això vol dir que cada una de les cadenes originals servirà de motlle per la síntesi d’una nova cadena.

Aquest fet assegura una alta fidelitat en la replicació, així com facilita la correcció d’errors que es poguessin donar durant la replicació.

Una mutació és un error en l’aparellament de bases. Per exemple, a la seqüència AATTGGCC, una mutació pot fer que la segona T canviï a una G. La majoria de vegades quan això succeeix l’ADN és capaç de fixar-se i tornar la base original a la seqüència.

No obstant això, de vegades la reparació no té èxit, cosa que resulta en la creació de diferents proteïnes.

Característiques de l’ARN

Estructura de l’ARN:
- L’ARN és monocatenari amb ribosa com a sucre.
- Té bases nitrogenades A, U, G, C.
Tipus d’ARN:
- ARN missatger (ARNm):
  - Serveix com a intermediari entre un gen i la seva proteïna.
  - Es transcriu a partir de l’ADN substituint T per U.
  - L’ARNm interactua amb el ribosoma per sintetitzar proteïnes a partir de codons (grups de tres nucleòtids).
- ARN ribosòmic (ARNr):
  - Component essencial dels ribosomes.
  - Pot actuar com a enzim (ribozima), catalitzant la unió d’aminoàcids en proteïnes.
- ARN de transferència (ARNt):
  - Porta aminoàcids al ribosoma segons la seqüència de l’ARNm.
  - Té una estructura tridimensional complexa per la seva funció.
- ARN regulatori:
  - Inclou miRNA i siRNA, que regulen l’expressió gènica.
  - S’uneixen a l’ARNm per reduir-ne la traducció o estabilitat.
  - Poden estar relacionats amb malalties com el càncer.

Cada vegada hi ha més evidència que els miRNA i altres ARN petits, no codificants, participen en certes malalties humanes, com en alguns trastorns genètics i tipus de càncer.

A més, els investigadors estan desenvolupant microARN artificials que serveixen com a eines terapèutiques en el tractament de malalties humanes.

Aquests són només alguns exemples d’ARN reguladors. Hi ha molts altres i, amb el temps, se segueixen descobrint més.

Aplicacions i Perspectives

El coneixement dels diferents tipus d’ARN està avançant, amb la descoberta de nous tipus com ARNlnc i piRNA.
Els microARN artificials s’estan desenvolupant per al tractament de trastorns genètics i càncers.

Aquest resum sintetitza els punts principals i facilita la comprensió del tema! 😊

Activitat Biopython

Introducció

El projecte Biopython és una col·lecció de codi obert d’eines Python no comercials per a la biologia computacional i la bioinformàtica, possiblement la més reconeguda en Python. Ha estat creada per una associació internacional de desenvolupadors.

Conté classes per representar seqüències biològiques i anotacions de seqüències, i és capaç de llegir i escriure en una varietat de formats de fitxer. També permet un mitjà programàtic d’accés a bases de dades en línia d’informació biològica, com les de NCBI.

Els mòduls separats amplien les capacitats de Biopython a l’alinement de seqüències, BLAST, estructura de proteïnes, genètica de poblacions, filogenètica, motius de seqüències i aprenentatge automàtic.

La documentació oficial de la versió més recent de Biopython la pots trobar a:

API Biopython, lastest version

Instal·lació

Per agilitzar la sessió, clona el repositori git que hem preparat i segueix les instruccions del readme.md

shell

git clone https://gitlab.com/xtec/bio/biopython-api.git

En cas que vulguis instal·lar i usar Biopython en un projecte de Python i Poetry existent usa la comanda:

shell

poetry install
poetry add biopython

Si vols, pots recordar com funciona el gestor de paquets i entorns Poetry:

Seq

L’objecte Seq és el mecanisme de Biopython per tractar les seqüències, que són essencialment “strings” de lletres com AGTACACTGGT.

La diferència més important entre els objectes Seq i els string estàndard de Python és que tenen mètodes diferents.

Encara que l’objecte Seq admet molts dels mateixos mètodes que un simple string, el mètode translate() de Seq és diferent perquè fa una traducció biològica, com també hi ha mètodes addicionals biològicament rellevants com reverse_complement().

Crea un fitxer app/sequence.py.

En molts aspectes podem tractar els objectes Seq com si fossin “strings” normals de Python, per exemple, obtenint la longitud o iterant sobre els elements:

python

from Bio.Seq import Seq

seq = Seq("GATCG")
for index, letter in enumerate(seq):
    print("%i %s" % (index, letter))
print(len(seq))

El resultat obtingut és:

shell

miqamorosal/biopython-api$ python3 app/sequence.py 
0 G
1 A
2 T
3 C
4 G
5

Estàs llegint una vista prèvia.

Inicia sessió amb Google per llegir la pàgina completa. Segueix l'itinerari d'aprenentatge — cada pàgina es desbloqueja quan has llegit les que la precedeixen. L'alumnat i el professorat llegeixen les pàgines del seu curs sense límit.

Inicia sessió

Nucleic acid

#Introducció

#ADN

#Gen

#Nucleòtids

#Bases nitrogenades

#Els sucres

#El fosfat

#Cadenes de polinucleòtids

#Característiques de l’ADN

#Replicació de l’ADN.

#Característiques de l’ARN

#Aplicacions i Perspectives

#Activitat Biopython

#Introducció

#Instal·lació

#Seq

Introducció

ADN

Gen

Nucleòtids

Bases nitrogenades

Els sucres

El fosfat

Cadenes de polinucleòtids

Característiques de l’ADN

Replicació de l’ADN.

Característiques de l’ARN

Aplicacions i Perspectives

Activitat Biopython

Introducció

Instal·lació

Seq