Protein - Aminoacids

Els aminoàcids són els monòmers que componen les proteïnes.

Introducció

Els aminoàcids són els components moleculars més petits que donen forma a les proteïnes, i estan formats per àtoms de carboni, nitrogen, hidrogen i oxigen.

Així mateix, alguns, com la metionina i cisteïna, contenen sofre.

Els aminoàcids provenen del procés de transcripció de l’ADN a ARNm i la traducció posterior que efectuen els ribosomes (part fonamental de la cel·lula).

Si tens curiositat sobre aquest procés pots consultar gene expression.


Estructura

Els aminoàcids comparteixen una estructura bàsica comuna que consisteix:

  • àtom central de carboni, també anomenat carboni alfa (α)
  • un grup amino (–NH₂⁺)
  • un grup carboxil (COOH)
  • un àtom d'hidrogen.

A més a més, tenen un grup R (un element o mol·lecula enllaçada), que és el que canvia d’un aminoàcid a un altre.

En el cas de l’aminoàcid Glicina el grup R és només un àtom d’Hidrogen (el més petit) i en canvi poden haver grups R més grans com el de la Prolina (C₅H₉NO₂).

Encara que aquest dibuix els grups amino i carboxil es presenten com a neutrals per simplificar, en realitat no és l’estat en què es troben normalment els aminoàcids.

En l’ambient aquós de la cèl·lula, a pH fisiològic (7.2-7.4), tant el grup amino com el grup carboxil s’ionitzen sota condicions fisiològiques.

  • El seu grup amino recull un altre hidrogen i una càrrega positiva (-NH3+)

  • L’hidroxil en el seu grup carboxil perdria un hidrogen i guanyaria una càrrega negativa (-COO).


Aminoàcids proteics

Existeixen 20 aminoàcids que es troben en les proteïnes, 9 dels quals són essencials, la qual cosa es refereix al al seu cos no pot produir-los per si mateix i, per tant, han de ser obtinguts a través de la dieta.

Els 20 aminoàcids comuns (amb les seves propietats) es mostren a la taula següent.

Les propietats de la cadena lateral determinen el comportament químic d’un aminoàcid (és a dir, si es considera àcid, bàsic, polar o no polar).

Per exemple, els aminoàcids com la Valina (V) i la Leucina(L) són no polars i hidrofòbics (no volen aigua), mentre que els aminoàcids com la Serina (S) i la Glutamina tenen cadenes laterals hidrofíliques (necessiten aigua) i són polars.

Alguns aminoàcids, com ara la Lisina (K) i l’Arginina (R), tenen cadenes laterals que estan carregades positivament a pH fisiològic i es consideren aminoàcids bàsics. (la Histidina (H) de vegades es considera dins aquest grup també, encara que està majoritàriament desprotonada a pH fisiològic).

L’Aspartat (D) i el Glutamat (E), per contra, estan carregats negativament a pH fisiològic i es consideren àcids.

Hidrofòbia i hidrofília

Tots els aminoàcids són o bé hidrofòbics o bé hidrofílics.

Quan una cadena d’aminoàcids entra en aigua (és a dir, a la vida real):

  • els hidrofòbics fugen de l’aigua → se’n van cap a dins.

Són tots els de la categoria de No polars: Val, Leu, Ile, Met, Ala, Phe, Trp, Pro.

  • els hidrofílics busquen l’aigua → es queden a fora. Són els de les altres 3 categories.

👉 Això fa que la proteïna es doblegui sola, per pura física (la natura és molt pràctica).

Grup R

Alguns altres aminoàcids tenen grups R amb propietats especials, que demostraran la seva importància quan vegem l’estructura de les proteïnes:

La prolina té un grup R que està unit al propi grup amino, formant una estructura anular. Així, la prolina és una excepció a l’estructura típica d’un aminoàcid, ja que no té el grup amino habitual NH3+.

Si creus que aquesta estructura anul·lar es veu una mica rara, tens raó: la prolina sovint provoca que les cadenes d’aminoàcids es dobleguin o torcin.

La cisteïna conté un grup tiol (-SH) i pot formar enllaços covalents amb altres cisteïnes. Aquests enllaços s’anomenen ponts de disulfur.

Anem a veure un exemple en la insulina humana:

Aminoàcids no canònics

A més dels 20 aminoàcids comuns, en certes condicions podem trobar aminoàcids “no canònics” en les proteïnes.

  1. La N-formilmetionina (abreujada fMet) sol ser el primer aminoàcid de les cadenes de proteïnes produïdes per bacteris. És semblant en estructura a la metionina, però amb un grup que conté oxigen afegit al grup amino.

  2. La pirrolisina s’assembla a la lisina, però té un grup addicional que conté un anell unit a l’extrem del grup R. La pirrolisina es troba principalment en les proteïnes de microorganismes anomenats arqueobacteris metanògens (productor de metà).

  3. La selenocisteïna es troba en molts tipus diferents d’organismes, entre ells els éssers humans, i s’utilitza per formar les proteïnes que contenen seleni.

El seleni és altament reactiu, així que aquest aminoàcid s’ha de tractar amb cura: s’especifica al codi genètic i s’afegeix a les cadenes de proteïnes d’una manera diferent d’un aminoàcid normal.

En l’àmbit estructural, la selenocisteïna es veu igual a una cisteïna, però amb un grup –SeH en lloc del grup –SH.


Enllaç peptídic

Els aminoàcids d’un polipèptid s’uneixen als veïns mitjançant un enllaç covalent conegut com a enllaç peptídic, que es forma en una reacció de síntesi per deshidratació (condensació).

Quan els número d’AA(aminoàcids) és inferior de 10 AA es parla d’oligopèptid, quan conté entre 10 y 50 AA és un polipèptid i si el número és major normalment es tracta de proteïnes.

Tal com pots veure en el dibuix, durant la síntesi de proteïnes, el grup carboxil de l’aminoàcid al final de la cadena polipeptídica creixent reacciona amb el grup amino d’un aminoàcid entrant, alliberant una molècula d’aigua, i es crea un enllaç C-N:

Els aminoàcids s’uneixen entre si per formar una cadena – el grup carboxil d’un aminoàcid s’uneix al grup amino d’un altre, formant un enllaç peptídic (també anomenat enllaç amina). Aquests són exemples d’enllaços químics covalents, i són estables. Quan dos aminoàcids s’uneixen, la reacció allibera una molècula d’aigua. Aquest tipus de reacció s’anomena reacció de condensació. La hidròlisi és la inversa de la reacció de condensació, i implica trencar l’enllaç peptídic utilitzant una molècula d’aigua.

En resum:

  1. Tenim dos aminoàcids.
  2. El –COO⁻ d’un reacciona amb el –NH₃⁺ de l’altre.
  3. Se’n va una molècula d’aigua (H₂O) → condensació.
  4. Es forma un enllaç peptídic (C–N).

Direccionalitat

Com has pogut veure a les imatges, la unió entre dos aminoàcids només es pot fer entre el grup amino d’un aminoàcid i el grup carboni de l’altre.

Per tant, una cadena polipeptídica té direccionalitat: té dos extrems diferents entre ells en l’àmbit químic:

  1. En un extrem, el polipèptid té un grup amino lliure, anomenat amino terminal (o extrem N-terminal).

  2. L’altre extrem, que té un grup carboxil lliure, es coneix com a carboxil terminal (o extrem C-terminal).


Llistat aminoàcids.


Obtenció de proteïnes.

A nivell informàtic, les cadenes d’aminoàcids que formen les proteïnes es poden trobar en diversos bancs de dades obertes, entre els quals destaquem:

PDB (Protein Data Bank)

  • Base de dades internacional mantinguda principalment per RCSB PDB, amb col·laboració global.
  • Emmagatzema estructures tridimensionals de proteïnes i àcids nucleics.
  • Representació dels aminoàcids: 3 lletres per residu (ex.: ALA, GLY, LYS)
  • Serveix per:
    • Visualitzar proteïnes en 3D amb eines com PyMOL.
    • Estudiar llocs actius, interaccions amb fàrmacs i química molecular.
    • Analitzar formes, distàncies i orientacions dels àtoms.
  • Ideal per l’estudi de fàrmacs, on la estructura és clau per entendre la funció i disseny de fàrmacs.

Treballem amb PDB a la següent sessió:

UniProt

  • Base de dades internacional gestionada per un consorci europeu, nord-americà.
  • Conté seqüències de proteïnes i anotacions funcionals (dominis, variants, mutacions).
  • Representació dels aminoàcids: 1 lletra per aminoàcid (ex.: MKTAYIAKQRQISFVKSHFSRQLEERLGLIEVQAN)
  • Serveix per:
    • Identificar proteïnes i les seves característiques, per exemple la longitud o estadístiques d’aparició de cada aminoàcid.
    • Comparar seqüències entre espècies o famílies.
    • Treballs de programació i bioinformàtica.
  • No mostra estructura 3D; només informació textual i seqüencial.

Obtenir la cadena d’aminoàcids d’una proteïna amb Uniprot és molt fàcil:

Pots fer consultes d’un o més resultats a la pàgina o bé cercar una proteïna pel seu codi (propi d’Uniprot).

Per exemple, anem a consultar la Hemoglobina Beta en els humans, que s’encarrega de transportar oxigen a la sang.

Si vols descarregar-la per treballar amb ella el més habitual és refer la url per a que et retorni el format textual .fasta

La URL et retornarà aquest fitxer:

Terminal window
>sp|P12345|AATM_RABIT Aspartate aminotransferase, mitochondrial OS=Oryctolagus cuniculus OX=9986 GN=GOT2 PE=1 SV=2
MALLHSARVLSGVASAFHPGLAAAASARASSWWAHVEMGPPDPILGVTEAYKRDTNSKKM
NLGVGAYRDDNGKPYVLPSVRKAEAQIAAKGLDKEYLPIGGLAEFCRASAELALGENSEV
VKSGRFVTVQTISGTGALRIGASFLQRFFKFSRDVFLPKPSWGNHTPIFRDAGMQLQSYR
YYDPKTCGFDFTGALEDISKIPEQSVLLLHACAHNPTGVDPRPEQWKEIATVVKKRNLFA
FFDMAYQGFASGDGDKDAWAVRHFIEQGINVCLCQSYAKNMGLYGERVGAFTVICKDADE
AKRVESQLKILIRPMYSNPPIHGARIASTILTSPDLRKQWLQEVKGMADRIIGMRTQLVS
NLKKEGSTHSWQHITDQIGMFCFTGLKPEQVERLTKEFSIYMTKDGRISVAGVTSGNVGY
LAHAIHQVTK

La primera linia, la que comença per > conté una descripció breu de la cadena.

A partir de la segona línia tenim la seqüència d’aminoàcids, normalment separada per espais \n per facilitar la lectura.

Activitat.

La web ja informa de quants AA (aminoàcids) té la cadena però podem obtenir més informació amb Python.

Crea un projecte en Python o utilitza un d’existent.

Recorda com crear-lo amb uv i editar-lo amb Pycharm.

uv init demopdb
cd demopdb
pycharm .

Crea i executa aquest codi en un script python, es pot dir uniprotdemo.py:

import urllib.request
import os
uniprot_id = "P12345" # substitueix pel teu codi UniProt
url = f"https://rest.uniprot.org/uniprotkb/{uniprot_id}.fasta"
fasta_file = f"{uniprot_id}.fasta"
# Descarreguem el fasta en cas de no existir.
if not os.path.exists(fasta_file):
try:
urllib.request.urlretrieve(url, fasta_file)
print(f"Descarrega completada: {fasta_file}")
except Exception as e:
print(f"Error descarregant el fitxer: {e}")
exit(1)
# Obrim el fitxer fasta en mode lectura.
with open(fasta_file, "r") as f:
fasta_text = f.read()
# Separem les línies
lines = fasta_text.splitlines()
# La primera línia és la capçalera
header = lines[0]
# La resta són la seqüència, la concatenem sense espais ni salts de línia.
sequence = "".join(lines[1:])
# Comptar la longitud és molt senzill.
longitud = len(sequence)
# Mostrem resultats
print(f"Capçalera: {header}")
print(f"Seqüència: {sequence}")
print(f"Longitud: {len(sequence)}")

Obtindrás el següent resultat:

Terminal window
Capçalera: >sp|P12345|AATM_RABIT Aspartate aminotransferase, mitochondrial OS=Oryctolagus cuniculus OX=9986 GN=GOT2 PE=1 SV=2
Seqüència: MALLHSARVLSGVASAFHPGLAAAASARASSWWAHVEMGPPDPILGVTEAYKRDTNSKKMNLGVGAYRDDNGKPYVLPSVRKAEAQIAAKGLDKEYLPIGGLAEFCRASAELALGENSEVVKSGRFVTVQTISGTGALRIGASFLQRFFKFSRDVFLPKPSWGNHTPIFRDAGMQLQSYRYYDPKTCGFDFTGALEDISKIPEQSVLLLHACAHNPTGVDPRPEQWKEIATVVKKRNLFAFFDMAYQGFASGDGDKDAWAVRHFIEQGINVCLCQSYAKNMGLYGERVGAFTVICKDADEAKRVESQLKILIRPMYSNPPIHGARIASTILTSPDLRKQWLQEVKGMADRIIGMRTQLVSNLKKEGSTHSWQHITDQIGMFCFTGLKPEQVERLTKEFSIYMTKDGRISVAGVTSGNVGYLAHAIHQVTK
Longitud: 430

Activitat amb terminal de Linux.

Si no tens Python però et trobes a Linux pots aconseguir els mateixos resultats amb aquestes comandes:

Descarrega el fitxer:

Terminal window
wget https://rest.uniprot.org/uniprotkb/P12345.fasta

Llegeix la capçalera:

Terminal window
grep "^>" P12345.fasta

Llegeix el que NO és la capçalera, la seqüència:

Terminal window
grep -v "^>" P12345.fasta | tr -d '\n'

Obtenir longitud:

Terminal window
grep -v "^>" P12345.fasta | tr -d '\n' | wc -c

Explicació de les comandes:

  • grep mostra únicament les línies del fitxer que segueixen un patró.
  • grep -v mostra les que NO segueixen el patró!
  • El patró grep conté la expressió regular ”^>”, que filtra les linies que comencen pel símbol >(la capçalera)
  • La comanda tr la úsem per eliminar els salts de línia.
  • wc - c serveix per comptar els caràcters.

Observacions.

Hi ha fitxers fasta que poden tenir moltes cadenes >, anomenats multifasta. Tractar-los se surt del proposit de l’activitat.


TODO

Cal simplificar el material de la activitat Uniprot per a què sigui amigable per alumnes de 1r curs: