PyMOL és un sistema de visualització molecular
Introducció
PyMOL és una eina molt útil per interactuar, inspeccionar i analitzar l’estructura 3D d’una proteïna.
Tot i que PyMOL té una interfície potent i flexible, és complexa i pot semblar aclaparadora per als nous usuaris.
El poder complet de PyMOL s’obté quan fas servir la línia de comandes, però avui no entrarem en això.
Instal·la PyMOL al teu ordinador personal
Instal·la Pymol a la teva carpeta d’usuari (no necessites permisos d’administrador):
Invoke-WebRequest https://github.com/kullik01/pymol-open-source-windows-setup/releases/download/v3.1.0/PyMOL_Open_source_v3.1.0a0_WINx64_portable.zip -OutFile PyMOL.zip
Expand-Archive -Path PyMOL.zip -DestinationPath $env:USERPROFILE\PyMol
Executa el programa Open-Source-PyMOL.exe
que es troba a la carpeta PyMOL
.
apt install pymol
Primers Passos
Començaràs a aprendre sobre PyMOL observant l’enzim lisozima d’ou de gallina en complex amb l’inhibidor trisacàrid tri-(N-acetilglucosamina) o tri-NAG (consulta un text de bioquímica si vols saber més sobre la lisozima). Les coordenades atòmiques d’aquest model es troben al fitxer del Protein Data Bank amb el codi 1HEW.
El primer pas és carregar el teu fitxer PDB: Fitxer > Obtenir PDB… i escull 1HEW.
Ara hauries d’estar veient un model de línies verdes, blaves i vermelles sobre un fons negre.
Aquesta representació en brut és poc útil, ja que és difícil determinar les regions importants d’una estructura. Intenta trobar l’inhibidor, que està compost per tres anells en forma de cadira de N-acetilglucosa. No és fàcil, però a mesura que avancem en el tutorial, aprendràs com presentar la informació clarament.
Prova de rotar i fer zoom:
Rotar | Prem i mantén el botó esquerre del ratolí i mou el ratolí |
Apropar i allunyar | Prem i mantén el botó dret del ratolí i mou el ratolí |
Roda del ratolí | Desplaça per veure la vista “slab” de la molècula canviar. La vista “slab” et permet mirar dins d’una molècula de proteïna. |
Panell d’objectes
Alternativament, mira el quadre inferior dret del panell d’objectes per veure les comandes basades en el ratolí.
Aquí es descriuen opcions i comandes addicionals disponibles quan s’utilitza el ratolí conjuntament amb el teclat.
És important que et familiaritzis amb l’ús dels botons de comanda principals en el panell d’objectes, ja que s’utilitzen per accedir als menús desplegables contextuals.
Aquests estan etiquetats com:
A | Acció | Permet realitzar diverses accions, anàlisis i càlculs |
S | Mostrar | Permet aplicar un efecte gràfic particular a una selecció de residus/molècules |
H | Amagar | Igual que S però amaga l’efecte gràfic |
L | Etiqueta | Permet afegir una etiqueta |
C | Color | Altera l’esquema de colors d’una selecció o objecte particular |
Utilitzant el botó esquerre del ratolí, pots accedir als menús desplegables. Prem cada un dels botons i observa el següent nivell de comandes.
Prova el següent:
1HEW | H > cartoon | La representació de cartoon verda desapareix |
1HEW | S > lines | Ara veus la representació de línies |
1HEW | H > waters | Les creus vermelles, que són molècules d’aigua, desapareixen |
És important tenir en compte que cada un dels botons es pot aplicar a diversos aspectes dels fitxers pdb segons les regions/cadenes/residus que formen una selecció particular.
Les pestanyes per defecte són:
all | refers to all atoms, including multiple PDB files if present |
1HEW | refers to all the atoms in a particular PDB file, namely the PDB loaded |
(sele) | refers to the atoms in a particular selection. |
all | es refereix a tots els àtoms, inclosos múltiples fitxers PDB si n’hi ha |
1HEW | es refereix a tots els àtoms d’un fitxer PDB particular, en aquest cas el PDB carregat |
(sele) | es refereix als àtoms en una selecció particular |
També pots utilitzar les pestanyes individuals per alternar la vista de la teva estructura. Prova de prémer la pestanya all
en gris. La pestanya es tornarà negra i l’estructura desapareixerà.
Prem la pestanya una altra vegada i el quadre es tornarà gris i la teva estructura tornarà a aparèixer. Recorda que aquestes pestanyes són jeràrquiques, així que si tens una selecció particular de residus dins d’un fitxer PDB, alterar el fitxer PDB principal afectarà les seleccions relacionades amb aquest fitxer PDB. Ho veurem més endavant.
De vegades és més fàcil veure la proteïna sobre un fons blanc. Això és especialment important quan prepares imatges per a publicacions. Per tant, per canviar el fons a blanc: Display > Background > White
Panell de seqüència
El següent pas és mostrar la seqüència al panell de seqüència. Per fer això, prem el botó S
a la part inferior dreta de la pantalla (no el botó S
descrit anteriorment).
A sobre de la finestra principal de l’estructura de la proteïna, apareixerà text – aquesta és la seqüència de les proteïnes més altres “lletres”.
Utilitzant la barra de desplaçament, desplaça’t cap a la dreta per veure la resta de la seqüència de la proteïna i les altres lletres. El NAG són les unitats individuals de l’inhibidor trisacàrid i les O vermelles són les molècules d’aigua, comunament presents en estructures determinades per cristal·lografia de raigs X. Tot i que les aigües poden jugar un paper important en l’estructura i funció de les proteïnes, potser voldrem eliminar-les si cal. Podem amagar-les (vegeu més amunt) o eliminar-les completament. Les eliminarem per poder generar imatges fàcilment.
all ‘A’ > remove waters
Una manera molt senzilla de generar una figura útil per a publicació és provar el següent:
1HEW ‘A’ > preset > publication.
Si ho proves, observa com l’inhibidor trisacàrid es fa visible. Per tornar a la configuració anterior 1HEW ‘A’ > preset > default i repeteix els passos anteriors.
Selecció i visualització
Per entendre i transmetre els elements essencials de la relació estructura-funció de les proteïnes, és important que se seleccionin i es destaquin els residus/regions individuals.
Hi ha diverses opcions predeterminades disponibles. Ja n’hem vist una (publication) anteriorment.
1HEW | C > by ss | Color per estructura secundària (selecciona una de les opcions) |
1HEW | S > spheres | Veure els àtoms segons el radi de van der Waals |
1HEW | S > surface | Veure la representació de la superfície de la proteïna – observa com es veuen les unitats NAG. |
A cada pas, recorda moure l’estructura. Per a la comprensió i presentació, és important que seleccionis l’aspecte de visualització correcte.
Prova altres opcions de presentació possibles per a la teva proteïna.
Seleccions definides i generació de noves pestanyes al panell d’objectes
Per seleccionar residus/regions, interactuarem amb el panell de seqüència a sobre de l’estructura principal de la proteïna.
- Canvia el color de tota la seqüència a verd (1HEW ‘C’ > greens > green)
- Mostra només el cartoon (1HEW ‘H’ > everything seguit de 1HEW ‘S’ > cartoon)
- Selecciona un residu al panell de seqüència, per exemple cys30 (C abans del 31).
Apareix una nova pestanya sota 1HEW al panell d’objectes anomenada (sele), el nom predeterminat per a una nova selecció.
Nota que el residu seleccionat està ressaltat al panell de seqüència i apareixen punts vermells a la posició ocupada pel residu en l’estructura de la proteïna. Pots alternar entre seleccionar i desseleccionar el residu prement el botó esquerre del ratolí mentre el cursor està sobre el residu al panell de seqüència.
Canvia el nom de sele a Cys30 escollint (sele) ‘A’ > rename selection.
La selecció sota 1HEW ara és (Cys30).
Mentre t’assegures que l’objecte 1HEW està ressaltat, mostra Cys30 com a esferes i acoloreix-lo per color d’àtom:
Cys30 ‘S’ > Spheres i després (Cys30) ‘C’ > by element.
Alterna tant la pestanya (Cys30) com la pestanya 1HEW al panell d’objectes.
Per veure només el residu Cys30, amaga la representació cartoon de 1HEW (1HEW ‘H’ > cartoon). Només hauries de veure Cys30.
Centra en Cys30: (Cys30) ‘A’ > center. Apropa’t i mou-te al voltant. El punt focal de l’estructura ara està centrat en Cys30.
Per veure això clarament en el context de tota l’estructura de la proteïna, mostra la resta de 1HEW: 1HEW ‘S’ > cartoon. La representació cartoon hauria de reaparèixer. Repeteix el procediment de center però a la pestanya 1HEW i allunya’t per veure tota la proteïna. Ara amaga les esferes de (Cys30): (Cys30) ‘H’ > spheres
Desactiva la pestanya Cys30 – això és important perquè si no qualsevol selecció addicional s’afegirà a aquest panell. Practica seleccionant residus i canviant el nom predeterminat (sele).
Exercici: Ressalta una hèlix (NOTA si acoloreixes la proteïna per estructura secundària, el panell de seqüència canviarà de color per reflectir el seu color en l’estructura. Els residus en una hèlix es colorejaran en vermell o cian). Pots seleccionar (o deseleccionar) un residu individual o una sèrie de residus mantenint el dit sobre el botó esquerre del ratolí i arrossegant. Un cop facis una nova selecció, observa que apareix una nova pestanya (sele) sota (Cys30).
Hi ha moltes opcions disponibles – et suggereixo que les provis.
Recorda: Desa la teva sessió. Intenta desar-la com una sessió separada després de cada secció.
Visualització d’interaccions
Com determinats residus interaccionen amb altres residus dins d’una proteïna o amb altres proteïnes o molècules són aspectes importants per definir tant l’estructura com la funció.
Per demostrar com es pot utilitzar PyMOL per analitzar i il·lustrar aquestes interaccions, analitzarem la selecció de l’inhibidor trisacàrid i mostrarem com interacciona amb la lisozima. Aquest és un exemple de com podem obtenir informació molecular sobre les interaccions que defineixen els efectes funcionals.
Una manera fàcil de manipular el segment inhibidor independentment de la proteïna és separar-lo com un nou objecte (a diferència d’una selecció de residus descrita abans). Això ens permetrà manipular-lo independentment de 1HEW
.
Primer, elimina qualsevol selecció (sele) del panell dret ((sele) ‘A’ > delete selection). Desplaça’t a la dreta del panell de seqüència i selecciona els 3 residus NAG. Aquests haurien de formar la nova selecció (sele). Canvia el nom a Inhib com s’ha descrit anteriorment.
Extreu la selecció (Inhib) a un nou objecte de la següent manera: (Inhib) ‘A’ > extract object. S’hauria de generar un nou obj01 sota (Inhib). A més, hi haurà una nova seqüència sota 1HEW al panell de seqüència.
Canvia el nom de obj01 a Inhib (obj1 ‘A’ > rename object).
Ara observem l’inhibidor en si mateix. Acoloreix 1HEW amb un color uniforme a la teva elecció (això també afectarà (Cys30) ja que forma part de 1HEW
).
Mostra Inhib com a sticks (Inhib ‘S’ > sticks). Acoloreix segons element (hi ha diverses opcions per al color del carboni, però el gris sol ser el predeterminat). Assegura’t que sigui diferent del que has escollit per a 1HEW
perquè els dos objectes siguin fàcilment identificables. Inhib ‘C’ > by element.
Rota i mou l’estructura al voltant
Ara analitzarem el complex inhibidor-proteïna per determinar els residus de la proteïna que interaccionen amb una unitat de l’inhibidor trisacàrid. Primer selecciona NAG201 (la primera unitat NAG) del panell de seqüència i canvia el seu nom a NAG201 ((sele) ‘A’ > rename selection).
Troba els residus que probablement fan contacte amb NAG201 mitjançant NAG201 ‘A’ > modify > expand > by 4 Å, residues. Això afegirà a la selecció NAG201
qualsevol residu dins dels 4 Å. Dins d’aquest rang de distància, aquests residus estan essencialment en contacte amb NAG201.
Els residus recentment seleccionats s’afegeixen a la selecció original (NAG201). Per tant, canvia el nom d’aquesta a NAG-interact ((NAG201) ‘A’ > rename selection). Potser voldràs regenerar (NAG201) creant una nova selecció amb només NAG201 seleccionat (vegeu més amunt). Això és important per calcular les interaccions (vegeu més avall).
TODO
Docking
En la consola de PyMOL (o script):
fetch 5HFA, async=0
Seleccionar y extraer solo la cadena A
# Seleccionar solo la cadena A
select chain_A, chain A
# Eliminar todo excepto la cadena A
remove not chain A
Eliminar cofactores y ligandos
Los ligandos y cofactores usualmente no son cadenas proteicas estándar (A, B, etc.), sino heteroátomos. Para eliminarlos:
# Eliminar heteroátomos (ligandos, iones, cofactores, etc.)
remove hetatm
# Alternativa más específica:
remove resn HOH # elimina agua
remove not polymer # elimina todo lo que no sea una cadena polimérica (como proteínas o ADN)
Tendrás un archivo PDB que contiene solo la cadena A de la acetilcolinesterasa, sin ligandos ni cofactores, listo para análisis estructural, modelado o docking.
Aquí tienes dos versiones para automatizar el proceso: una en formato PyMOL script (.pml) y otra en Python (.py) si usas PyMOL con su API en modo scripting.
Opción 1: Script .pml (para cargar directamente en PyMOL GUI)
Guarda esto como limpiar_acetilcolinesterasa.pml:
# Descargar y cargar la estructura de la acetilcolinesterasa
fetch 1EVE, async=0
# Seleccionar y conservar solo la cadena A
select cadena_A, chain A
remove not chain A
# Eliminar heteroátomos (ligandos, cofactores, agua, etc.)
remove hetatm
# Guardar el resultado limpio
save acetilcolinesterasa_chainA_clean.pdb
Abre PyMOL.
En la consola escribe:
@limpiar_acetilcolinesterasa.pml
Opción 2: Script en Python usando la API de PyMOL (.py)
Guarda esto como limpiar_acetilcolinesterasa.py y ejecútalo si tienes PyMOL instalado con acceso a su API (como con PyMOL Open-Source o usando pymol -cq):
from pymol import cmd
# Cargar estructura desde el PDB
cmd.fetch("1EVE", async_=0)
# Eliminar todo excepto la cadena A
cmd.remove("not chain A")
# Eliminar heteroátomos (ligandos, cofactores, agua)
cmd.remove("hetatm")
# Guardar solo la cadena A limpia
cmd.save("acetilcolinesterasa_chainA_clean.pdb")
Ejecuta en terminal (con PyMOL instalado):
pymol -cq limpiar_acetilcolinesterasa.py
remove water molecules and salts like Na⁺ and Cl⁻
remove resn HOH or resn WAT
remove elem Na
remove elem Cl
remove ligans:
awk '!/^HETATM/' Complex.pdb > protein.pdb