Informàtica mèdica

Anàlisis de dades

Numpy

Numpy és una biblioteca que ens permet gestionar matrius, tipat estàtic i realitzar càlculs científics. Moltes llibreries potents de Pyhton requereixen importar Numpy.

Matplotlib

Matplotlib és una biblioteca que serveix per dibuixar figures, funcions i tot tipus de gràfiques en imatges estàtiques.

Estadística

Estadística descriptiva, mesures de centralització, dispersió, outliers, correlació entre variables i corbes distribució. Amb gràfics per il·lustrar tots els conceptes.

Pandas

Pandas proporciona estructures de dades tabulades per a gestionar grans volums de dades de forma eficient. Permet ordenar, agrupar i obtenir estadístiques fàcilment.

Polars

Polars is an open-source library for data manipulation, known for being one of the fastest data processing solutions on a single machine. It features a well-structured, typed API that is both expressive and easy to use.

Patito

Patito offers a simple way to declare pydantic data models which double as schema for your polars data frames.

Plotly

Plotly és una llibreria per generar gràfics interactius amb JavaScript.

Ciències òmiques

Àcids nucleics i proteïnes

Àcids nucleics

Els àcids nucleics, i l'ADN en particular, són macromolècules que tenen tota la informació sobre com i quan s'han de construiïr les proteines.

Expressió gènica

L’expressió gènica és el procés mitjançant el qual la informació continguda en els gens d'una seqüència d'ADN es transcriu en RNA i, posteriorment, es tradueix en proteïnes funcionals, proporcionant una visió detallada del comportament molecular dels gens en diferents condicions i contextos biològics.

Formats de seqüències

Treballarem amb els formats textuals de seqüenciació d'ADN, ARN i proteïnes més habituals en bioinformàtica, el FASTA i el Genbank; i també repassarem d'altres de coneguts.

Entrez

Entrez és un motor de cerca de l'institució pública NCBI que integra diverses bases de dades de ciències de la salut. Ofereix de manera gratuïta molta informació genòmica d'alt rendiment, a través de la API anonimitzada d'Entrez.

Proteines

Les proteïnes són una de les molècules orgàniques més abundants en els sistemes vius i són molt més diverses en estructura i funció que altres classes de macromolècules. Totes les proteïnes es componen d'una o més cadenes d'aminoàcids.

Análisis de seqüències

Alineamiento de secuencias

El alineamiento de secuencias es un método computacional que permite inferir información biológica sólo a partir de la información que tienen las secuencias.

Blast

Blast és l'eina principal de l'NCBI per comparar una seqüència d’ADN o proteïna amb altres seqüències de diverses bases de dades