Python és un llenguatge de programació d'alt nivell i propòsit general molt utilitzat en la ciència, l'anàlisi de dades i la intel.ligència artificial.
Exercicis de realització i verificació de consultes amb tests a un fitxer CSV (Comma Separated Value) amb publicacions científiques (pel mòdul de bioinformàtica).
Numpy és una biblioteca que ens permet gestionar matrius, tipat estàtic i realitzar càlculs científics. Moltes llibreries potents de Pyhton requereixen importar Numpy.
Matplotlib és una llibreria de baix nivell que serveix per dibuixar figures, funcions i tot tipus de gràfiques en imatges estàtiques. Funciona molt bé amb qualsevol estructura de dades de Python.
Pandas és una biblioteca que proporciona estructures de dades tabulades que gestionin grans volums de dades de forma eficient. Permet ordenar, agrupar i obtenir estadístiques fàcilment. Juntament amb altres llibreries, permet visualitzar dades amb gràfics i mapes útils i atractius.
Estadística descriptiva, mesures de centralització, dispersió, outliers, correlació entre variables i corbes distribució. Amb gràfics en Seaborn per il·lustrar tots els conceptes.
Polars ofereix un rendiment superior a Pandas al tractar DataFrames de gran tamany, especialment en consultes. Per provar-ho usarem el terminal de Linux o de Windows per filtrar fitxers, de text pla i tamany superior a 5 MB.