Pandas
Pandas proporciona estructures de dades tabulades per a gestionar grans volums de dades de forma eficient. Permet ordenar, agrupar i obtenir estadístiques fàcilment.
Introducció
PENDET d’eliminar
DataFrames
Ja estàs familiaritzat amb Series, una estructura de dades unidimensional en pandas. Ara, coneixeràs una altra estructura de dades clau de pandas, que s’anomena DataFrame.
DataFrame és una taula amb columnes. De la mateixa manera que cada element d’un objecte Series està etiquetat amb un índex, cada fila d’un DataFrame està etiquetat amb un índex.
Aquí teniu un exemple d’un objecte DataFrame que emmagatzema informació sobre quatre estudiants:
| | | | |
||
| | | | |
| | | | |
| | | | |
| | | | |
Aquest DataFrame té tres columnes, és a dir First Name, Family Name, i Age.
Les quatre files estan etiquetades amb índexs 0, 1, 2, 3.
D’acord, però com el creem?
Creació d’un DataFrame: lectura d’un fitxer csv.
Guardar DataFrame a fitxer: escriptura de dades.
Hi ha un (diversos) mètodes anàlegs als que hem vist per guardar els resultats dels nostres dataFrames a fitxers; i comencen per to. Veiem com funciona el to_csv
El fitxer csv contindria:
,,
,,
,,
,,
,,El codi que usarem per llegir el fitxer i escriure’n un de nou.
# Llegim fitxer csv a dataframe.
: =
# Canviem dades de la primera estudiant.
=
=19
# Escrivim dataframe cap a fitxer csv a pandas
En principi s’haura de crear el nou fitxer amb el contingut; i el que es guarda és el següent (hem canviat cognom i edat de la primera estudiant).
El paràmetre index=False l’hem posat perquè no ens cal guardar l’index automàtic
del DataFrame.
,,
,,
,,
,,
,,You're reading a preview.
Sign in to read the full article. Any account opens 10 free articles a month; students and teachers read their course pages without limit.
Sign in