Pandas er et open source Python-bibliotek, der hovedsageligt bruges til datamanipulation og -analyse. Det er bygget oven på NumPy-biblioteket og giver højtydende, brugervenlige datastrukturer og dataanalyseværktøjer til Python-programmeringssproget.
I denne artikel lærer du, hvordan du udfører 6 grundlæggende handlinger ved hjælp af Pandas.
Brug af eksempler på pandaer
Du kan køre eksemplerne i denne artikel ved at bruge computernotesbøger som Jupyter notesbog, Google Colab, etc. Du kan også køre eksemplerne ved at indtaste koden direkte i Python-fortolkeren i interaktiv tilstand.
Hvis du vil have et kig på den komplette kildekode, der bruges i denne artikel, kan du få adgang til Python Notebook-filen fra denne GitHub-depot.
1. Sådan importeres pandaer som pd og udskriver versionsnummeret
Du skal bruge importere nøgleord for at importere ethvert bibliotek i Python. Pandaer importeres typisk under pd alias. Med denne tilgang kan du henvise til Pandas-pakken som pd i stedet for pandaer.
importer pandaer som pd
print (pd.__version__)
Produktion:
1.2.4
2. Sådan opretter du en serie i Pandas
Pandas-serien er et endimensionelt array, der indeholder data af enhver type. Det er som en kolonne i en tabel. Du kan oprette en serie ved hjælp af numpy-arrays, numpy-funktioner, lister, ordbøger, skalarværdier osv.
Seriens værdier er mærket med deres indeksnummer. Som standard har den første værdi indeks 0, den anden værdi har indeks 1, og så videre. For at navngive dine egne etiketter skal du bruge indeks argument.
Sådan opretter du en tom serie
s = pd. Serie (dtype='float64')
s
Produktion:
Series([], dtype: float64)
I ovenstående eksempel er en tom serie med flyde datatype oprettes.
Sådan opretter du en serie ved hjælp af NumPy Array
importer pandaer som pd
import numpy som np
d = np.array([1, 2, 3, 4, 5])
s = pd. Serie (d)
s
Produktion:
0 1
1 2
2 3
3 4
4 5
dtype: int32
Relaterede: NumPy Operations for begyndere
Sådan opretter du en serie ved hjælp af liste
d = [1, 2, 3, 4, 5]
s = pd. Serie (d)
s
Produktion:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Sådan opretter du en serie med indeks
For at oprette en serie med et indeks skal du bruge indeks argument. Antallet af indekser skal være lig med antallet af elementer i serien.
d = [1, 2, 3, 4, 5]
s = pd. Serier (d, indeks=["én", "to", "tre", "fire", "fem")])
s
Produktion:
en 1
to 2
tre 3
fire 4
fem 5
dtype: int64
Sådan opretter du en serie ved hjælp af ordbog
Nøglerne til ordbogen bliver seriens etiketter.
d = {"en": 1,
"to": 2,
"tre": 3,
"fire": 4,
"fem": 5}
s = pd. Serie (d)
s
Produktion:
en 1
to 2
tre 3
fire 4
fem 5
dtype: int64
Sådan opretter du en serie ved hjælp af skalarværdi
Hvis du vil oprette en serie ved hjælp af en skalarværdi, skal du angive indeks argument.
s = pd. Serie (1, indeks = ["a", "b", "c", "d")])
s
Produktion:
en 1
b 1
c 1
d 1
dtype: int64
3. Sådan opretter du en dataramme i Pandas
En DataFrame er en todimensionel datastruktur, hvor data er justeret i form af rækker og kolonner. En DataFrame kan oprettes ved hjælp af ordbøger, lister, en liste over ordbøger, numpy arrays osv. I den virkelige verden oprettes DataFrames ved hjælp af eksisterende lager som CSV-filer, Excel-filer, SQL-databaser osv.
DataFrame-objektet understøtter en række attributter og metoder. Hvis du vil vide mere om dem, kan du tjekke den officielle dokumentation af pandas dataramme.
Sådan opretter du en tom dataramme
df = pd. DataFrame()
print (df)
Produktion:
Tom DataFrame
Kolonner: []
Indeks: []
Sådan opretter du en dataramme ved hjælp af liste
listObj = ["MUO", "teknologi", "forenklet"]
df = pd. DataFrame (listObj)
print (df)
Produktion:
0
0 MUO
1 teknologi
2 forenklet
Sådan opretter du en dataramme ved hjælp af ordbog over ndarray/lister
batmanData = {'Movie Name': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
'År for udgivelse': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
print (df)
Produktion:
Filmens navn Udgivelsesår
0 Batman begynder 2005
1 The Dark Knight 2008
2 The Dark Knight Rises 2012
Sådan opretter du en dataramme ved hjælp af liste over lister
data = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (data, kolonner = ['Navn', 'Rulle nr.'])
print (df)
Produktion:
Navnerulle nr.
0 Alex 601
1 Bob 602
2 Cataline 603
Sådan opretter du en dataramme ved hjælp af liste over ordbøger
data = [{'Navn': 'Alex', 'Rulle nr.': 601},
{'Navn': 'Bob', 'Rulle nr.': 602},
{'Navn': 'Cataline', 'Rulle nr.': 603}]
df = pd. DataFrame (data)
print (df)
Produktion:
Navnerulle nr.
0 Alex 601
1 Bob 602
2 Cataline 603
Relaterede: Sådan konverteres en liste til en ordbog i Python
Sådan opretter du en dataramme ved hjælp af zip()-funktionen
Brug zip() funktion til at flette lister i Python.
Navn = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = liste (zip (navn, rullenr))
df = pd. DataFrame (listOfTuples, columns = ['Navn', 'Rulle nr.'])
print (df)
Produktion:
Navnerulle nr.
0 Alex 601
1 Bob 602
2 Cataline 603
4. Sådan læser du CSV-data i Pandas
En "kommaseparerede værdier" (CSV) fil er en afgrænset tekstfil, der bruger et komma til at adskille værdier. Du kan læse en CSV-fil ved hjælp af read_csv() metode i pandaer. Hvis du vil udskrive hele DataFrame, skal du bruge to_string() metode.
I dette og de næste eksempler, dette CSV-fil vil blive brugt til at udføre operationerne.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.to_string())
Produktion:
5. Sådan analyseres datarammer ved hjælp af metoderne head(), tail() og info().
Sådan får du vist data ved hjælp af head()-metoden
Det hoved() metode er en af de bedste måder at få et hurtigt overblik over DataFrame. Denne metode returnerer overskriften og det angivne antal rækker, startende fra toppen.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.hoved (10))
Produktion:
Hvis du ikke angiver antallet af rækker, vil de første 5 rækker blive returneret.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.head())
Produktion:
Sådan får du vist data ved hjælp af tail()-metoden
Det hale() metoden returnerer overskriften og det angivne antal rækker, startende fra bunden.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.tail (10))
Produktion:
Hvis du ikke angiver antallet af rækker, vil de sidste 5 rækker blive returneret.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.tail())
Produktion:
Sådan får du information om data
Det info() metoder returnerer en kort oversigt over en DataFrame, inklusive indekset dtype og kolonne dtypes, ikke-nul værdier og hukommelsesbrug.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.info())
Produktion:
6. Sådan læser du JSON-data i Pandas
JSON (JavaSskript Object Notation) er et let dataudvekslingsformat. Du kan læse en JSON-fil ved hjælp af read_json() metode i pandaer. Hvis du vil udskrive hele DataFrame, skal du bruge to_string() metode.
I nedenstående eksempel er dette JSON-fil bruges til at udføre operationerne.
Relaterede: Hvad er JSON? En Lægmands Oversigt
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
print (df.to_string())
Produktion:
Opdater din Python-viden med indbyggede funktioner og metoder
Funktioner hjælper med at forkorte din kode og forbedre dens effektivitet. Funktioner og metoder som f.eks reducere(), dele(), opregne(), eval(), rund(), etc. kan gøre din kode robust og let at forstå. Det er altid godt at vide om indbyggede funktioner og metoder, da de i høj grad kan forenkle dine programmeringsopgaver.
Python Standard Library indeholder mange funktioner til at hjælpe med dine programmeringsopgaver. Lær om det mest nyttige og opret mere robust kode.
Læs Næste
- Programmering
- Python
- Web-udvikling
- Programmering
- Dataanalyse

Yuvraj er en bachelorstuderende i datalogi ved University of Delhi, Indien. Han er passioneret omkring Full Stack Web Development. Når han ikke skriver, udforsker han dybden af forskellige teknologier.
Abonner på vores nyhedsbrev
Tilmeld dig vores nyhedsbrev for tekniske tips, anmeldelser, gratis e-bøger og eksklusive tilbud!
Klik her for at abonnere