Pandas er et open source Python-bibliotek, der hovedsageligt bruges til datamanipulation og -analyse. Det er bygget oven på NumPy-biblioteket og giver højtydende, brugervenlige datastrukturer og dataanalyseværktøjer til Python-programmeringssproget.

I denne artikel lærer du, hvordan du udfører 6 grundlæggende handlinger ved hjælp af Pandas.

Brug af eksempler på pandaer

Du kan køre eksemplerne i denne artikel ved at bruge computernotesbøger som Jupyter notesbog, Google Colab, etc. Du kan også køre eksemplerne ved at indtaste koden direkte i Python-fortolkeren i interaktiv tilstand.

Hvis du vil have et kig på den komplette kildekode, der bruges i denne artikel, kan du få adgang til Python Notebook-filen fra denne GitHub-depot.

1. Sådan importeres pandaer som pd og udskriver versionsnummeret

Du skal bruge importere nøgleord for at importere ethvert bibliotek i Python. Pandaer importeres typisk under pd alias. Med denne tilgang kan du henvise til Pandas-pakken som pd i stedet for pandaer.

instagram viewer
importer pandaer som pd
print (pd.__version__)

Produktion:

1.2.4

2. Sådan opretter du en serie i Pandas

Pandas-serien er et endimensionelt array, der indeholder data af enhver type. Det er som en kolonne i en tabel. Du kan oprette en serie ved hjælp af numpy-arrays, numpy-funktioner, lister, ordbøger, skalarværdier osv.

Seriens værdier er mærket med deres indeksnummer. Som standard har den første værdi indeks 0, den anden værdi har indeks 1, og så videre. For at navngive dine egne etiketter skal du bruge indeks argument.

Sådan opretter du en tom serie

s = pd. Serie (dtype='float64')
s

Produktion:

Series([], dtype: float64)

I ovenstående eksempel er en tom serie med flyde datatype oprettes.

Sådan opretter du en serie ved hjælp af NumPy Array

importer pandaer som pd
import numpy som np
d = np.array([1, 2, 3, 4, 5])
s = pd. Serie (d)
s

Produktion:

0 1
1 2
2 3
3 4
4 5
dtype: int32

Relaterede: NumPy Operations for begyndere

Sådan opretter du en serie ved hjælp af liste

d = [1, 2, 3, 4, 5]
s = pd. Serie (d)
s

Produktion:

0 1
1 2
2 3
3 4
4 5
dtype: int64

Sådan opretter du en serie med indeks

For at oprette en serie med et indeks skal du bruge indeks argument. Antallet af indekser skal være lig med antallet af elementer i serien.

d = [1, 2, 3, 4, 5]
s = pd. Serier (d, indeks=["én", "to", "tre", "fire", "fem")])
s

Produktion:

en 1
to 2
tre 3
fire 4
fem 5
dtype: int64

Sådan opretter du en serie ved hjælp af ordbog

Nøglerne til ordbogen bliver seriens etiketter.

d = {"en": 1,
"to": 2,
"tre": 3,
"fire": 4,
"fem": 5}
s = pd. Serie (d)
s

Produktion:

en 1
to 2
tre 3
fire 4
fem 5
dtype: int64

Sådan opretter du en serie ved hjælp af skalarværdi

Hvis du vil oprette en serie ved hjælp af en skalarværdi, skal du angive indeks argument.

s = pd. Serie (1, indeks = ["a", "b", "c", "d")])
s

Produktion:

en 1
b 1
c 1
d 1
dtype: int64

3. Sådan opretter du en dataramme i Pandas

En DataFrame er en todimensionel datastruktur, hvor data er justeret i form af rækker og kolonner. En DataFrame kan oprettes ved hjælp af ordbøger, lister, en liste over ordbøger, numpy arrays osv. I den virkelige verden oprettes DataFrames ved hjælp af eksisterende lager som CSV-filer, Excel-filer, SQL-databaser osv.

DataFrame-objektet understøtter en række attributter og metoder. Hvis du vil vide mere om dem, kan du tjekke den officielle dokumentation af pandas dataramme.

Sådan opretter du en tom dataramme

df = pd. DataFrame()
print (df)

Produktion:

Tom DataFrame
Kolonner: []
Indeks: []

Sådan opretter du en dataramme ved hjælp af liste

listObj = ["MUO", "teknologi", "forenklet"]
df = pd. DataFrame (listObj)
print (df)

Produktion:

 0
0 MUO
1 teknologi
2 forenklet

Sådan opretter du en dataramme ved hjælp af ordbog over ndarray/lister

batmanData = {'Movie Name': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
'År for udgivelse': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
print (df)

Produktion:

 Filmens navn Udgivelsesår
0 Batman begynder 2005
1 The Dark Knight 2008
2 The Dark Knight Rises 2012

Sådan opretter du en dataramme ved hjælp af liste over lister

data = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (data, kolonner = ['Navn', 'Rulle nr.'])
print (df)

Produktion:

 Navnerulle nr.
0 Alex 601
1 Bob 602
2 Cataline 603

Sådan opretter du en dataramme ved hjælp af liste over ordbøger

data = [{'Navn': 'Alex', 'Rulle nr.': 601},
{'Navn': 'Bob', 'Rulle nr.': 602},
{'Navn': 'Cataline', 'Rulle nr.': 603}]
df = pd. DataFrame (data)
print (df)

Produktion:

 Navnerulle nr.
0 Alex 601
1 Bob 602
2 Cataline 603

Relaterede: Sådan konverteres en liste til en ordbog i Python

Sådan opretter du en dataramme ved hjælp af zip()-funktionen

Brug zip() funktion til at flette lister i Python.

Navn = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = liste (zip (navn, rullenr))
df = pd. DataFrame (listOfTuples, columns = ['Navn', 'Rulle nr.'])
print (df)

Produktion:

 Navnerulle nr.
0 Alex 601
1 Bob 602
2 Cataline 603

4. Sådan læser du CSV-data i Pandas

En "kommaseparerede værdier" (CSV) fil er en afgrænset tekstfil, der bruger et komma til at adskille værdier. Du kan læse en CSV-fil ved hjælp af read_csv() metode i pandaer. Hvis du vil udskrive hele DataFrame, skal du bruge to_string() metode.

I dette og de næste eksempler, dette CSV-fil vil blive brugt til at udføre operationerne.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.to_string())

Produktion:

5. Sådan analyseres datarammer ved hjælp af metoderne head(), tail() og info().

Sådan får du vist data ved hjælp af head()-metoden

Det hoved() metode er en af ​​de bedste måder at få et hurtigt overblik over DataFrame. Denne metode returnerer overskriften og det angivne antal rækker, startende fra toppen.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.hoved (10))

Produktion:

Hvis du ikke angiver antallet af rækker, vil de første 5 rækker blive returneret.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.head())

Produktion:

Sådan får du vist data ved hjælp af tail()-metoden

Det hale() metoden returnerer overskriften og det angivne antal rækker, startende fra bunden.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.tail (10))

Produktion:

Hvis du ikke angiver antallet af rækker, vil de sidste 5 rækker blive returneret.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.tail())

Produktion:

Sådan får du information om data

Det info() metoder returnerer en kort oversigt over en DataFrame, inklusive indekset dtype og kolonne dtypes, ikke-nul værdier og hukommelsesbrug.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.info())

Produktion:

6. Sådan læser du JSON-data i Pandas

JSON (JavaSskript Object Notation) er et let dataudvekslingsformat. Du kan læse en JSON-fil ved hjælp af read_json() metode i pandaer. Hvis du vil udskrive hele DataFrame, skal du bruge to_string() metode.

I nedenstående eksempel er dette JSON-fil bruges til at udføre operationerne.

Relaterede: Hvad er JSON? En Lægmands Oversigt

df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
print (df.to_string())

Produktion:

Opdater din Python-viden med indbyggede funktioner og metoder

Funktioner hjælper med at forkorte din kode og forbedre dens effektivitet. Funktioner og metoder som f.eks reducere(), dele(), opregne(), eval(), rund(), etc. kan gøre din kode robust og let at forstå. Det er altid godt at vide om indbyggede funktioner og metoder, da de i høj grad kan forenkle dine programmeringsopgaver.

DelTweetE-mail
20 Python-funktioner, du bør kende

Python Standard Library indeholder mange funktioner til at hjælpe med dine programmeringsopgaver. Lær om det mest nyttige og opret mere robust kode.

Læs Næste

Relaterede emner
  • Programmering
  • Python
  • Web-udvikling
  • Programmering
  • Dataanalyse
Om forfatteren
Yuvraj Chandra (69 artikler udgivet)

Yuvraj er en bachelorstuderende i datalogi ved University of Delhi, Indien. Han er passioneret omkring Full Stack Web Development. Når han ikke skriver, udforsker han dybden af ​​forskellige teknologier.

Mere fra Yuvraj Chandra

Abonner på vores nyhedsbrev

Tilmeld dig vores nyhedsbrev for tekniske tips, anmeldelser, gratis e-bøger og eksklusive tilbud!

Klik her for at abonnere