Artikel i Næste knap: 899988
Jupyter Notebook er det førende værktøj til dataforskere. Det tilbyder en interaktiv webgrænseflade, der kan bruges til datavisualisering, nem analyse og samarbejde.
Datavisualisering giver dig mulighed for at finde kontekst til dine data gennem kort eller grafer. Denne tutorial giver en indsigtsfuld guide til interaktion med grafer i Jupyter Notebook.
Forudsætninger
Du skal har Jupyter installeret på din maskine. Hvis det ikke er det, kan du installere det ved at indtaste følgende kode i din kommandolinje:
$ pip installer jupyter
Du skal også bruge pandaer og matplotlib bibliotek:
$ pip installere pandaer
$ pip installer matplotlib
Når installationen er færdig, skal du starte Jupyter Notebook-serveren. Skriv kommandoen nedenfor i din terminal for at gøre det. En Jupyter-side, der viser filer i det aktuelle bibliotek, åbnes i din computers standardbrowser.
$ jupyter notesbog
Bemærk: Luk ikke terminalvinduet, hvor du kører denne kommando. Din server stopper, hvis du gør det.
Simpel plot
Kør denne kode på en ny Jupyter-side:
importer matplotlib.pyplot som plt
x = [1,2,3,4,5,6,7,8]
y = [2,4,6,8,10,12,14,16]
plt.plot (x, y)
plt.show ()
Koden er til et simpelt linjediagram. Første linje importerer pyplot grafbibliotek fra matplotlib API. Den tredje og fjerde linie definerer henholdsvis x- og y-akserne.
Det grund() metode kaldes til at plotte grafen. Det at vise() metoden bruges derefter til at vise grafen.
Antag at du i stedet ønsker at tegne en kurve. Processen er den samme. Du skal bare ændre værdierne for python-liste for y-aksen.
importer matplotlib.pyplot som plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt.plot (x, y)
plt.show ()
Bemærk noget vigtigt: i begge grafer er der ingen eksplicit skala-definition. Skalaen beregnes automatisk og anvendes. Dette er en af de mange interessante funktioner, som Juypter tilbyder, som kan få dig til at fokusere på dit arbejde (dataanalyse) i stedet for at bekymre dig om kode.
Hvis du også er opmærksom, kan du bemærke, at antallet af værdier for x- og y-akserne er det samme. Hvis nogen af dem er mindre end den anden, markeres en fejl, når du kører koden, og der vises ingen graf.
Tilgængelige typer
I modsætning til linjegrafen og kurven ovenfor skal andre grafvisualiseringer (f.eks. Et histogram, søjlediagram osv.) Defineres eksplicit for at blive vist.
Søjlediagram
For at vise et barplot skal du bruge bar() metode.
importer matplotlib.pyplot som plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt.bar (x, y)
plt.show ()
Scatter Plot
Alt du skal gøre er at bruge sprede() metode i den forrige kode.
importer matplotlib.pyplot som plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt. spredning (x, y)
plt.show ()
Lagkagediagram
Et cirkeldiagram er lidt anderledes end resten ovenfor. Linje 4 er af særlig interesse, så kig på funktionerne der.
figenstørrelse bruges til at indstille formatforholdet. Du kan indstille dette til alt, hvad du kan lide (f.eks. (9,5)), men de officielle Pandas-dokumenter anbefaler, at du bruger billedformatet 1.
importer matplotlib.pyplot som plt
x = [4,9,16,25,36]
fig = plt. figur (figsize = (9, 5)) # linje 4
plt.pie (x)
plt.show ()
Der er nogle parametre, som cirkeldiagrammet har, der er bemærkelsesværdige:
etiketter - Dette kan bruges til at give en etiket til hvert udsnit i cirkeldiagrammet.
farver - Dette kan bruges til at give foruddefinerede farver til hver af skiverne. Du kan angive farver både i tekstform (f.eks. “Gul”) eller i hexadecimal form (f.eks. "# Ebc713").
Se eksemplet nedenfor:
importer matplotlib.pyplot som plt
x = [4,9,16,25,36]
fig = plt. figur (figsize = (5.5, 5.5))
plt.pie (x, labels = ("Guavaer", "Bær", "Mango", "Æbler", "Avocado"),
farver = ("# a86544", "# eb5b13", "# ebc713", "# bdeb13", "# 8aeb13"))
plt.show ()
Der er også andre grunde som hist, areal og kde at du kan læs mere om Pandas-dokumenter.
Plotformatering
I plottene ovenfor er der ingen aspekter såsom etiketter. Sådan gør du det.
For at tilføje en titel skal du medtage koden nedenfor i din Jupyter Notebook:
matplotlib.pyplot.title ("Min graftitel")
X- og y-akserne kan mærkes henholdsvis nedenfor:
matplotlib.pyplot.xlabel ("min x-akselabel")
matplotlib.pyplot.ylabel ("min y-aksemærkning")
Lær mere
Du kan køre Hjælp() kommando i din notesbog for at få interaktiv hjælp til Jupyter-kommandoer. For at få mere information om et bestemt objekt kan du bruge hjælp (objekt).
Du finder det også en god praksis at prøve at tegne grafer ved hjælp af datasæt fra csvfiles. At lære at visualisere data er et kraftfuldt værktøj til at kommunikere og analysere dine fund, så det er værd at tage lidt tid på at opbygge din færdighed.
Til avanceret dataanalyse er Python bedre end Excel. Sådan importeres dine Excel-data til et Python-script ved hjælp af Pandas!
Læs Næste
- Programmering
- Python
- Kodning Tutorials
- Dataanalyse
Jerome er Staff Writer hos MakeUseOf. Han dækker artikler om programmering og Linux. Han er også en kryptoentusiast og holder altid styr på kryptoindustrien.
Abonner på vores nyhedsbrev
Deltag i vores nyhedsbrev for tekniske tip, anmeldelser, gratis e-bøger og eksklusive tilbud!
Et trin mere !!!
Bekræft din e-mail-adresse i den e-mail, vi lige har sendt dig.