Kan du huske de dage, hvor du brugte en fysisk globus eller scannede gennem en stor tung bog for at finde navnene på forskellige regioner og lande? Med fremskridt inden for teknologi, især internettet, er al denne information nu tilgængelig ved et klik på en knap.
Men hvad nu hvis du ville tage det et skridt videre og finde væsentlige data om et land, såsom dets hovedstad, geografiske koordinater eller valuta? Led ikke længere end Pythons fantastiske Country Info-modul, som kan klare opgaven på få sekunder.
Hvad er CountryInfo-modulet?
Porimol Chandro udviklede Landeoplysninger modul. Det har funktioner til at hente et lands hovedstad, geografiske koordinater, tidszone, område, befolkning og mere.
For at installere dette modul skal du åbne din terminal og udføre:
pip installere landeinfo
Du kan også hente live vejrdata for ethvert land eller område og brug det sammen med informationen og forbedre dit datasæt.
Sådan bruger du modulets funktioner
Du kan hente information ved hjælp af de forskellige funktioner i Landeinfo modul som følger.
1. Få de alternative navne eller stavemåder for et land
Du kan hente de alternative navne eller stavemåder for et land som sådan:
fra landeinfo importere Landeinfo
navn = 'Indien'
land = CountryInfo (navn)
data1 = country.alt_spellings()
Print(data1)
Start med at importere Landeinfo klasse fra landeinfo modul. Du kan derefter oprette en forekomst af CountryInfo ved at give den en streng, der indeholder navnet på et land.
Du kan kalde forskellige API-metoder på det CountryInfo-objekt, du har oprettet. For eksempel, alt_stave() returnerer en liste over alternative navne på landet.
Python-stykket til at få de alternative navne på et land producerer følgende output:
2. Få hovedstaden og dens geografiske koordinater
Du kan bruge kapital() at få hovedstaden i ethvert land. Det returnerer en streng, der repræsenterer navnet på hovedstaden:
data2 = country.capital()
Print(data2)
Dette Python-stykke producerer følgende output:
Brug API-metoden captial_latlng() at hente de geografiske koordinater for et lands hovedstad. Denne metode returnerer en liste, der indeholder to elementer, hver med et flydende kommanummer:
data3 = country.capital_latlng()
Print(data3)
Python-stykket til at få et lands breddegrad og breddegrad producerer følgende output:
3. Få et lands areal, dets provinser og de omkringliggende grænselande
Du kan bruge API-metoden, areal() at få arealet af et hvilket som helst land i kvadratkilometer. Implementer koden som:
data4 = country.area()
Print(data4)
Python-stykket til at få et lands areal producerer følgende output:
Du kan få en liste over provinser i et land ved hjælp af provinser(). Hvert element på listen er en streng, der repræsenterer en provins. Implementer koden som:
data5 = country.provinces()
Print(data5)
Python-stykket til at få et lands provinser producerer følgende output:
Du kan hente navnene på tilgrænsende lande ved hjælp af API-metoden, grænser(). Hvert element på listen er en landekode i ISO-3-format, en streng med tre tegn med store bogstaver. Implementer koden som:
data6 = country.borders()
Print(data6)
Python-stykket til at få navnet på grænselande producerer følgende output:
4. Få et lands opkaldskoder
Du kan hente de internationale opkaldskoder for et land ved hjælp af kaldekoder(). Dette returnerer en liste over strenge, der hver indeholder det numeriske telefonpræfiks, du skal bruge for at ringe til landet fra et andet:
data7 = country.calling_codes()
Print(data7)
Python-kodestykket til at få et lands kaldekoder producerer følgende output:
5. Hentning af valuta, befolkning og tidszoner
Hent det officielle valutaformat for et land ved hjælp af API-metoden, valutaer(). Denne metode returnerer en anden liste med strenge:
data8 = country.currencies()
Print(data8)
Python-stykket til at få et lands valuta producerer følgende output:
Hent det omtrentlige antal mennesker, der bor i et land ved hjælp af befolkning(). Denne metode returnerer en int. Brug det sådan her:
data9 = country.population()
Print(data9)
Python-uddraget til at få befolkningen i et land producerer følgende output:
Et land kan have en eller mere end én tidszone, afhængigt af dets størrelse. Du kan hente de forskellige tidszoner i et land ved hjælp af tidszoner() API-metode som:
data10 = country.timezones()
Print(data10)
Python-stykket til at få de forskellige tidszoner i et land producerer følgende output:
6. Få et lands region og underregion
Hent den generelle region eller kontinent et land hører til ved at bruge område() API metode. Implementer koden som:
data11 = country.region()
Print(data11)
Python-stykket til at få regionen i et land producerer følgende output:
På samme måde kan du bruge en mere specifik region, landet hører til underregion() som:
data12 = country.subregion()
Print(data12)
Python-kodestykket til at få et lands underregion producerer følgende output:
7. Hentning af Wikipedia-URL'en for et land
Wikipedia er en af de bedste kilder til information om noget på internettet. Du kan hente Wikipedia-siden for et land ved hjælp af API-metoden, wiki(). Implementer koden som:
data13 = country.wiki()
Print(data13)
Python-stykket til at få et lands Wikipedia-side producerer følgende output:
8. Få topdomænet for et land
Et ccTLD er et landekode-topdomænenavn, der angiver et land eller et geografisk område på webstedet. Det er normalt to bogstaver langt som f.eks .i for Indien og .ca for Canada. Du kan hente topdomænet for et land ved hjælp af tld() som:
data14 = country.tld()
Print(data14)
Python-kodestykket til at få topdomænet i et land producerer følgende output:
9. Få alle tilgængelige oplysninger om et land
Du kan hente alle tilgængelige oplysninger om et land ved hjælp af API-metoden, info(). Det returnerer en ordbog med nøgle/navn-værdier, som du kan gentage ved hjælp af en for-løkke:
data15 = country.info()
tilnøgle, værdiidata15.varer():
print (nøgle, ":", værdi)
Python-stykket til at få alle tilgængelige oplysninger om et land producerer følgende output:
10. Få oplysninger om alle landene og oprettelse af et datasæt
CountryInfo-modulet giver en API-metode kaldet alle() der returnerer en ordbog, der indeholder alle oplysninger for alle lande i verden:
fra landeinfo importere Landeinfo
importere pandaer som pd
land = CountryInfo()
data = country.all()
Du kan bruge pandamodulet til at manipulere disse data. Det pandas-modulet giver mange kommandoer til at arbejde med DataFrames, herunder en til at gemme data i CSV-format:
df = pd. DataFrame (data)
df.to_csv("Country_Data_Fetcher.csv")
Henter data fra websteder
Selvom dette praktiske Python-modul giver alle de væsentlige oplysninger fra ethvert land, er det ikke en let opgave at hente rene data. Viden om web-skrabning vil hjælpe dig med at hente data fra enhver hjemmeside på internettet. Du kan derefter analysere og bruge disse data i dine applikationer.
Python har et kraftfuldt modul kaldet BeautifulSoup, som du kan installere for at udføre web-skrabning og spare timer af dit arbejde.