Python, som sprog, er værdifuldt uoverskueligt, især når du vil arbejde med strukturerede data. Da folk gemmer en masse data i Excel-filer, er det bydende nødvendigt at konsolidere flere filer for at spare tid og kræfter.

Python lader dig gøre præcis det; uanset hvor mange Excel-filer du ønsker at kombinere, kan du gøre det med relativ lethed. I betragtning af dets udvalg af biblioteker og tredjepartsressourcer kan du importere og bruge Pythons mangefacetterede værktøjer til at lave dit bud.

I denne vejledning skal du installere og bruge Pandas-bibliotekerne til at importere data til Python, før du konsoliderer dem.

Installer Pandas Libraries i Python

Pandas er et tredjepartsbibliotek, som du kan installere i Python. Nogle IDE'er har allerede Pandaer installeret i dem.

Hvis du bruger en IDE version der ikke følger med forudinstallerede pandaer, vær sikker på, du kan installere det direkte i Python.

Sådan installerer du Pandas:

pip installer pandaer

Hvis du bruger Jupyter Notebook, kan du installere Pandas direkte med

instagram viewer
PIP kommando. For det meste, når du har installeret Jupyter med Anaconda, er der store chancer for allerede at have pandaer til rådighed til direkte brug.

Hvis du ikke kan ringe til Pandas, kan du bruge ovenstående kommando til at installere dem direkte.

Kombination af Excel-filer med Python

Først skal du oprette en mappe på din foretrukne placering med alle Excel-filerne. Når mappen er klar, kan du begynde at skrive koden for at importere bibliotekerne.

Du skal bruge to variable i denne kode:

  1. Pandaer: Pandas-biblioteket leverer datarammerne til lagring af Excel-filer.
  2. OS: Biblioteket er en fordel til at læse data fra din maskines mappe

For at importere disse biblioteker skal du bruge disse kommandoer:

Importer pandaer som pd
Importer OS
  • Importere: Python-syntaks bruges til at importere bibliotekerne i Python
  • Pandaer: Bibliotekets navn
  • pd: Alias ​​givet til biblioteket
  • OS: Et bibliotek til at få adgang til systemmappen

Når du har importeret bibliotekerne, skal du oprette to variabler for at gemme input- og outputfilstien. Inputfilstien er nødvendig for at få adgang til filernes mappe. Outputfilstien er nødvendig, da den kombinerede fil vil blive eksporteret dertil.

Hvis du bruger Python, skal du sørge for at ændre omvendt skråstreg til skråstreg frem (\ til /)

input_file_path = "C:/Brugere/gaurav/OneDrive/Desktop/Excel-filer/"
output_file_path = "C:/Brugere/gaurav/OneDrive/Desktop/"

Tilføj / til sidst også for at fuldføre stierne.

Mappens filer er tilgængelige på en liste. Opret en liste for at gemme alle filreferencer for inputmappen ved hjælp af listedir funktion fra OS bibliotek.

Hvis du er usikker på de funktioner, der er tilgængelige på et bibliotek, kan du bruge dir funktion med bibliotekets navn. For eksempel, for at kontrollere den nøjagtige version af listdir-funktionen, kan du bruge kommandoen som følger:

dir (OS)

Outputtet vil bestå af alle de tilknyttede funktioner, der er tilgængelige i OS-biblioteket. Listdir-funktionen er en af ​​de mange funktioner, der er tilgængelige i dette bibliotek.

Opret en ny variabel for at gemme inputfilerne fra mappen.

excel_file_list = os.listdir (input_file_path)

Udskriv denne variabel for at se navnene på de filer, der er gemt i mappen. Alle filer, der er gemt i mappen, vises, når du bruger udskrivningsfunktionen.

print (excel_file_list)

Dernæst skal du tilføje en ny dataramme for at gemme hver Excel-fil. Forestil dig en dataramme som en beholder til lagring af data. Her er kommandoen til at oprette en dataramme.

df = pd. DataFrame()
  • df: Variabel til at gemme værdien af ​​DataFrame
  • pd: Alias ​​for Pandas bibliotek
  • DataFrame: Standardsyntaks til tilføjelse af en dataramme

Indtastningsmappen har tre .xlsx filer i dette eksempel. Filnavnene er:

Fil1_excel.xlsx
Fil2_excel.xlsx
Fil3_excel.xlsx

For at åbne hver fil fra denne mappe, skal du køre en løkke. Sløjfen vil køre for hver af filerne på listen oprettet ovenfor.

Sådan kan du gøre det:

for excel_filer i excel_file_list:

Dernæst er det nødvendigt at kontrollere filudvidelserne, da koden kun åbner XLSX-filer. For at kontrollere disse filer kan du bruge en Hvis udmelding.

Brug ender med funktion til dette formål, som følger:

for excel_filer i excel_file_list:

if excel_files.endswith(".xlsx"):

  • excel_filer: Liste med alle filværdierne
  • slutter med: Funktion til at kontrollere filtypenavnet
  • (".xlsx"): Denne strengværdi kan ændre sig, afhængigt af hvad du vil søge efter

Nu hvor du har identificeret Excel-filerne, kan du oprette en ny dataramme til at læse og gemme filerne individuelt.

for excel_filer i excel_file_list:

if excel_files.endswith(".xlsx"):

df1 = pd.read_excel (input_filsti+excel_filer)

  • df1: Ny dataramme
  • pd: Pandas bibliotek
  • read_excel: Funktion til at læse Excel-filer i Pandas-biblioteket
  • input_file_path: Stien til mappen, hvor filerne er gemt
  • excel_filer: Enhver variabel, der bruges i for-løkken

For at begynde at tilføje filerne skal du bruge Tilføj fungere.

for excel_filer i excel_file_list:

if excel_files.endswith(".xlsx"):

df1 = pd.read_excel (input_filsti+excel_filer)
df = df.append (df1)

Endelig, nu hvor den konsoliderede dataramme er klar, kan du eksportere den til outputplaceringen. I dette tilfælde eksporterer du datarammen til en XLSX-fil.

df.to_excel (output_file_path+"Consolidated_file.xlsx")
  • df: Dataramme til eksport
  • to_excel: Kommandoen bruges til at eksportere dataene
  • output_file_path: Sti defineret til lagring af output
  • Consolidated_file.xlsx: Navnet på den konsoliderede fil

Lad os nu se på den endelige kode:

#Pandas bruges som en dataramme til at håndtere Excel-filer
importer pandaer som pd
import os

# skift skråstreg fra "\" til "/", hvis du bruger Windows-enheder

input_file_path = "C:/Brugere/gaurav/OneDrive/Desktop/Excel-filer/"
output_file_path = "C:/Brugere/gaurav/OneDrive/Desktop/"

#opret en liste for at gemme alle filreferencer for inputmappen ved hjælp af listdir-funktionen fra os-biblioteket.
#For at se indholdet af et bibliotek (som listdir-funktionen kan du bruge dir-funktionen på biblioteksnavnet).
#Brug dir (biblioteksnavn) til at vise indhold

excel_file_list = os.listdir (input_file_path)

#print alle filer, der er gemt i mappen, efter at have defineret listen
excel_file_list

#Når hver fil åbnes, skal du bruge tilføj-funktionen til at begynde at konsolidere de data, der er gemt i flere filer

#opret en ny, tom dataramme til at håndtere excel-filimporten
df = pd. DataFrame()

#Kør en for loop til loop gennem hver fil på listen
for excel_filer i excel_file_list:
#check kun for .xlsx-suffiksfiler
if excel_files.endswith(".xlsx"):
#opret en ny dataramme for at læse/åbne hver Excel-fil fra listen over filer oprettet ovenfor
df1 = pd.read_excel (input_filsti+excel_filer)
#tilføj hver fil i den originale tomme dataramme
df = df.append (df1)

#transfer endeligt output til en Excel (xlsx) fil på outputstien
df.to_excel (output_file_path+"Consolidated_file.xlsx")

Brug af Python til at kombinere flere Excel-projektmapper

Pythons Pandas er et fremragende værktøj til både begyndere og avancerede brugere. Biblioteket bruges flittigt af udviklere, der ønsker at mestre Python.

Selvom du er nybegynder, kan du få stor gavn af at lære nuancerne af Pandas og hvordan biblioteket bruges i Python.

6 Panda-operationer for begyndere

Få styr på Pandas med disse begynderoperationer.

Læs Næste

DelTweetE-mail
Relaterede emner
  • Programmering
  • Python
  • Microsoft Excel
  • Regneark
Om forfatteren
Gaurav Siyal (59 artikler udgivet)

Gaurav Siyal har to års skriveerfaring og har skrevet for en række digitale marketingfirmaer og softwarelivscyklusdokumenter.

Mere fra Gaurav Siyal

Abonner på vores nyhedsbrev

Tilmeld dig vores nyhedsbrev for tekniske tips, anmeldelser, gratis e-bøger og eksklusive tilbud!

Klik her for at abonnere