Maskinlæring er blevet centrum for diskussion inden for kunstig intelligens i dag. Det berører alle områder, herunder teknik, medicin, forretning, samfundsvidenskab og mere.
Ved hjælp af de flere maskinlæringsbiblioteker, der er tilgængelige i dag, er maskinlæring med blandt andet Python, C ++, Java, Julia og R lettere end nogensinde. Her er nogle populære maskinlæringsbiblioteker, du kan starte med, hvis du vil vove dig ind på denne lovende karrierevej.
1. Keras
Keras er en del af TensorFlows omfattende værktøjer til maskinlæring. Men det er anderledes, fordi det er en API på højere niveau, der leveres med TensorFlow. Plus det er mere menneskevenligt og skrevet med Python. Så det er mere implementerbart, da det giver kortfattet dokumentation, der er let for maskinlærende begyndere at indsnævre.
Keras tilbyder imidlertid en bred vifte af maskinlæringsfunktioner, perfekt til træning af både strukturerede data og råmedier. Biblioteket spænder imidlertid over tekst- og billedbaserede algoritmer til træning og test af dit datasæt.
En unik egenskab ved Keras er, at det holder dig fokuseret på biblioteket, da det giver alt, hvad du har brug for til dit projekt i ét stykke. Så du behøver næppe at forgrene dig for at låne hjælpeprogrammer fra andre biblioteker. Hyperparameter-tuning, funktionsvalg, lag med forarbejdning af rige data og datarensning er nogle af dens spektakulært indbyggede funktioner.
Med Keras kan du læse billeder og tekster direkte fra delte mapper i en overordnet mappe og få et mærket datasæt fra dem. Og hvis dine data er store og ikke sidder i din maskines hukommelse, tilbyder Keras en højtydende datasætobjektindstilling. Det kan du altid skifte til.
Relaterede: Sådan opgraderes dine Python- og AI -færdigheder med Python Machine Learning Libraries
Derudover tilbyder den forskellige grafiske behandlingsenheder (GPU'er) til behandling af et stort datasæt. Så det lader dig samtidig køre CPU -beregninger sammen med GPU -behandling asynkront.
2. TensorFlow
Introduceret af Google i 2015, TensorFlow er mere en ramme end et bibliotek. Det er et open source-bibliotek bygget med C ++, og det fungerer ved at spore dataflow-grafer.
TensorFlow er meget alsidig og omfattende og tilbyder masser af andre indbyggede, enhedsbiblioteker til at køre maskinlæringsberegninger. I det væsentlige tilbyder TensorFlow en skalerbar platform til opbygning af maskinlæringskoncepter som kunstige neurale netværk (ANN), dybe neurale netværk og dyb læring.
Relaterede: Hvad er TensorFlow Lite, og hvordan er det en Deep Learning Framework?
Tensorflow understøtter også Java, C ++, Julia, Rust, Ruby og JavaScript, blandt andre ud over Python. Selvom brug af TensorFlow med andre programmeringssprog end Python kan tilbyde let projektintegration, er det lettere at bruge dets kerner med Python, da det fuldt ud understøtter TensorFlows implementering.
Derudover kan udviklingsrørledninger på andre sprog give problemer med API -versionskompatibilitet, hvis du senere skal skifte version. Selvom TensorFlow -dokumenter er omfattende, kan de i modsætning til Keras være for forskellige til, at begyndere kan forstå dem. Når det er sagt, har den solid fællesskabsstøtte, og du finder også mange open source TensorFlow-eksempler der ude.
En fordel ved TensorFlow frem for Keras er, at du kan bruge TensorFlow direkte uden Keras. Selvfølgelig kan du ikke sige det samme for Keras, da det er en forgrenet klasse af TensorFlow selv.
3. Mlib Spark
Her er noget ret praktisk fra Apache Spark. Udgivet og gjort open-source i 2010, Mlib Spark bruger iterative beregninger til at køre maskinlæringsalgoritmer. På grund af sin iterative karakter kan Mlib gøre brug af Hadoop eller lokale datakilder og arbejdsgange. Plus, det er i stand til at køre kompleks logik inden for en kort periode.
I sidste ende er det stadig et af de hurtigste maskinlæringsbiblioteker derude. Det kører en bred vifte af maskinlæringsalgoritmer, herunder regression, clustering, klassificering og anbefalingsmodeller. Det udmærker sig også med hensyn til dataforbehandling og mønstermining.
Relaterede: Hvad er maskinlæringsalgoritmer? Sådan fungerer de
Biblioteket er dynamisk og tilbyder en robust API, der kan tilsluttes Scala, Python, R og Java. Mlib Spark er en indlejring i selve Spark, så den opgraderes med hver Spark -udgivelse.
Mlib Spark har forklarende dokumentation, så en nybegynder kan nemt hente den. Men en lille ulempe er, at den kun kan integreres med et par programmeringssprog, så dette kan være et problem, hvis du ikke er bekendt med de sprog, det i øjeblikket understøtter.
4. mlpack
mlpack blev udgivet i 2008 og udviklet med C ++ ved hjælp af et lineært algebra bibliotek kaldet Armadillo. Ligesom Mlib Spark lader det dig anvende de fleste af de tilgængelige maskinlæringsalgoritmer og -koncepter direkte på dit datasæt ved hjælp af præcise og læsbare kodelinjer.
Ud over at være tilgængelig på programmeringssprog som Python, C ++, Go og Julia, understøtter det også CLI -udførelse, som giver dig mulighed for at køre din kode og modtage øjeblikkelige svar. Selvom det understøtter binding til disse andre sprog, er det muligvis ikke en god idé at køre mlpack på store datasæt, der kræver kompleks beregning, når det bruges med et andet programmeringssprog. Således er skalerbarhed med andre sprog udover C ++ ofte et problem med mlpack.
Hvis du er nybegynder i maskinlæring og har viden om C ++, kan du stadig prøve det. Dokumentationen har vejledninger og eksempler, der er lette at følge, og som er tilgængelige til forskellige programmeringssprog. Fordi det kører beregninger på C ++-koncepter, bruger mlpack kode på lavt niveau til hurtigt at udføre komplekse til enkle maskinlæringsopgaver.
5. Pytorch
Facebook udviklet Pytorch og udgav det officielt i 2016. Pytorch er kendt for sin omfattende brug inden for computersyn, dyb læring og behandling af naturligt sprog og er et open source-bibliotek bygget ud fra Torch-rammerne.
Ligesom Keras og Tensorflow understøtter Pytorch CPU -behandling af datasæt. Og hvis dit datasæt er stort, har det en GPU -processor til at håndtere dine beregninger. Plus, det er tensor-baseret.
Ud over Python understøtter biblioteket binding til både C ++ og Java. Pytorch tilbyder udover andre forsyningsselskaber subsidiære biblioteker, herunder fakkelsyn, fakkeltekst, torchaudio, og TorchServe.
Disse biblioteker er en del af Pytorch -maskinlæringsfunktionerne, og du vil støde på dem, mens du skriver dine Pytorch -modeller. Med detaljeret og omfattende tutorial-baseret dokumentation er Pytorch let at forstå, så længe du kender maskinlæringskoncepter.
Pytorch lader dig også omdanne dine datasæt til et maskinvenligt format. Så det er også et perfekt bibliotek til forbehandling af data. Der er altid mulighed for ekstrahering af funktioner, datarensning, datadeling og hyperparameterindstilling med Pytorch.
6. Scikit-Lær
Immersively bygget med Python, scikit-lær, også kaldet sklearn, blev offentliggjort i 2010. Biblioteket betjener imidlertid en bred vifte af maskinlæringsapplikationer, herunder modellering af fremhævede og ikke -funktionerede datasæt.
Scikit-learn tilbyder velkendte overvågede algoritmer, herunder de lineære og logistiske regressionsmodeller, understøtter vektormaskine (SVM), Naive Bayes, beslutningstræer, nærmeste naboer, blandt andre, lige ud af boks. Det er også en rig kilde til uovervåget læringsmetoder som klynger, Gaussisk model, sammen med neurale netværksmodeller og mere.
I det væsentlige understøtter scikit-learn både modeller med overvågning og uden opsyn. Det er et godt udgangspunkt, hvis du stadig er ny inden for Python eller maskinlæring generelt, fordi det er helt Python-baseret. Og hvis du lige er begyndt med maskinlæring eller datavidenskab, vil du måske starte med de overvågede læringsfunktioner i scikit-learn.
Samlet set er det mere begyndervenligt end andre biblioteker på listen. I modsætning til de andre biblioteker, der er nævnt tidligere, er scikit-learning massivt afhængig af Numpy og Scipy for at køre højtydende matematiske beregninger. Og den bruger også Matplotlib til at præsentere overbevisende historiefortællende visualiseringer.
7. Theano
Hvis du er ude efter et bibliotek for at hjælpe dig med at opdele komplekse problemer i fleksible algoritmer, så Theano kan være hvad du vil. Oprettet i 2007 af Yoshua Bengio i Montreal, Canada, er Theano et kraftfuldt bibliotek til at køre små til højtydende beregninger.
Ligesom Scikit-Learn afhænger Theano af Numpy for at udføre numeriske beregninger. Biblioteket understøtter GPU-baserede beregninger, plus det genererer C-kode på lavt niveau. Dette fremskynder matematiske evalueringer med Theano, uanset hvor store de er. Derudover kører dens deep learning -modeller på tensors.
Med Theano kan du konvertere dit datasæt til læselige float-, binære eller heltalspunkter, uanset dets oprindelige datatype. Du får muligvis ikke nok fællesskabsstøtte. Det er fordi Theano ikke er så populær som de andre biblioteker, vi nævnte tidligere. Det gør det ikke mindre begyndervenligt.
Selvstudiet i docs er let at forstå. Dens evne til at forenkle komplekse arrays og optimere uendelige beregninger gør den perfekt til at skabe skalerbare modeller til maskinindlæring.
Hvilket bibliotek skal du bruge til dit næste maskinlæringsprojekt?
Selvom vi har nævnt nogle af de mest udbredte maskinlæringsbiblioteker, kommer vi med bedste kan være hård, da de alle tjener meget lignende formål med kun et par forskelle i deres funktioner.
Selvfølgelig er det nyttigt at starte med et mere begyndervenligt bibliotek som Scikit-Learn eller Keras, hvis du bare bryder ind i feltet. Udover det hjælper det dig med at indsnævre kompleksiteten langs din udviklings pipeline med at vælge et bibliotek målrettet til et projekt. Men når det er sagt, er det nyttigt at sætte sig ind i maskinlæringsgrundlag gennem kurser og selvstudier.
Maskinlæringsalgoritmer er designet til at gøre livet lettere og forbedre systemer, men de kan gå galt med dårlige konsekvenser.
Læs Næste
- Programmering
- Maskinelæring
- Programmering
Idowu brænder for alt smart teknologi og produktivitet. I fritiden leger han med kodning og skifter til skakbrættet, når han keder sig, men han elsker også at bryde væk fra rutinen en gang imellem. Hans passion for at vise folk vejen rundt om moderne teknologi motiverer ham til at skrive mere.
Abonner på vores nyhedsbrev
Tilmeld dig vores nyhedsbrev for tekniske tips, anmeldelser, gratis e -bøger og eksklusive tilbud!
Klik her for at abonnere