Ønsker du at give ChatGPT dine brugerdefinerede data? Her er et trin-for-trin om, hvordan du gør netop det!

Ved at levere GPT-teknologi i en kraftfuld og brugervenlig chatbot er ChatGPT blevet verdens mest populære AI-værktøj. Mange mennesker bruger ChatGPT til at give engagerende samtaler, besvare forespørgsler, tilbyde kreative forslag og hjælpe med kodning og skrivning. ChatGPT er dog begrænset, da du ikke kan gemme dine data til langsigtet personlig brug, og dets videndata cut-off-punkt for september 2021.

Som en løsning kan vi bruge OpenAI's API og LangChain til at give ChatGPT tilpassede data og opdateret info efter 2021 for at oprette en tilpasset ChatGPT-instans.

Hvorfor levere ChatGPT med tilpassede data?

At fodre ChatGPT med brugerdefinerede data og give opdaterede oplysninger ud over dens vidensgrænsedato giver flere fordele i forhold til bare at bruge ChatGPT som normalt. Her er et par af dem:

  • Personlige interaktioner: Ved at give ChatGPT brugerdefinerede data kan brugerne skabe en mere tilpasset oplevelse. Modellen kan trænes på specifikke datasæt, der er relevante for individuelle brugere eller organisationer, hvilket resulterer i svar, der er skræddersyet til deres unikke behov og præferencer.
    instagram viewer
  • Domænespecifik ekspertise: Tilpasset dataintegration gør det muligt for ChatGPT at specialisere sig i bestemte domæner eller brancher. Det kan trænes i branchespecifik viden, terminologi og tendenser, hvilket muliggør mere præcise og indsigtsfulde svar inden for disse specifikke områder.
  • Aktuelle og nøjagtige oplysninger: Adgang til opdateret information sikrer, at ChatGPT holder sig opdateret med den seneste udvikling og viden. Det kan give nøjagtige svar baseret på seneste begivenheder, nyheder eller forskning, hvilket gør det til en mere pålidelig informationskilde.

Nu hvor du forstår vigtigheden af ​​at levere tilpassede data til ChatGPT, er her et trin-for-trin om, hvordan du gør det på din lokale computer.

Trin 1: Installer og download software og færdiglavet script

Bemærk venligst, at følgende instruktioner er til en Windows 10- eller Windows 11-maskine.

For at levere tilpassede data til ChatGPT skal du installere og downloade den seneste Python3, Git, Microsoft C++ og ChatGPT-hentningsscriptet fra GitHub. Hvis du allerede har noget af softwaren installeret på din pc, skal du sørge for, at de er opdateret med den nyeste version for at undgå hikke under processen.

Start med at installere:

  • Hent:Python3 (Gratis)
  • Hent:Git (Gratis)
  • Hent:Microsoft Visual Build-værktøjer (Gratis)

Python3 og Microsoft C++ installationsnoter

Når du installerer Python3, skal du sørge for at markere Tilføj python.exe til PATH mulighed, før du klikker Installer nu. Dette er vigtigt, da det giver dig adgang til Python i enhver mappe på din computer.

Når du installerer Microsoft C++, skal du installere Microsoft Visual Studio byggeværktøjer først. Når den er installeret, kan du sætte kryds i Desktop udvikling med C++ mulighed og klik Installere med alle de valgfrie værktøjer automatisk markeret i højre sidebjælke.

Nu hvor du har installeret de nyeste versioner af Python3, Git og Microsoft C++, kan du downloade Python-scriptet for nemt at forespørge efter tilpassede lokale data.

Hent: ChatGPT-hentningsscript (Gratis)

For at downloade scriptet, klik på Kode, vælg derefter Download ZIP. Dette skulle downloade Python-scriptet til din standardmappe eller valgte mappe.

Når den er downloadet, kan vi nu oprette et lokalt miljø.

Trin 2: Konfigurer det lokale miljø

For at konfigurere miljøet skal du åbne en terminal i chatgpt-retrieval-hovedmappen, du downloadede. For at gøre det skal du åbne chatgpt-retrieval-main mappe, højreklik og vælg Åbn i Terminal.

Når terminalen er åben, kopier og indsæt denne kommando:

pip installer langkæde openai chromadb tiktoken ustruktureret

Denne kommando bruger Pythons pakkehåndtering til at oprette og administrere det virtuelle Python-miljø havde brug for.

Efter at have oprettet det virtuelle miljø, skal vi levere en OpenAI API-nøgle for at få adgang til deres tjenester. Vi skal først generere en API-nøgle fra Site for OpenAI API-nøgler ved at klikke på Opret ny hemmelig nøgle, tilføje et navn til tasten og derefter trykke på Opret hemmelig nøgle-knap.

Du vil blive forsynet med en streng af tegn. Dette er din OpenAI API-nøgle. Kopier den ved at klikke på kopiikonet på siden af ​​API-nøglen. Vær opmærksom på, at denne API-nøgle skal holdes hemmelig. Del det ikke med andre, medmindre du virkelig har til hensigt, at de skal bruge det sammen med dig.

Når den er kopieret, skal du vende tilbage til chatgpt-retrieval-hovedmappen og åbne konstanter med Notesblok. Udskift nu pladsholderen med din API-nøgle. Husk at gemme filen!

Nu hvor du har opsat dit virtuelle miljø og tilføjet din OpenAI API-nøgle som en miljøvariabel. Du kan nu give dine tilpassede data til ChatGPT.

Trin 3: Tilføjelse af brugerdefinerede data

For at tilføje brugerdefinerede data skal du placere alle dine brugerdefinerede tekstdata i data mappe i chatgpt-retrieval-main. Formatet af tekstdataene kan være i form af en PDF, TXT eller DOC.

Som du kan se fra skærmbilledet ovenfor, har jeg tilføjet en tekstfil, der indeholder et personligt skema, en artikel jeg skrev på AMD's instinktacceleratorerog et PDF-dokument.

Trin 4: Forespørgsel på ChatGPT gennem terminal

Python-scriptet giver os mulighed for at forespørge data fra de brugerdefinerede data, vi har tilføjet til datamappen og internettet. Du vil med andre ord have adgang til den sædvanlige ChatGPT-backend og alle data gemt lokalt i datamappen.

For at bruge scriptet skal du køre python chatgpt.py script og tilføj derefter dit spørgsmål eller din forespørgsel som argument.

python chatgpt.py "DIT SPØRGSMÅL"

Sørg for at sætte dine spørgsmål i anførselstegn.

For at teste, om vi med succes har tilført ChatGPT vores data, vil jeg stille et personligt spørgsmål vedrørende Personlig Sched.txt fil.

Det virkede! Dette betyder, at ChatGPT var i stand til at læse den personlige Sched.txt, der blev leveret tidligere. Lad os nu se, om vi med succes har fodret ChatGPT med information, som den ikke kender på grund af dens skæringsdato for viden.

Som du kan se, beskrev den korrekt AMD Instinct MI250x, som blev udgivet efter ChatGPT -3's viden cutoff-dato.

Begrænsninger af Custom ChatGPT

Selvom fodring af GPT-3.5 med tilpassede data åbner flere måder at anvende og bruge LLM, er der nogle få ulemper og begrænsninger.

For det første skal du selv levere alle data. Du kan stadig få adgang til al viden om GPT-3.5 indtil dens skæringsdato for viden; du skal dog give alle de ekstra data. Dette betyder, at hvis du ønsker, at din lokale model skal være vidende om et bestemt emne på internettet, som GPT-3.5 ikke allerede kender, du bliver nødt til at gå til internettet og selv skrabe dataene og gemme dem som en tekst i datamappen på chatgpt-retrieval-main.

Et andet problem er, at det tager længere tid at indlæse ChatGPT, sammenlignet med at spørge ChatGPT direkte.

Endelig er den eneste tilgængelige model i øjeblikket GPT-3.5 Turbo. Så selvom du har adgang til GPT-4, vil du ikke være i stand til at bruge den til at drive din tilpassede ChatGPT-instans.

Custom ChatGPT er fantastisk, men begrænset

At levere tilpassede data til ChatGPT er en effektiv måde at få mere ud af modellen på. Gennem denne metode kan du fodre modellen med alle tekstdata, du ønsker, og bede den ligesom almindelig ChatGPT, dog med nogle begrænsninger. Dette vil dog ændre sig i fremtiden, da det bliver lettere at integrere vores data med LLM, sammen med adgang til den nyeste GPT-4-model.