Sådan bruger du Excels indbyggede værktøjer til at gøre statistisk analyse nemmere.

Resterende plots spiller en væsentlig rolle i regressionsanalyse. De fortæller dig, hvor nøjagtigt din regressionslinje repræsenterer forholdet mellem to variable. Den følgende vejledning forklarer, hvordan man beregner og plotter Excel-rester ved hjælp af to metoder.

Men før vi kommer til de gode ting, lad os kort forstå residualer og deres betydning i en regressionsanalyse.

Hvad er rester, og hvorfor er de vigtige?

En residual er en forskel mellem den observerede (faktiske) værdi og den forudsagte værdi. I enklere vendinger er en rest en fejl. For eksempel, hvis den observerede værdi er 10, og din model gav en værdi på 8, så ville restværdien være 2.

På den anden side er et residualplot et scatterplot, hvor den uafhængige variabel (alder) er plottet på den vandrette akse, og residualerne (fejlene) er plottet på den lodrette akse.

Ok, du ved hvad rester er, men hvorfor er de vigtige? For at forstå det skal du overveje følgende tilfælde:

instagram viewer

Vi ønsker at forstå sammenhængen mellem alder og opsparingsrater. Til det vil vi plotte en regressionslinje. Vi er dog usikre på, om regressionslinjen nøjagtigt repræsenterer forholdet mellem de to variable. Det er her rester kommer ind. Vi bruger et restplot til at kontrollere nøjagtigheden af ​​regressionslinjen.

Nu hvor du ved, hvad rester er, lad os lære, hvordan du opretter et restplot i Excel:

Sådan opretter du et resterende plot ved hjælp af trendlinjeligning

Den første metode til at plotte residualer i Excel bruger en trendlinjeligning til at beregne de forudsagte værdier for vores data. Når vi har det, kan vi beregne residualerne ved at trække de forudsagte værdier fra de observerede værdier. Til sidst laver vi et spredningsplot med prædiktorerne på den vandrette akse og residualerne på den lodrette akse.

Selvom denne metode kræver flere trin end den anden metode, er det en fantastisk måde at forstå konceptet på. Når du har fået en anstændig forståelse, kan du bruge den anden metode, som kræver mindre tid og kræfter.

Lad os lede dig gennem processen, et trin ad gangen:

Trin 1: Indtast data

Vi starter med at indtaste værdierne for prædiktoren (under x kolonne) og de observerede værdier (under Y kolonne):

Trin 2: Opret et scatterplot af dataene

Nu opretter vi et scatterplot af dataene ved at følge nedenstående trin:

Hvis du ikke er bekendt med scatter plots, er her en omfattende artikel om oprette et scatter plot i Excel og præsentere dine data. Du kan også lære at bruge et scatterplot i Excel til at forudsige dataadfærd.

  1. Vælg dataene (under x og Y kolonner).
  2. Gå til Excel bånd og klik Indsæt.
  3. I den Diagrammer sektionen skal du klikke på pilen under Scatterplot mulighed.
  4. Vælg det første scatterplot (Spred kun med markører).
  5. Du får et scatterplot svarende til følgende diagram:

Trin 3: Tilføj en trendlinje og vis trendlinjeligningen på scatterplot

Følg nedenstående trin for at tilføje en trendlinje til scatterplot:

  1. Klik på scatter plot.
  2. Gå til Excel bånd og klik Layout.
  3. I den Baggrund sektionen skal du klikke på pilen under Trendlinje ikon.
  4. Vælg Lineær trendlinje mulighed.

Du vil nu se en linje (trendlinje), der skærer prikkerne på dit spredningsplot. Følg nedenstående trin for at vise trendlinjeligningen på scatterplotten:

  1. Gå igen til Trendlinje ikonet og klik på pilen under det.
  2. Klik Flere Trendline muligheder.
  3. EN Formater Trendline dialogboksen vises.
  4. Tjek Vis ligning på diagrammet mulighed i bunden af Formater Trendline dialog boks. Trendlinjeligningen vises på grafen.

Trin 4: Beregn de forudsagte værdier

For at beregne de forudsagte værdier skal du oprette en anden kolonne (Z) ud for dine data og følge nedenstående trin:

  1. Indtast trendlinjeformlen vist på grafen, og indsæt den under Z-kolonnen (celle C2). Skift x i formlen med værdier under X-kolonnen.
  2. Så for den første forudsagte værdi vil formlen blive givet som følger:
    =1,5115*A2+23,133
  3. Erstatte A2 med A3 i trendlinjeformlen for den anden prædikerede værdi.
  4. Udskift for den tredje forudsagte værdi A3 med A4, og så videre, indtil du får alle de prædikerede værdier for deres tilsvarende prædiktorer.

Trin 5: Find de resterende værdier

Nu hvor vi har de forudsagte værdier, kan vi finde restværdierne ved at trække de forudsagte værdier fra de observerede (faktiske) værdier under Y-kolonnen. Formlen for den første restværdi ville være =B2-C2. For det andet ville formlen være =B3-C3, og så videre.

Trin 6: Opret det resterende plot

For at skabe et restplot har vi brug for prædiktoren og restværdierne. Nu hvor vi har begge dele, skal du følge nedenstående trin:

  1. Vælg kolonner Y og Z.
  2. Højreklik og vælg Skjule.
  3. Vælg nu x og Rester kolonner.
  4. Gå til Indsæt fanen i Excel-båndet.
  5. Klik på pilen under Sprede ikon.
  6. Vælg Spred kun med markører mulighed.
  7. Du får dit resterende plot, som vist nedenfor.

For den anden metode er alt, hvad du skal gøre, at give Excel dataene, og det gør alt arbejdet. Du kan oprette et resterende plot med kun få klik. Men for det skal du indlæse Excel's Analysis Toolpak. Lad os komme igang:

  1. Gå til Fil fanen og klik Muligheder.
  2. Det Excel-indstillinger dialogboksen vises.
  3. Gå til Styre boks (nederst), vælg Excel-tilføjelser, og klik .
  4. An Tilføjelser dialogboksen vises.
  5. Tjek Analyse ToolPak boksen og klik Okay.
  6. Gå nu til Excel bånd og klik Data.
  7. Du finder Dataanalyse ikon i Analyse afsnit.

Trin 2: Indtast data

  1. Vælg kolonner EN og D, og højreklik med musen. Klik Vis frem.
  2. Kopier nu x og Y kolonner.

    Du vil bemærke, at grafen har ændret sig efter at have vist kolonnerne. For at ændre det tilbage til det oprindelige resterende plot, bliver vi nødt til at skjule Y og Z kolonner (ved at vælge Y og Z kolonner, højreklik med musen og vælg Skjule).

  3. Åbn et nyt Excel-ark og indsæt x og Y kolonner.
  4. Klik på den nyligt dukkede op Dataanalyse mulighed i Analyse afsnit af Data fanen.
  5. EN Dataanalyse dialogboksen vises.
  6. Find og vælg Regression under Analyseværktøjer.
  7. Klik OKAY. Det Regression dialogboksen vises.
  8. Indtast værdierne i Y kolonne (prædiktorerne, B2:B11) i Indgang Y-område Mark.
  9. Indtast celleområdet i x kolonne (de uafhængige variable, A2:A11) i Indgang X-område Mark.

Trin 3: Opret det resterende plot

I den Regression dialogboksen under Output muligheder, kontrollere Nyt arbejdsarklag, og klik Okay.

Excel vil automatisk oprette restplottet sammen med følgende output, som du kan bruge til at kontrollere pålideligheden af ​​din regressionsmodel:

  • Regressionsstatistik
  • ANOVA bord
  • Koefficienttabel
  • Restoutput

Excels Analysis ToolPak tilbyder en række værdifulde statistikfunktioner, som du kan bruge til at analysere dine datasæt. Efter at have oprettet det resterende plot gennem Excel's Analysis ToolPak, kan du begynde at klø dig i hovedet, mens du ser på alle de komplicerede tabeller. Men når først du lærer at lave grundlæggende dataanalyse i Excel, ser tallene ikke så skræmmende ud.