Mens du bruger Google Sheets til at arbejde med to datasæt, vil du måske sammenligne de to ved at bestemme, i hvilken grad det ene påvirker det andet.
Korrelationer kan give indsigt i, om der er en forudsigelig sammenhæng mellem x- og y-planer, men de indikerer ikke nødvendigvis kausalitet. Sådan kan du bruge Google Sheets til at identificere sammenhænge i dine data.
Hvad er korrelation, og hvad kan du bruge det til?
Når to variable er korreleret, kan den ene bestemme, hvordan en variabel påvirker den anden. Men det er afgørende at huske, at korrelation ikke indebærer afhængighed i dette tilfælde; det viser bare, hvor tæt og hurtigt to variabler sammenligner eller relaterer.
Statistiske målinger hjælper med at forstå underliggende tendenser i dataanalyse. Korrelation er blandt de mest anvendte statistiske målinger, og den bestemmer, hvor tæt forbundne eller afhængige to variabler er.
Forstå korrelationskoefficienten i Google Sheets
I Google Sheets beregnes en korrelationskoefficient ved hjælp af CORREL-funktionen. Korrelationskoefficienten tjener som et mål for, hvor tæt forbundne datasættene er. Det kan bruges til at få Pearson produkt-moment korrelationskoefficienten (r), hvis du har to variable sæt data. Hvis du gerne vil lære mere om denne koefficient, kan du læse mere i denne guide fra
Statistik hos Leard.Man kunne støde på en af tre korrelationsmålinger. Hver måling definerer forholdet mellem variabler forskelligt. Dens værdi er mellem -1 og +1:
- -1 angiver en perfekt negativ korrelation: Når en korrelation har en korrelationskoefficient, der er lig med eller under -0,9, angives den at være stærkt negativ. Det er en indikation af, at data hænger sammen. Variablen x bliver dog ved med at stige, mens variabel y bliver ved med at falde.
- 0 angiver ingen forbindelse: Variabler anses for ikke at korrelere, hvis korrelationskoefficienten er større end 0,01, men mindre end 0,1, da der ikke er et mærkbart forhold mellem hver variabel. De er uafhængige af hinanden.
- +1 angiver en perfekt positiv korrelation: Når en korrelationskoefficient falder mellem 0,9 og 1, anses den for at være meget positiv. Det indikerer, at der er sket en stigning i de to variabelsæt.
Den højeste værdi af en koefficient kan have været en korrelationskoefficient på 1. Når korrelationsværdien er 1, betyder det, at hvis du skulle tegne dataene, ville de være fuldstændig justeret for at skabe en lige linje.
Hvis du stadig er lidt fortabt, så fortvivl ikke. Vi vil forklare syntaksen for CORREL-funktionen og derefter dykke ned i nogle eksempler fra den virkelige verden for at hjælpe dig med at forstå den bedre. Forstå linjer af bedste pasform og hvordan man laver trendlinjer i Google Sheets vil hjælpe dig med dette.
CORREL Funktionssyntaks i Google Sheets
=CORREL(data_y; data_x)
Lad os opdele dette i dets dele og bedre forstå, hvad hver sætning betyder:
- =CORREL: Dette er Google Sheet-funktionen, der bestemmer r, (datasættets Pearson-produktmoment-korrelationskoefficient).
- data_y: Dette refererer til gruppen af celler, der indeholder de afhængige data eller værdiintervallet for disse celler.
- data x: Dette er enten en reference til rækken af celler med de uafhængige data eller værdiintervallet for disse celler.
Hvis du skulle tegne datapunkterne, ville data_y være Y-aksen og data_x X-aksen. Du vil bemærke, at der er to forskellige måder at indtaste dataområdet på. Enten et referencecelleområde eller lige dataindtastning i funktionen er muligheder.
I de fleste tilfælde er brugen af referencecellers område at foretrække. Det er fordi regnearket højst sandsynligt allerede indeholder dine data. Brug af et referencecelleområde kan undgå overdreven indtastet input, der kan resultere i brugerfejl.
CORREL-funktionseksempler i Google Sheets
Lad os se et par eksempler for at forstå, hvordan man bruger CORREL-funktionen i Google Sheets.
Eksempel 1: En stærk positiv sammenhæng
For dette første eksempel, lad os foregive, at vi arbejder i ejendomsbranchen. I regnearket nedenfor har vi opdelinger af hektar jord, som du sælger, og antallet af solgte enheder af de forskellige landes data i dit Google-ark.
- Hvis du følger med i et ark, starter du med at indtaste variablernes data i dit regneark, som vist nedenfor:
- Klik på celle C2
- Type =CORREL(
- Du vil derefter fortsætte til at skrive data_y, som i vores tilfælde er det refererede celleområde A2:A6, indtast derefter et komma.
- Fortsæt til skriv data_x, som i vores tilfælde er refereret som B2:B6.
- Afslut med et lukkebeslag, som vist nedenfor:
- Tryk til sidst på Gå ind at returnere korrelationskoefficienten for de to datastykker i cellen C2.
Ved at bruge eksemplet ovenfor, har du opnået en korrelationskoefficient på 0,90, hvilket er en stærk positiv korrelation, da dens værdi falder mellem 0,9 og 1. Derfor indikerer dette, at når y ændres, ændres x også på en i det væsentlige sammenlignelig måde.
Nedenfor er en repræsentation af vores eksempeldata på en XY-spredningsgraf. Som du kan se, er linjen med bedste tilpasning tæt på datapunkterne på grafen, hvilket understøtter ideen om, at tallene er stærkt korrelerede.
Du kan lære mere om oprettelse af XY-spredningsgrafer i Google Sheets i vores anden artikel.
Eksempel 2: En svag negativ korrelation
Denne gang vil vi bruge et mere generisk eksempel på "variabel x og y" i vores regneark. Vi har målrettet inkluderet tal for at demonstrere en negativ korrelation, som CORREL-funktionen demonstrerer nedenfor:
Der er ikke en stærk sammenhæng mellem variablerne y og x, så resultatet vi får er en mindre signifikant korrelationskoefficient end i det foregående eksempel. Resultatet vi opnåede er -0,47. Dette betyder dog ikke, at der overhovedet ikke er nogen sammenhæng. Lad os se på en linje med bedst pasform igen for at give mening ud af det.
Som du kan se af spredningsplottet, er datapunkterne længere fra linjen med bedst tilpasning. Der er derfor mindre sammenhæng end i det første eksempel, men ikke ingen. Du vil også bemærke, at linjen med den bedste pasform er aftagende. Dette viser en negativ korrelation, den ene værdi falder, når den anden stiger.
Eksempel 3: Ingen forbindelse
Her har vi et sæt helt tilfældige tal. Lad os hurtigt komme ind på, hvordan du bruger CORREL-funktionen igen:
- Indtast celle C2 CORREL-formlen
- Vores argumenter er A2:A10 og B2:B10
- Tryk på Enter
Den returnerede værdi på C2 er 0,02. Hvis en korrelationskoefficient falder mellem 0,01 og 0,1, fastslås det, at de pågældende variabler ikke korrelerer, da der ikke er nogen mærkbar sammenhæng mellem dem. Relationerne mellem variabler er fuldstændig uafhængige.
Nedenfor er repræsentationen af det samme på en scatter-graf. Linjen med bedste pasform er næsten flad, hvilket indikerer ringe korrelation mellem de to datasæt.
Korreler nemt dine data i Google Sheets
Korrelation kunne være et udfordrende emne, hvis du ikke arbejdede meget med det i gymnasiet. Denne vejledning dækkede alt det grundlæggende, men du bliver nødt til at blive ved med at bruge CORREL-funktionen i Google Sheets for at holde den frisk i dit sind.
Dette er en kraftfuld funktion, da den hjælper med at undgå at bygge scatter-grafer og hurtigt kan finde tendenser i dine data. Alligevel skal du ikke være bange for at tilføje diagrammer for at hjælpe andre brugere med bedre at forstå dataene i dine regneark.