Vad är sambandet mellan data betyder?

Vad är sambandet mellan data betyder?

Korrelation av uppgifter innebär att två olika variabler är kopplad på något sätt. Detta kan vara positivt samband, vilket betyder att man går upp som andra går upp (exempelvis människor som är tyngre tenderar att vara längre) eller negativ korrelation, vilket betyder att man går upp som andra går ner (exempelvis människor som är äldre tenderar att spela videospel mindre ofta). Korrelation betyder bara en länk. Det innebär att veta en variabel (en person är verkligen hög) är tillräckligt för att göra en gissning på annan (den personen är troligen också ganska tung).
Observera att det är ett mycket vanligt misstag folk gör om korrelation, och detta måste åtgärdas. Kort sagt, är misstaget "korrelation innebär orsakssamband". Det är inte. Om jag har data som visar människor som frivilligt oftare tenderar att vara gladare, säga jag då inte "volontär. Det gör dig lycklig!"eftersom korrelationen inte antyda orsakssamband - det kan vara så att om du är nöjd du är mer sannolikt att frivilligt, och orsakssamband är tvärtom. Eller det kan vara att om du är rik, du är både mer sannolikt att vara glad och mer benägna att frivilligt, så data påverkas av en annan variabel helt.