Varför korrelation garanterar inte orsakssamband?

Sambandet visar ett möjligt samband mellan två slumpvariabler. Det står inte en variabel orsakar ett resultat i en annan. Det är vidare fel att dra slutsatsen om händelse B inträffar efter händelsen A, sedan A orsakade B. Ett exempel från Darrell Huff bok, "Hur att ljuga med statistik": en korrelation finns mellan rökning och låga betyg. Betyder det att rökning orsakar lågt betyg, eller låga betyg får människor att röka? Det verkar betydligt mer troligt att ingen av dessa saker produceras den andra, men att båda är en produkt av vissa tredje faktor. Inches regn i Spanien kan korrelera med temperaturerna i Mexiko, bara för att det är likheten mellan årstiderna. Små eller felaktigt tagna prov kan visa utmärkt korrelationer. Den kumulativa summan av födslar i Kina i ett år (varje dag är totalen summan av alla andra tidigare dagar) kommer att visa en utmärkt korrelation med den kumulativa summan av nederbörd i Tyskland. Detta samband är eftersom den samma värden upprepas i de kumulativa belopp.