Vad säger oss standardavvikelsen för en uppsättning data om data och varför är standardavvikelsen en viktig åtgärd?

Standardavvikelsen Explained: standardavvikelse är ett enkelt mått på bredden på en fördelning av nummer (vanligtvis noter eller mätningar). Det är den nästa höga graden av sofistikering för kännetecknar en massa tal än bara ge den genomsnittliga (eller medelvärdet, medianen, läge). Om du vet genomsnittligt, vet du inte hur tätt siffrorna är grupperade runt genomsnittet, som är vad standardavvikelsen berättar. Det finns en definition, den vanligaste definitionen av bredden i en distribution.
(Det finns naturligtvis många andra ytterligare karakteriseringar.)

Det är viktigt eftersom den talar om genomsnittet är en mycket användbar mängd för att använda för att tolka data. Om någon säger att den genomsnittliga personen din ålder dör i 50 år, som verkar viktigt, men om någon säger att den genomsnittliga personen dör i 50 år, ge eller ta 20 år, plötsligt inser du det finns mer till historien och kanske du bör spara mer pengar, bara i fall. Tja, är den "ge eller ta" delen av detta uttalande mycket användbar, men inte väldefinierade. Om de säger att den förväntade livslängden är 50 år med en standardavvikelse på 20 år, sedan som perfekt definieras matematiskt. Standardavvikelse är ett matematisk mått på bredden av distributionen av data.

De följande två uppsättningarna data, A och B har samma medelvärde (genomsnitt):
A: 48, 49, 50, 51, 52
B: 30, 40, 50, 60, 70

Distribution av data om medelvärdet i A är mycket smal, medan fördelningen runt medelvärdet i B är bred. S.D. ger oss en kvantifiering av bredden av distributionen.
I normal distributioner, kommer att cirka 68 procent av data falla inom en S.D. på vardera sidan av medelvärdet. Cirka 96 procent av data kommer att falla med två S.D.
Låt oss säga att din lärare ger ett test till hundra barn och test genomsnittet är 80 poäng och S.D. är 10. Om fördelningen är "normalt", cirka 34 barn poäng mellan 70 och 80 och ca 34 barn poäng mellan 80 och 90. Vi kan också förutse att ca 14 barn poäng mellan 90 och 100, och 14 poäng under 70. Som lämnar fyra barn. De kan indelas i två grupper: de antingen helt bombat testet, eller de extra kredit frågan att öka deras poäng över 100!