Befolkning jämfört med standardavvikelse
I statistiken används flera index för att beskriva en datamängd som motsvarar dess centrala tendens, spridning och snedhet. Standardavvikelse är ett av de vanligaste måtten på spridning av data från mitten av datamängden.
På grund av praktiska svårigheter är det inte möjligt att använda data från hela befolkningen när en hypotes testas. Därför använder vi datavärden från prover för att dra slutsatser om populationen. I en sådan situation kallas dessa uppskattare eftersom de uppskattar populationsparametervärdena.
Det är oerhört viktigt att använda opartiska beräkningar för att dra slutsatsen. En uppskattning sägs vara opartisk om det förväntade värdet av den uppskattaren är lika med populationsparametern. Till exempel använder vi provmedlet som en opartisk uppskattning av populationsmedelvärdet. (Matematiskt kan det visas att det förväntade värdet av provmedlet är lika med populationsmedlet). I fallet med att uppskatta populationsstandardavvikelsen är standardavvikelsen i exemplet också en opartisk uppskattare.
Vad är standardavvikelse för befolkningen?
När data från hela befolkningen kan tas med i beräkningen (till exempel vid folkräkning) är det möjligt att beräkna befolkningsstandardavvikelsen. För att beräkna standardavvikelsen för befolkningen beräknas först avvikelserna för datavärdena från populationsmedelvärdet. Rots medelkvadrat (kvadratiskt medelvärde) för avvikelser kallas populationsstandardavvikelse.
I en klass om tio elever kan data om eleverna enkelt samlas in. Om en hypotes testas på denna studentpopulation finns det inget behov av att använda provvärden. Vikten för de tio eleverna (i kilogram) mäts till exempel till 70, 62, 65, 72, 80, 70, 63, 72, 77 och 79. Då är medelvikten för de tio personerna (i kg) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, vilket är 71 (i kg). Detta är befolkningens medelvärde.
För att beräkna populationsstandardavvikelsen beräknar vi avvikelser från medelvärdet. De respektive avvikelserna från medelvärdet är (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 och (79 - 71) = 8. Summan av avvikelsens kvadrater är (-1) 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. Befolkningsstandardavvikelse är √ (366/10) = 6,05 (i kg). 71 är den exakta medelvikten för eleverna i klassen och 6.05 är den exakta viktavvikelsen från 71.
Vad är exempel på standardavvikelse?
När data från ett urval (av storlek n) används för att uppskatta parametrar för populationen beräknas provets standardavvikelse. Först beräknas avvikelserna från datavärdena från provmedlet. Eftersom provmedelvärdet används istället för populationsmedelvärdet (vilket är okänt) är det inte lämpligt att ta det kvadratiska medelvärdet. För att kompensera för användningen av provmedelvärde divideras summan av kvadraterna på avvikelser med (n-1) istället för n. Provets standardavvikelse är kvadratroten av detta. I matematiska symboler är S = √ {∑ (x i -ẍ) 2 / (n-1)}, där S är standardavvikelsen för provet, ẍ är medelvärdet och x i är datapunkterna.
Antag nu att befolkningen i det föregående exemplet är eleverna i hela skolan. Då blir klassen bara ett exempel. Om detta prov används i beräkningen kommer provets standardavvikelse att vara √ (366/9) = 6,38 (i kg) eftersom 366 delades med 9 istället för 10 (provstorleken). Faktum att observera är att detta inte är garanterat det exakta standardavvikelsevärdet för befolkningen. Det är bara en uppskattning för det.
Vad är skillnaden mellan populationsstandardavvikelse och standardavvikelse? • Befolkningsstandardavvikelse är det exakta parametervärdet som används för att mäta spridningen från centrum, medan standardavvikelsen är en opartisk uppskattning för den. • Befolkningsstandardavvikelse beräknas när all information om varje individ i befolkningen är känd. Annars beräknas standardavvikelsen. • Befolkningsstandardavvikelse ges av σ = √ {∑ (xi-µ) 2 / n} där µ är populationsmedelvärdet och n är populationsstorleken men provets standardavvikelse ges av S = √ {∑ (xi-ẍ) 2 / (n-1)} där ẍ är provets medelvärde och n är provstorleken. |