Median vs genomsnitt (medelvärde)
Median och medelvärde är mått på central tendens i beskrivande statistik. Aritmetiskt medelvärde betraktas ofta som genomsnittet av en uppsättning observationer. Därför betraktas här medelvärdet som genomsnittet. Men genomsnittet är inte det aritmetiska medelvärdet hela tiden.
Genomsnitt
Det aritmetiska medelvärdet är summan av datavärdena dividerat med antalet datavärden, dvs.
Om data kommer från ett provutrymme kallas det för ett sampelmedelvärde (
), vilket är en beskrivande statistik för provet. Även om det är det mest använda beskrivande måttet för ett prov, är det inte en robust statistik. Det är mycket känsligt för avvikelser och svängningar.
Tänk till exempel på medelinkomsten för medborgarna i en viss stad. Eftersom alla datavärden summeras och sedan delas in påverkar inkomst av en extremt förmögen person medelvärdet avsevärt. Därför är medelvärdena inte alltid en bra representation av data.
I fallet med en växlande signal varierar också strömmen som passerar genom ett element periodvis från den positiva riktningen till den negativa riktningen och vice versa. Om vi tar den genomsnittliga strömmen som passerar genom elementet under en enda period kommer det att ge ett 0, vilket betyder att ingen ström har passerat genom elementet, vilket uppenbarligen inte är sant. Därför är aritmetiska medelvärden i detta fall inte heller ett bra mått.
Det aritmetiska medelvärdet är en bra indikator när data fördelas jämnt. För en normalfördelning är medelvärdet lika med läget och medianen. Det har också de lägsta restmängderna när man överväger rotfelet för medelvärde i kvadrat; därför det bästa beskrivande måttet när det krävs att representera en dataset med ett enda nummer.
Median
Värdena för den mellersta datapunkten efter att alla datavärden har ordnats i stigande ordning definieras som medianen för datasetet.
• Om antalet observationer (datapunkter) är udda är medianen observationen exakt mitt i den ordnade listan.
• Om antalet observationer (datapunkter) är jämnt, är medianen medelvärdet av de två mellersta observationerna i den ordnade listan.
Median delar observationen i två grupper; dvs. en grupp (50%) av högre värden och en grupp (50%) av värden lägre än medianen. Medianer används specifikt i skeva fördelningar och representerar data ganska bättre än det aritmetiska medelvärdet.
Median vs genomsnitt (genomsnitt)
• Både medelvärde och median är mått på central tendens och sammanfattar data. Medelvärdet är oberoende av positionen för datapunkterna, men medianen beräknas med hjälp av positionen.
• Medel påverkas starkt av avvikare medan medianen inte påverkas.
• Median är därför ett bättre mått än medelvärdet i fall av mycket sned fördelningar.
• I standarden är normalfördelningar samma och medelvärdena.