Medel vs Median vs Läge
Medelvärde, median och läge är de primära måtten på central tendens som används i beskrivande statistik. De skiljer sig helt från varandra och fall där de används för att sammanfatta uppgifterna är också olika.
Betyda
Det aritmetiska medelvärdet är summan av datavärdena dividerat med antalet datavärden, dvs.
Om data kommer från ett provutrymme kallas det för ett sampelmedelvärde (
), vilket är en beskrivande statistik för provet. Även om det är det mest använda beskrivande måttet för ett prov, är det inte en robust statistik. Det är mycket känsligt för avvikelser och svängningar.
Tänk till exempel på medelinkomsten för medborgarna i en viss stad. Eftersom alla datavärden summeras och sedan delas in påverkar inkomst av en extremt förmögen person medelvärdet avsevärt. Därför är medelvärdena inte alltid en bra representation av data.
I fallet med en växlande signal varierar också strömmen som passerar genom ett element periodvis från den positiva riktningen till den negativa riktningen och vice versa. Om vi tar den genomsnittliga strömmen som passerar genom elementet under en enda period kommer det att ge ett 0, vilket betyder att ingen ström har passerat genom elementet, vilket uppenbarligen inte är sant. Därför är aritmetiska medelvärden i detta fall inte heller ett bra mått.
Det aritmetiska medelvärdet är en bra indikator när data fördelas jämnt. För en normalfördelning är medelvärdet lika med läget och medianen. Det har också de lägsta restmängderna när man överväger rotfelet för medelvärde i kvadrat; därför det bästa beskrivande måttet när det krävs att representera en dataset med ett enda nummer.
Median
Värdena för den mellersta datapunkten efter att alla datavärden har ordnats i stigande ordning definieras som medianen för datasetet. Median är den andra kvartilen, den 5: e decilen och den 50: e percentilen.
• Om antalet observationer (datapunkter) är udda är medianen observationen exakt mitt i den ordnade listan.
• Om antalet observationer (datapunkter) är jämnt, är medianen medelvärdet av de två mellersta observationerna i den ordnade listan.
Median delar observationen i två grupper; dvs. en grupp (50%) av högre värden och en grupp (50%) av värden lägre än medianen. Medianer används specifikt i skeva fördelningar och representerar data ganska bättre än det aritmetiska medelvärdet.
Läge
Läge är det mest förekommande numret i en uppsättning observationer. Läge för en datamängd beräknas genom att hitta frekvensen för varje element i uppsättningen.
• Om inget värde inträffar mer än en gång har datamängden inget läge.
• Annars är alla värden som uppstår med den största frekvensen ett läge för datamängden.
Mer än 1 läge kan finnas i en uppsättning; därför är läge inte en unik statistik för en dataset. I en enhetlig fördelning finns det ett läge. Läget för en diskret sannolikhetsfördelning är den punkt där sannolikhetsfunktionen når sin högsta punkt. Med tolkningar från ovanstående tolkningar kan vi säga att globala maxima är lägen.
Överväg tillämpningen av alla tre åtgärderna på följande datamängd.
DATA: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Genomsnitt = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25 = 8,12
Median = 9 (13: e element)
Läge = 9 (frekvens 9 = 5)
Vad är skillnaden mellan medelvärde, median och läge?
• Aritmetiskt medelvärde är summan av värdena (observationer) dividerat med antalet observationer. Det är inte en robust statistik och är starkt beroende av normalfördelningens natur inom den berörda distributionen. En enda avvikare kan orsaka en betydande förändring av medelvärdet som ger relativt vilseledande värden. Konceptet kan utvidgas till geometriskt medelvärde, harmoniskt medelvärde, viktat medelvärde och så vidare.
• Median är medelvärdena för uppsättningen observationer och påverkas relativt mindre av outliers. Det kan ge en bra uppskattning som sammanfattningsstatistiken i mycket snedställda fall.
• Mode är de vanligaste observationsvärdena i datasetet. Om fördelningen är positiv skev ligger läget kvar till medianen, och om negativt skevt ligger läget rätt till medianen.
• Om det är positivt snett är medelvärdet rätt för medianen; om negativt skevt medelvärde är till vänster om medianen.
• I normalfördelningen är alla tre, medelvärde, läge och median lika.