Rozdíl mezi průměrem, středem a režimem

Střední vs. střední vs. režim
 

Střední, střední a režim jsou primární opatření centrální tendence používá se v popisné statistice. Jsou od sebe zcela odlišné a případy, ve kterých se používají k shrnutí údajů, se také liší.

Znamenat

Aritmetický průměr je součet datových hodnot dělený počtem datových hodnot, tj.

 

Pokud jsou data z ukázkového prostoru, nazývá se průměrný vzorek (), což je popisná statistika vzorku. Ačkoli se jedná o nejčastěji používané popisné opatření pro vzorek, nejedná se o robustní statistiku. Je velmi citlivý na odlehlé hodnoty a oscilace.

Zvažte například průměrný příjem občanů konkrétního města. Protože jsou všechny hodnoty dat sečteny a poté rozděleny, příjem mimořádně bohatého člověka významně ovlivňuje průměr. Proto střední hodnoty nejsou vždy dobrým zastoupením dat.

Také v případě střídavého signálu se proud procházející elementem periodicky mění z pozitivního směru do negativního směru a naopak. Pokud vezmeme průměrný proud procházející elementem v jedné periodě, dá to 0, což znamená, že proudem nepronikl žádný proud, což zjevně není pravda. I v tomto případě tedy není aritmetický průměr dobrým měřítkem.

Aritmetický průměr je dobrým ukazatelem, pokud jsou data rovnoměrně distribuována. Pro normální rozdělení je průměr stejný jako režim a střední hodnota. Má také nejnižší zbytky při zvažování střední střední kvadratické chyby; nejlepším popisným opatřením proto je, když je třeba reprezentovat datový soubor jediným číslem.

Medián

Hodnoty středního datového bodu po uspořádání všech datových hodnot ve vzestupném pořadí jsou definovány jako medián datové sady. Medián je 2. kvartil, 5. decil a 50 percentil.

• Pokud je počet pozorování (datové body) lichý, pak je mediánem pozorování přesně uprostřed uspořádaného seznamu.

• Je-li počet pozorování (datové body) sudý, pak je střední hodnota průměrem dvou středních pozorování v uspořádaném seznamu.

Median rozděluje pozorování do dvou skupin; tj. skupina (50%) hodnot vyšších a skupina (50%) hodnot nižších než střední hodnota. Mediány jsou specificky používány v šikmých distribucích a představují data mnohem lepší než aritmetický průměr.

Režim

Režim je nejčastěji se vyskytující číslo v sadě pozorování. Režim sady dat se vypočítá zjišťováním frekvence každého prvku v sadě.

• Pokud se žádná hodnota neobjeví více než jednou, sada dat nemá režim.

• Jinak jakákoli hodnota, která se objeví s nejvyšší frekvencí, je režimem datové sady.

V sadě může existovat více než 1 režim; proto režim není jedinečnou statistikou datového souboru. Při rovnoměrném rozdělení existuje jeden režim. Režim diskrétního rozdělení pravděpodobnosti je bod, kde funkce pravděpodobnostní hmotnosti dosáhne svého nejvyššího bodu. Rendering z výše uvedených interpretací to můžeme říci globální maxima jsou režimy.

Zvažte použití všech tří opatření na následující soubor údajů.

ÚDAJE: 1, 1, 2, 3, 5, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 10, 14, 14, 15, 15 , 15

Průměr = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15 ) / 25 = 8,12

Střední hodnota = 9 (13. prvek)

Režim = 9 (frekvence 9 = 5)

Jaký je rozdíl mezi průměrem, středem a režimem?

• Aritmetický průměr je součet hodnot (pozorování) děleno počtem pozorování. Není to robustní statistika a silně závisí na povaze normální distribuce v uvažované distribuci. Jediný odlehlý údaj může způsobit výrazný posun v průměru, což dává relativně zavádějící hodnoty. Koncept může být rozšířen na geometrický průměr, harmonický průměr, vážený průměr atd.

• Medián je střední hodnota souboru pozorování a je relativně méně ovlivněna odlehlými hodnotami. Ve vysoce šikmých případech může poskytnout dobrý odhad jako souhrnnou statistiku.

• Režim je nejčastějšími pozorovacími hodnotami v datovém souboru. Pokud je distribuce kladně zkosená, režim leží vlevo na střední a, pokud je záporně zkosený, režim leží přímo na střední.

• Pokud je kladně zkosená, střední hodnota je přímo ke střední hodnotě; pokud záporně zkosený průměr je nalevo od mediánu.

• Při normálním rozdělení jsou všechny tři, střední, režim a střední hodnoty stejné.