Zahrnujete odlehlé hodnoty do 5ti číselného souhrnu?
Zahrnujete odlehlé hodnoty do 5ti číselného souhrnu?

Video: Zahrnujete odlehlé hodnoty do 5ti číselného souhrnu?

Video: Zahrnujete odlehlé hodnoty do 5ti číselného souhrnu?
Video: Is it Safe to Remove Outliers from Data? 2024, Smět
Anonim

The pět čísel jsou minimum, hodnota prvního kvartilu (Q1), medián, hodnota třetího kvartilu (Q3) a maximum. První věc vy si můžete všimnout o této datové sadě je číslo 27. To se velmi liší od ostatních údajů. Je to an odlehlý a musí být odstraněny.

Zahrnujete do rozsahu odlehlé hodnoty?

Rozsah je docela užitečný údaj o tom, jak jsou data rozprostřena, ale má některá vážná omezení. Někdy totiž mohou mít data odlehlé hodnoty které jsou daleko od ostatních datových bodů. V těchto případech je rozsah nemusí poskytovat pravdivý údaj o šíření dat.

co je považováno za mimořádnou hodnotu? An odlehlý je pozorování, které leží mimo celkový vzorec distribuce (Moore a McCabe 1999). Pohodlná definice an odlehlý je bod, který spadá více než 1,5násobek mezikvartilového rozmezí nad třetí kvartil nebo pod první kvartil.

Z čeho se tedy skládá 5ti číselný souhrn?

Pět- souhrny čísel A pět - číselný souhrn je zvláště užitečný při deskriptivních analýzách nebo při předběžném zkoumání velkého souboru dat. A shrnutí se skládá z pět hodnot: nejextrémnější hodnoty v souboru dat (maximální a minimální hodnoty), dolní a horní kvartil a medián.

Co je to pravidlo 1,5 IQR?

Použití mezikvartilu Pravidlo najít odlehlé hodnoty Vynásobte mezikvartilové rozmezí ( IQR ) od 1.5 (konstanta používaná k rozpoznání odlehlých hodnot). Přidat 1.5 X ( IQR ) do třetího kvartilu. Jakékoli číslo vyšší než toto je předpokládaná odlehlá hodnota. Odčítat 1.5 X ( IQR ) z prvního kvartilu. Jakékoli číslo menší než toto je předpokládaná odlehlá hodnota.

Doporučuje: