Jaké jsou odlehlé hodnoty v analýze dat?
Jaké jsou odlehlé hodnoty v analýze dat?
Anonim

Ve statistikách an odlehlý je data bod, který se výrazně liší od ostatních pozorování. An odlehlý může být způsobena variabilitou měření nebo může znamenat experimentální chybu; ty druhé jsou někdy vyloučeny z data soubor. An odlehlý může způsobit vážné problémy statistické analýzy.

Jak s ohledem na to zjistíte v datech odlehlé hodnoty?

Bod, který spadá mimo data vnitřní ploty sady jsou klasifikovány jako vedlejší odlehlý , zatímco ten, který spadá mimo vnější ploty, je klasifikován jako hlavní odlehlý . Chcete-li najít vnitřní ploty pro vaše data set, nejprve vynásobte mezikvartilové rozmezí 1,5. Poté výsledek přičtěte k Q3 a odečtěte jej od Q1.

Kromě výše uvedeného, mám ze svých dat odstranit odlehlé hodnoty? Pro a většina, pokud vaše data jste postiženi těmito extrémními případy, vy umět vázaný a vstup pro historického představitele vaše data to vylučuje odlehlé hodnoty . Určete případ od případu co a účinek odlehlé hodnoty byl. A odtud se rozhodněte, zda chcete odstranit , změnit nebo zachovat nejvzdálenější hodnoty.

Jak se v tomto ohledu analýza dat vypořádává s odlehlými hodnotami?

Zde jsou čtyři přístupy:

  1. Zrušte odlehlé záznamy. V případě Billa Gatese nebo jiné skutečné odlehlé hodnoty je někdy nejlepší tento záznam zcela odstranit z vaší datové sady, aby tato osoba nebo událost nezkreslila vaši analýzu.
  2. Uzavřete svá odlehlá data.
  3. Přiřaďte novou hodnotu.
  4. Zkuste proměnu.

Jaký je příklad odlehlé hodnoty?

Odlehlá hodnota . more Hodnota, která "leží mimo" (ismuch menší nebo větší než) většinu ostatních hodnot v sadě dat. Pro příklad ve skóre 25, 29, 3, 32, 85, 33, 27, 28 jsou oba3 a 85 " odlehlé hodnoty ".

Doporučuje: