Obsah:

Jaké jsou odlehlé hodnoty v analýze dat?
Jaké jsou odlehlé hodnoty v analýze dat?

Video: Jaké jsou odlehlé hodnoty v analýze dat?

Video: Jaké jsou odlehlé hodnoty v analýze dat?
Video: Finding an outlier in a dataset using Python 2024, Smět
Anonim

Ve statistikách an odlehlý je data bod, který se výrazně liší od ostatních pozorování. An odlehlý může být způsobena variabilitou měření nebo může znamenat experimentální chybu; ty druhé jsou někdy vyloučeny z data soubor. An odlehlý může způsobit vážné problémy statistické analýzy.

Jak s ohledem na to zjistíte v datech odlehlé hodnoty?

Bod, který spadá mimo data vnitřní ploty sady jsou klasifikovány jako vedlejší odlehlý , zatímco ten, který spadá mimo vnější ploty, je klasifikován jako hlavní odlehlý . Chcete-li najít vnitřní ploty pro vaše data set, nejprve vynásobte mezikvartilové rozmezí 1,5. Poté výsledek přičtěte k Q3 a odečtěte jej od Q1.

Kromě výše uvedeného, mám ze svých dat odstranit odlehlé hodnoty? Pro a většina, pokud vaše data jste postiženi těmito extrémními případy, vy umět vázaný a vstup pro historického představitele vaše data to vylučuje odlehlé hodnoty . Určete případ od případu co a účinek odlehlé hodnoty byl. A odtud se rozhodněte, zda chcete odstranit , změnit nebo zachovat nejvzdálenější hodnoty.

Jak se v tomto ohledu analýza dat vypořádává s odlehlými hodnotami?

Zde jsou čtyři přístupy:

  1. Zrušte odlehlé záznamy. V případě Billa Gatese nebo jiné skutečné odlehlé hodnoty je někdy nejlepší tento záznam zcela odstranit z vaší datové sady, aby tato osoba nebo událost nezkreslila vaši analýzu.
  2. Uzavřete svá odlehlá data.
  3. Přiřaďte novou hodnotu.
  4. Zkuste proměnu.

Jaký je příklad odlehlé hodnoty?

Odlehlá hodnota . more Hodnota, která "leží mimo" (ismuch menší nebo větší než) většinu ostatních hodnot v sadě dat. Pro příklad ve skóre 25, 29, 3, 32, 85, 33, 27, 28 jsou oba3 a 85 " odlehlé hodnoty ".

Doporučuje: