Obsah:

Jak se vypořádáte s hodnotami NA v R?
Jak se vypořádáte s hodnotami NA v R?

Video: Jak se vypořádáte s hodnotami NA v R?

Video: Jak se vypořádáte s hodnotami NA v R?
Video: Rovnice a nerovnice s absolutní hodnotou [Opakujeme matematiku na VŠ - 3] 2024, Smět
Anonim

Když importujete datovou sadu z jiných statistických aplikací, chybějící hodnoty může být kódováno číslem, například 99. Abychom nechali R vím, že je to a chybějící hodnota musíte to překódovat. Další užitečná funkce v R na vypořádat se s chybějícími hodnotami je na . omit(), které odstraní neúplná pozorování.

Jen tak, jak se vypořádáte s NA v R?

NA opce v R

  1. vynechat a na. vyloučit: vrátí objekt s odstraněnými pozorováními, pokud obsahují nějaké chybějící hodnoty; rozdíly mezi vynecháním a vyloučením NA lze vidět v některých predikčních a reziduálních funkcích.
  2. pass: vrátí objekt beze změny.
  3. fail: vrátí objekt pouze v případě, že neobsahuje žádné chybějící hodnoty.

Podobně, jak řešíte chybějící kategorická data v R? Existují různé způsoby, jak zacházet s chybějícími hodnotami kategorických způsobů.

  1. Ignorujte pozorování chybějících hodnot, pokud máme co do činění s velkými soubory dat a menší počet záznamů má chybějící hodnoty.
  2. Ignorujte proměnnou, pokud není významná.
  3. Vyvinout model pro predikci chybějících hodnot.
  4. K chybějícím datům přistupujte jako k jiné kategorii.

Podobně se lze ptát, jak nastavíte chybějící hodnoty v R?

v R , chybějící hodnoty jsou reprezentovány symbolem NA (není dostupný). Nemožné hodnoty (např. dělení nulou) jsou reprezentovány symbolem NaN (nikoli číslem). Na rozdíl od SAS, R používá stejný symbol pro znak a číslici data . Pro více praxe při práci s chybějící data , vyzkoušejte tento kurz úklidu údaje v R.

Co znamená Na Rm v R?

Při použití funkce datového rámce na . rm v r odkazuje na logický parametr, který říká funkci, zda má či nemá odstranit NA hodnoty z výpočtu. To doslova znamená NA odstranit. Není to ani funkce, ani operace. Je to jednoduše parametr používaný několika funkcemi datového rámce.

Doporučuje: