Co je AWS MapReduce?
Co je AWS MapReduce?

Video: Co je AWS MapReduce?

Video: Co je AWS MapReduce?
Video: Scaling your Analytics with Amazon Elastic MapReduce (BDT301) | AWS re:Invent 2013 2024, Smět
Anonim

Amazon Elastic MapReduce (EMR) je Amazon Web Services ( AWS ) nástroj pro zpracování a analýzu velkých dat. Amazon EMR zpracovává velká data přes cluster virtuálních serverů Hadoop na Amazon Elastic Compute Cloud (EC2) a Amazon Simple Storage Service (S3).

Jak tímto způsobem AWS EMR funguje?

Služba spouští zákazníkem stanovený počet instancí Amazon EC2, které se skládají z jednoho hlavního serveru a několika dalších uzlů. Amazonka EMR na těchto instancích spouští software Hadoop. Hlavní uzel rozděluje vstupní data do bloků a distribuuje zpracování bloků do ostatních uzlů.

Kromě výše uvedeného, jaký je rozdíl mezi ec2 a EMR? Na rozdíl od EMR , EC2 nerozděluje podřízené uzly na hlavní a úkolové uzly. To zvyšuje riziko ztráty dat HDFS v případě odebrání/ztráty uzlu. EC2 používá knihovny Apache (s3a) pro přístup k datům na s3. Na druhou stranu, EMR používá proprietární kód AWS pro rychlejší přístup k s3.

Kromě toho, je AWS EMR plně spravováno?

Amazonka Elastická MapReduce ( EMR ) je plně řízena Platforma Hadoop a Spark od Amazonka Webová služba ( AWS ). S EMR , AWS zákazníci mohou rychle roztočit víceuzlové clustery Hadoop pro zpracování velkých objemů dat.

Používá AWS Hadoop?

Amazonka Webové služby používá open-source Apache hadoop distribuovaná výpočetní technologie, která usnadňuje přístup k velkému množství výpočetního výkonu pro provádění úloh náročných na data. hadoop , open-source verzi Google MapReduce, již používají společnosti jako Yahoo a Facebook.

Doporučuje: