Ova lekcija opisuje softversko okruženje za obradu velikih količina podataka Apache Hadoop, njegove komponente koji upotpunjavaju i proširuju mogućnosti Hadoop-a, kao i njegovo korištenje u praksi. Da bismo u potpunosti razumeli prednosti Hadoop-a, potrebno je sagledati najpre razliku između paralelnog i distribuiranog računanja, načine čuvanja (HDFS arhitekturu), upravljanje resursima i procesiranja podataka, princip horizontalne skalabilnosti, itd. Rad dalje analizira prednosti i nedostaci, kao i primenu Hadoop ekosistema u različitim industrijama (finansijski sektor, maloprodajni sektor i zdravstvo).
Module