Apache Hadoop
Ova lekcija opisuje softversko okruženje za obradu velikih količina podataka Apache Hadoop, njegove komponente koji upotpunjavaju i proširuju mogućnosti Hadoop-a, kao i njegovo korištenje u praksi. Da bismo u potpunosti razumeli prednosti Hadoop-a, potrebno je sagledati najpre razliku između paralelnog i distribuiranog računanja, načine čuvanja (HDFS arhitekturu), upravljanje resursima i procesiranja podataka, princip horizontalne skalabilnosti, itd.