Vodič za Apache Spark pruža osnovne i napredne koncepte Spark-a. Naš vodič za Spark dizajniran je za početnike i profesionalce.
Spark je objedinjeni analitički mehanizam za obradu podataka velikih razmjera uključujući ugrađene module za SQL, strujanje, strojno učenje i obradu grafikona.
Naš vodič za Spark uključuje sve teme o Apache Sparku s uvodom u Spark, Instalacija Spark, Arhitektura Spark, Komponente Spark, RDD, Spark primjeri u stvarnom vremenu i tako dalje.
Što je Spark?
Apache Spark je open-source cluster computing framework. Njegova primarna svrha je rukovanje podacima generiranim u stvarnom vremenu.
Spark je izgrađen na vrhu Hadoop MapReduce. Optimiziran je za rad u memoriji, dok alternativni pristupi poput Hadoopovog MapReducea zapisuju podatke na i s tvrdih diskova računala. Dakle, Spark obrađuje podatke puno brže od drugih alternativa.
Povijest Apache Spark
Spark je pokrenuo Matei Zaharia iz UC Berkeley's AMLab 2009. Otvoren je izvor 2010. pod BSD licencom.
Godine 2013. projekt je otkupila Apache Software Foundation. Godine 2014. Spark se pojavio kao Apache projekt najviše razine.
Značajke Apache Spark
Upotreba Spark-a
Preduvjet
Prije nego naučite Spark, morate imati osnovno znanje o Hadoopu.
Publika
Naš Spark vodič osmišljen je da pomogne početnicima i profesionalcima.
Problemi
Uvjeravamo vas da nećete pronaći nikakav problem s ovim Spark vodičem. Međutim, ako postoji bilo kakva pogreška, objavite problem u obrascu za kontakt.