Apache Spark

Apache Spark , büyük veri kümeleri üzerinde paralel olarak işlem yapmamızı sağlayan Scala
ile geliştirilmiş açık kaynak kodlu kütüphanedir.
Aklınıza ilk şu soru gelebilir . Hadoop varken Spark a neden ihtiyaç duyayım ?
Apache Hadoop özetle bize iki bileşen sunar . HDFS ve MapReduce .
 HDFS ile verileri birden fazla makinada saklayabilir ve yönetebiliriz .
 MapReduce ile büyük verileri paralel olarak işleyebiliriz

Genel olarak Spark ı , MapReduce alternatifi olarak kullanabiliriz . Biz Hadoop kullanarak
verileri yine HDFS de saklayabiliriz fakat Apache Spark ile bu verileri daha kolay ve
daha hızlı bir biçimde işleyebiliriz.

Spark ın özellikleri nelerdir ?
 Kullanımı kolaydır . Daha önce MapReduce ile geliştirdiğimiz projeleri Apache Spark ile
daha az eforla geliştirebiliyoruz
 MapReduce a göre daha hızlıdır . Spark , kendi sitesinde MapReduce a göre memory
işlemlerini 100 kat daha hızlı yaptığını iddaa etmektedir . Ama genel olarak daha hızlı
diyebiliriz

Copy Protected by Chetan's WP-Copyprotect.