Spark 教程学习手册
收录于 2023-04-20 00:10:05 · English · بالعربية · Español · हिंदीName · 日本語 · Русский язык · 中文繁體
Apache Spark 教程
Apache Spark 教程提供了 Spark 的基本和高级概念。我们的 Spark 教程专为初学者和专业人士设计。
Spark 是用于大规模数据处理的统一分析引擎,包括用于 SQL、流、机器学习和图形处理的内置模块。
我们的 Spark 教程包括 Apache Spark 的所有主题,包括 Spark 介绍、Spark 安装、Spark 架构、Spark 组件、RDD、Spark 实时示例等。
什么是 Spark?
Apache Spark 是一个开源集群计算框架。它的主要目的是处理实时生成的数据。
Spark 建立在 Hadoop MapReduce 之上。它被优化为在内存中运行,而像 Hadoop 的 MapReduce 这样的替代方法可以将数据写入计算机硬盘驱动器或从计算机硬盘驱动器写入数据。因此,Spark 处理数据的速度比其他替代方案快得多。
Apache Spark 的历史
Spark 是由 Matei Zaharia 在 2009 年在加州大学伯克利分校的 AMPLab 发起的。它于 2010 年在 BSD 许可下开源。
2013 年,该项目被 Apache 软件基金会收购。 2014 年,Spark 成为顶级 Apache 项目。