Spark 第6页 - 星花园站长资源网

安装spark-2.4.4-bin-hadoop2.7版本匹配Hadoop2.7版本上传，解压（一）修改环境变量：vi /etc/profile export SPARK_HOME=/opt/spark export PATH=$PATH:$SPARK_HOME/bin wq source /etc/profile （二）修改配置文件：cd /opt/spark/conf cp spark-env.sh.template spark-env.sh vi spark-env.

编程开发

用Apache Spark进行大数据处理-第一部分:入门介绍中文WORD版（大数据处理框架apache spark设计与实现）

星花园站长资源网 发表于2024-05-12 浏览4783 评论0

用Apache Spark进行大数据处理-第一部分:入门介绍中文WORD版,本文档主要讲述的是用Apache Spark进行大数据处理——第一部分：入门介绍；Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发，并于2010年成为Apache的开源项目之一。感兴趣的朋友可以过来看看

大数据

如何在万亿级别规模的数据量上使用 Spark？（千万级数据量）

站长资讯网友投稿帖 发表于2024-05-12 浏览3176 评论0

Spark 作为大数据计算引擎，凭借其快速、稳定、简易等特点，快速的占领了大数据计算的领域。本文主要为作者在搭建使用计算平台的过程中，对于 Spark 的理解，希望能给读者一些学习的思路。

大数据

Apache Spark源码走读之1:论文阅览笔记（apache spark介绍）

站长资讯网友投稿帖 发表于2024-05-12 浏览3925 评论0

源码阅读是一件非常容易的事，也是一件非常难的事。容易的是代码就在那里，一打开就可以看到。难的是要通过代码明白作者当初为什么要这样设计，设计之初要解决的主要问题是什么。在对Spark的源码进行具体的走读之前，如果想要快速对Spark的有一个整体性的认识，阅读Matei Zaharia做的Spark论文是一个非常不错的选择。在阅读该论文的基础之上，再结合Spark作者在2012 Developer Meetup上做的演讲Introduction to Spark Internals，那么对于Spark的内部实现会有一个比较大概的了解。有了上述的两篇文章奠定基础之后，再来进行源码阅读，

大数据

Spark 1.2：向MapReduce在Hadoop中的控制位置建议应战（spark和mapreduce的区别）

站长资讯网友投稿帖 发表于2024-05-12 浏览3608 评论0

面向Hadoop的Spark内存内框架最新版本在集群性能改进之外，也加入了针对Python的更多支持能力。

大数据

Spark1.2新特性概述（spark2.0新特性）

站长资讯网友投稿帖 发表于2024-05-12 浏览3544 评论0

Spark Contributor、Spark布道者陈超通过本文总结了Spark 1.2版本的新特性，其中包括Spark Core、Spark Streaming、MLlib、GraphX、Spark SQL等方面，方便大家了解学习。

scala

spark 1.6 java版本_Spark版本与各语言版本对应关系小汇总

热心王友 发表于2024-05-12 浏览6234 评论0

再不点蓝字关注，机会就要飞走了哦！ Spark版本 2.2.0 Spark运行在Java 8+，Python 2.7 + / 3.4 +和R 3.1+上。对于Scala API，Spark 2.2.0使用Scala 2.11。您将需要使用兼容的Scala版本(2.11.x)。请注意，从Spark 2.2.0开始，对2.6.5之前的Java 7，Python 2.6和旧Hadoop版本的支持已被删除。请注意，从Spark 2.1.0开始不支持Scala 2.10，可能

大数据

大数据技能的对决——Spark对Impala对Hive对Presto（hive impala spark）

站长资讯网友投稿帖 发表于2024-05-12 浏览3133 评论0

在大数据浪潮全面来袭的历史背景下，我们一直面临着同一类难题的困扰——该选择哪款工具解决相关问题?这项挑战在大数据SQL引擎领域同样存在。

大数据

解析Spark在腾讯、yahoo、优酷的成功使用

站长资讯网友投稿帖 发表于2024-05-12 浏览3690 评论0

Spark作为Apache顶级的开源项目，项目主页见http://spark.apache.org。在迭代计算，交互式查询计算以及批量流计算方面都有相关的子项目，如Shark、Spark Streaming、MLbase、GraphX、SparkR等。从13年起Spark开始举行了自已的Spark Summit会议，会议网址见http://spark-summit.org。Amplab实验室单独成立了独立公司Databricks来支持Spark的研发。

scala

Spark在Windows下的环境搭建（spark windows环境开发）

Vincent沈卫庆 发表于2024-05-12 浏览4728 评论0

由于Spark是用Scala来写的，所以Spark对Scala肯定是原生态支持的，因此这里以Scala为主来介绍Spark环境的搭建，主要包括四个步骤，分别是：JDK的安装，Scala的安装，Hadoop的下载和配置，Spark的安装。为了突出”From Scratch”的特点（都是标题没选好的缘故），所以下面的步骤稍显有些啰嗦，老司机大可不必阅读，直接跳过就好。　　一．JDK的安装与环境变量的设置安装很简单，就不再详述二. Scala的安装　　首先从DOWNLOAD P

大数据

Databricks连城：Spark打造一体化大数据流水线

站长资讯网友投稿帖 发表于2024-05-11 浏览5792 评论0

连城老师目前专注于以Spark为主的大数据分析系统，Spark SQL为Spark提供了原生的SQL关系查询能力，并进一步增强了Spark操纵结构化数据的能力。演讲伊始，连城率先分享了当今大数据的问题以及数据分析流程，通常的做法是在hadoop之上刻画框架。因此所有流程是基于HDFS，所得到的是有效的数据处理结果占比全部数据处理的比例并不高。

scala

Spark的动态Executor机制

电脑爱好者 发表于2024-05-11 浏览4415 评论0

最近在Spark程序运行的过程中发现了一个问题，系统每天会运行很多任务，任务计算逻辑是一样的，但是每个任务拉去的数据量有多有少，不知道怎么给Spark程序设置多少资源比较合理。这时候Spark的动态Executor分配机制就派上用场了，它会根据当前任务运行的情况自动调整Executor的数量，实现资源的弹性分配。 Spark的动态Executor分配机制介绍： //开启Dynamic Resource Allocation spark.dynamicAllocation.enable

ZBlogIt

Nice to meet you, too!

数据仓库

Игровые казино стали популярными развлеч...

scala

Spark的搭建及实现单词统计

梅菜扣肉 发表于2024-05-12 浏览5723 评论0

编程开发

用Apache Spark进行大数据处理-第一部分:入门介绍中文WORD版（大数据处理框架apache spark设计与实现）

星花园站长资源网 发表于2024-05-12 浏览4783 评论0

大数据

如何在万亿级别规模的数据量上使用 Spark？（千万级数据量）

站长资讯网友投稿帖 发表于2024-05-12 浏览3176 评论0

大数据

Apache Spark源码走读之1:论文阅览笔记（apache spark介绍）

站长资讯网友投稿帖 发表于2024-05-12 浏览3925 评论0

大数据

Spark 1.2：向MapReduce在Hadoop中的控制位置建议应战（spark和mapreduce的区别）

站长资讯网友投稿帖 发表于2024-05-12 浏览3608 评论0

大数据

Spark1.2新特性概述（spark2.0新特性）

站长资讯网友投稿帖 发表于2024-05-12 浏览3544 评论0

scala

spark 1.6 java版本_Spark版本与各语言版本对应关系小汇总

热心王友 发表于2024-05-12 浏览6234 评论0

大数据

大数据技能的对决——Spark对Impala对Hive对Presto（hive impala spark）

站长资讯网友投稿帖 发表于2024-05-12 浏览3133 评论0

大数据

解析Spark在腾讯、yahoo、优酷的成功使用

站长资讯网友投稿帖 发表于2024-05-12 浏览3690 评论0

scala

Spark在Windows下的环境搭建（spark windows环境开发）

Vincent沈卫庆 发表于2024-05-12 浏览4728 评论0

大数据

Databricks连城：Spark打造一体化大数据流水线

站长资讯网友投稿帖 发表于2024-05-11 浏览5792 评论0

scala

Spark的动态Executor机制

电脑爱好者 发表于2024-05-11 浏览4415 评论0

« 2023年9月 »
一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30