scala

前言本文介绍Spark三大数据结构之一的RDD的行动算子，通过配合案例使读者更加深刻的了解各大行动算子的作用及其使用方法； Spark 知识系列文章此处罗列了有关Spark相关知识的其他文章，有需要的可以进行点击查阅。 Spark 之 Spark框架及部署 Spark 之Spark三大数据结构 Spark 之 RDD转换算子 Spark 之 SparkSQL Spark 之 SparkStreaming 一

Windows环境下安装Spark并运行WordCount例子

牙郎 发表于2024-04-27 浏览8533 评论0

一、Windows下安装Spark 1、提前安装Java JDK Java版本是1.8，不能是18,16,15或者其他版本。 2、提前安装Scala Scala版本是2.13.1版本。 3、安装Spark 准备好Hadoop软件包（hadoop-2.7.7）和Spark软件包（spark-2.2.0-bin-hadoop2.7）。高级系统设置—>环境变量—>系统变量（选中Path）（接上一步）—>编辑—>新建（分别新建如下图所示变量

scala

SparkRDD算子练习（sparkrdd常用算子）

校长 发表于2024-04-27 浏览5995 评论0

练习一： val list = List(("zhangsan",85),("zhangsan",90),("zhangsan",76),("lisi",80),("lisi",75),("lisi",89)) 要求： 1. 创建对应的RDD，命名为rdd 2. 使用map算子，将rdd的数据进行转换操作输出每个同学的平均分 scala> val list = List(("zhangsan",85),("zhangsan",90),("zhangsan",76)

scala

python spark教程菜鸟教程_从零开始学习Spark（二）Scala基础

adgdaggd 发表于2024-04-27 浏览4426 评论0

Scala基础 Spark的原生语言是Scala，因此入门一下Scala是学习Spark的第一步，下面就快速入门一下，争取不花太多的时间。之后的简书中还会有Scala进阶，交代一些其他特性。这篇Scala基础应该可以暂时应付之后Spark的学习。 Scala运行在JVM上 Scala是纯面向对象的语言 Scala是函数式编程语言 Scala是静态类型语言 1. HelloWorld object HelloWorld { def main(args: Array[String

scala

Spark的shuffle（spark的shuffle过程）

sf123456 发表于2024-04-27 浏览5852 评论0

1. Spark的shuffle阶段发生在阶段划分时，也就是宽依赖算子时。宽依赖算子不一定发生shuffle。 2. Spark的shuffle分两个阶段，一个使Shuffle Write阶段，一个使Shuffle read阶段。 3. Shuffle Write阶段会选择分区器，比如HashPartitioner，RangePartitioner，或者使自定义分区器也会根据一些条件，来选择到底使用哪一个Writer对象 unsafeshuf

scala

spark运行自带例子_运行Spark例子程序（spark应用实例代码）

test123 发表于2024-04-27 浏览5062 评论0

一、安装和配置下载并解压Spark到指定目录，如果没有安装JDK、Scala，需要先下载JDK、Scala到指定目录，并设置SPKARK_HOME(JAVA_HOME、SCALA_HOME). 二、启动Spark或Spark集群如果只是在单节点上运行Spark，无需启动Spark，直接按『三、运行例子程序』运行即可。如若需要在集群上运行Spark例子程序，需要先启动Spark集群。将已经可以互相无密码登陆的从节点名(或IP地址)加入到主节点的conf/slaves文件中，再将配

scala

新闻网实时数据步骤（毕业设计）（数据新闻实践总结）

情侣 发表于2024-04-27 浏览6104 评论0

实时步骤 1.打开虚拟机 2.启动zookeeper 操作实现 jps验证 QuorumPeerMain 3.启动Hadoop 操作步骤再次jps验证此时的master是 4.手动切换active hdfs haadmin -transitionToActive --forcemanual nn1 步骤变化此时变成active 5.启动hbase 步骤变化效果 6.启动kafka 7.在master节点启动flume

scala

Spark 之 Spark框架及部署（spark的框架）

myus? 发表于2024-04-27 浏览4843 评论0

前言本文简单介绍有关Spark的框架、应用Spark实现WordCount案例以及Spark的部署的相关知识。 Spark 知识系列文章此处罗列了有关Spark相关知识的其他文章，有需要的可以进行点击查阅。 Spark 之Spark三大数据结构 Spark 之 RDD转换算子 Spark 之 RDD行动算子 Spark 之 SparkSQL Spark 之 SparkStreaming 一、Spar

scala

scala中的排序sortBy和map例子

sufz 发表于2024-04-27 浏览3731 评论0

API接口点击一直不会用sortBy，都是用sortWith,今天偶然看到一个sortBy的写法，觉得很高级，分享一下 var ll = List[(String, Int, Int)](("a",1, 400),("b",3, 600),("m",3, 100),("c",2, 40)) println(ll) var a = ll.map{case Tuple3(name:String, age:Int, salary:Int)=>(name,age, salary)}.so

scala

重学scala：scala面向对象编程之继承（scala 继承）

812727627 发表于2024-04-27 浏览3967 评论0

1、继承extends scala使用extends关键字来实现继承。可以在子类中定义父类中没有的字段和方法，或者重写父类的方法。示例1：实现简单继承 class Person1 { var name = "super" def getName: String = this.name } class Student1 extends Person1 object Main1 { def main(args: Array[String]): Unit = {

scala

kakfa 3.0 创建topic流程(源码)（kafka客户端创建topic）

leofree 发表于2024-04-27 浏览7682 评论0

1、通过create命令到组装创建topic需要的数据流程(scala部分) 首先创建kafka topic的命令是下面这个 bin/kafka-topics.sh --bootstrap-server broker_host:port --create --topic my_topic_name \--partitions 20 --replication-factor 3 --config x=y --bootstrap-server 某一台kafka服务器地址和端口--c

scala

【Spark】SparkShell的运行（sparkshell怎么启动）

正邦鞋业 发表于2024-04-27 浏览5727 评论0

简介：spark-shell是Spark自带的交互式Shell程序，方便用户进行交互式编程，用户可以在该命令行下用scala编写spark程序。 spark shell的流程启动 Spark shell 进入Spark 安装目录后执行 spark-shell --master master 就可以提交Spark 任务 Spark shell 的原理是把每一行 Scala 代码编译成类, 最终交由 Spark 执行Master的地址可以有如下几种设置方式具体

ZBlogIt

Nice to meet you, too!

数据仓库

Онлайн-казино Ramen Bet Casino - это мес...

scala

Spark 之 RDD行动算子（spark rdd的常用算子）

田小会 发表于2024-04-27 浏览5009 评论0

scala

Windows环境下安装Spark并运行WordCount例子

牙郎 发表于2024-04-27 浏览8533 评论0

scala

SparkRDD算子练习（sparkrdd常用算子）

校长 发表于2024-04-27 浏览5995 评论0

scala

python spark教程菜鸟教程_从零开始学习Spark（二）Scala基础

adgdaggd 发表于2024-04-27 浏览4426 评论0

scala

Spark的shuffle（spark的shuffle过程）

sf123456 发表于2024-04-27 浏览5852 评论0

scala

spark运行自带例子_运行Spark例子程序（spark应用实例代码）

test123 发表于2024-04-27 浏览5062 评论0

scala

新闻网实时数据步骤（毕业设计）（数据新闻实践总结）

情侣 发表于2024-04-27 浏览6104 评论0

scala

Spark 之 Spark框架及部署（spark的框架）

myus? 发表于2024-04-27 浏览4843 评论0

scala

scala中的排序sortBy和map例子

sufz 发表于2024-04-27 浏览3731 评论0

scala

重学scala：scala面向对象编程之继承（scala 继承）

812727627 发表于2024-04-27 浏览3967 评论0

scala

kakfa 3.0 创建topic流程(源码)（kafka客户端创建topic）

leofree 发表于2024-04-27 浏览7682 评论0

scala

【Spark】SparkShell的运行（sparkshell怎么启动）

正邦鞋业 发表于2024-04-27 浏览5727 评论0

« 2023年9月 »
一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30