×

scala

SparkStreaming入门案例

办公资源 办公资源 发表于2024-04-20 浏览6819 评论0
实验一:SparkStreaming入门案例 参考文档 一.准备工作 实验环境:netcat (如果之前没有安装,需要下载:yum install -y nc) 二.任务分析 将nc作为服务器端,用户产生数据;启动sparkstreaming案例中的客户端程序,监听服务器端发送过来的数据,并对其数据进行词频统计,即为流式的wordcount入门程序 三.具体操作 启动nc为服务器端,执行:nc -l -p 6666,并输入数据测试: 启动客户端,执行:bin/run-ex

scala

09_Flink入门案例、word-count程序(java和scala版本)、添加依赖、Flink Streaming和Batch的区别 、在集群上执行程序等

wangmeda wangmeda 发表于2024-04-20 浏览4942 评论0
1.9.Flink入门案例-wordCount 1.9.1.开发工具 1.9.2.编写java版本word-count程序 1.9.2.1.添加Flink Maven依赖 1.9.2.2.编写wordcount的java代码 1.9.2.3.数据准备 1.9.2.4.执行结果 1.9.3.编写scala版本word-count程序 1.9.3.1.添加Flink依赖 1.9.3.2.编写wordcount的scala程序 1.9.4.Flink StreamingWindowWordCount

编程开发

Spark Streaming编程指南 中文WORD版(spark streaming实例)

星花园站长资源网 星花园站长资源网 发表于2024-04-18 浏览4252 评论0
Spark Streaming编程指南 中文WORD版,Spark Streaming属于Spark的核心api,它支持高吞吐量、支持容错的实时流数据处理。它可以接受来自Kafka, Flume, Twitter, ZeroMQ和TCP Socket的数据源,使用简单的api函数比如 map, reduce, join, window等操作,还可以直接使用内置的机器学习算法、图算法包来处理数据