×

scala

Spark实战:单词统计

zhuan888 zhuan888 发表于2024-05-16 浏览5896 评论0
WordCount程序 首先看来一个快速入门案例,单词计数 这个需求就是类似于我们在学习MapReduce的时候写的案例 需求这样的:读取文件中的所有内容,计算每个单词出现的次数 这个需求就没什么好分析的了,咱们之前在学习MapReduce的已经分析过了,接下来就来看一下使用 Spark需要如何实现。 Scala代码开发 这里先使用Scala开发,sdk版本为:scala-2.11.12 以下为配置scala sdk与scala开发目录的步骤: 开发环境配置完毕 最后需要添加Spa

scala

Spark+Scala建设数仓和数据分析(scala开发spark)

indexie indexie 发表于2024-05-16 浏览24676 评论0
数据分析系统架构 一、系统架构图 数据分析平台采用Cloudrea Manager建设,使用Scala语言开发啊,Spark On Hive模式,Spark SQL进行数据分析,Hive+Hdfs作为数据仓库存储,Oozie进行工作流调度,通过Hue进行管理与应用 二、数仓各层介绍(ODS、DW、DM、共享库) DB 是现有的数据来源,可以为mysql、SQLserver、文件日志等,为数据仓库提供数据来源的一般存在于现有的业务系统之中。 ETL的是 Extract-