×

scala

Spark3.2.0 Standalone集群模式部署教程

神经蛙 神经蛙 发表于2024-05-26 浏览6721 评论0
整体概述 Spark3.2.0 在Centos7 部署安装教程 版本选择 jdk-8u202重要:Spark3.2.0 版本官网依赖jdk8,8u201之前的版本已经被宣布弃用了;所以jdk 选择8u202(java最后一个免费版) spark-3.2.0-bin-hadoop3.2.tgz 由于我们是Standalone模式部署,所以不用部署Hadoop集群 Scala 2.13.7 安装步骤 整体部署概览 主机名称 ip地址 节点 备注 sp

scala

Elasticsearch数据类型和mapping(elasticsearch的数据类型)

校长 校长 发表于2024-05-26 浏览6629 评论0
2021-11-19 说明 ElasticSearch有着丰富的数据类型规则和数据属性设置,数据类型决定数据规则,特别字符串类型,text默认分词,keyword不分词,这将直接影响查询方式和结果,同样,mapping可以设置哪些字段建立索引,原始数据是否存储,这些都会影响数据存储量和实际查询效率。 分享 大数据博客列表 资料 博客 博客二 字段类型 一级分类 二级分类 具体类型 核心类型 字符串 string(废弃)、text、keyword

scala

(六)需要关注的Spark配置项+性能优化(配置spark环境)

男儿当自强 男儿当自强 发表于2024-05-26 浏览4791 评论0
       实际上,应用程序运行得稳定与否,取决于硬件资源供给与计算需要是否匹配。这就好比是赛车组装,要得到一辆高性能的车子,我们并不需要每一个部件都达到“顶配”的要求,而是要让组装配件之间相互契合、匹配,才能让车子达到预期的马力输出。        因此,不妨从硬件资源的角度切入,去探索开发者必须要关注的配置项都有哪些。 内存         说起内存,不妨先来回顾一下 Spark 的内存划分。对于给定的 Executor Memory,Spark 将 JVM Heap 划分为 4 个

MYSQL教程

大数据课程综合实验案例:网站用户行为分析(基于课堂教学行为大数据的课堂观察方法与技术)

AB模板网 AB模板网 发表于2024-05-26 浏览4622 评论0
1 案例简介 大数据课程实验案例:网站用户行为分析,由厦门大学数据库实验室团队开发,旨在满足全国高校大数据教学对实验案例的迫切需求。本案例涉及数据预处理、存储、查询和可视化分析等数据处理全流程所涉及的各种典型操作,涵盖Linux、MySQL、Hadoop、HBase、Hive、Sqoop、R、Eclipse等系统和软件的安装和使用方法。案例适合高校(高职)大数据教学,可以作为学生学习大数据课程后的综合实践案例。通过本案例,将有助于学生综合运用大数据课程知识以及各种工具软件,实现数据全

scala

用户行为数据会话(session)切割及spark读写clickhouse完整实现

752557pk 752557pk 发表于2024-05-26 浏览6211 评论0
业务背景:         对采集到的埋点数据进行分析,因为埋点原始数据没有对应会话ID(sessionID),即对于一个人的一次访问超过一定时间间隔(根据业务需要进行设定,本次定为20min)没有操作则记录为一个不重复的id,超过该时间间隔后再次操作就记成另一个sessionid。 使用技术: 1.sparkSQL 2.spark读写clickhouse 3.scala 业务实现: 1.pow依赖 <properties> <spark

scala

(五)Spark广播变量,累加器(spark累加器和广播变量)

田小会 田小会 发表于2024-05-26 浏览5252 评论0
        做应用开发的时候,总会有一些计算逻辑需要访问“全局变量”,比如说全局计数器,而这些全局变量在任意时刻对所有的 Executors 都是可见的、共享的。那么问题来了,像这样的全局变量,或者说共享变量,Spark 又是如何支持的呢?         按照创建与使用方式的不同,Spark 提供了两类共享变量,分别是广播变量(Broadcast variables)和累加器(Accumulators)。接下来,我们就正式进入今天的学习,去深入了解这两种共享变量的用法、以及它们各自的适用

scala

Kafka源码系列(一)——源码环境搭建(Kafka源码)

花白了我的人生 花白了我的人生 发表于2024-05-25 浏览3706 评论0
这里使用的Kafka版本是2.8.1,差不多是最新的2.X.X版本,2021.9.21已经出了最新的3.0.0版本,该版本移除了Java 8以及Scala 2.12,在环境配置上有所不同,后续有时间会更新最新的3.0.0环境搭建内容。 操作系统:MAC 1. Java 设置 JDK版本是1.8,这里就不描述具体的操作步骤。 ljc:~ luojiacheng$ java -version java version "1.8.0_221" Java(TM) SE Runtime

scala

Scala之完美解决IntelliJ IDEA安装scala插件失败,install安装后不成功,项目中无法新建一个Scala类

慕容小布 慕容小布 发表于2024-05-25 浏览7013 评论0
🌟 前言 🌟 同学们,我是上火不找我😎 🌟作者认证:新星计划算法领域潜力新星top3 🌟 今天是Scala之完美解决ItelliJ IDEA安装scala插件失败的解决方法! 🌟 一、问题描述 图片描述如下: 🌟 二、解决方案 Scala环境安装 安装JDK 1.8(略) 安装Scala2.12 解压文件:scala-2.12.11.zip,解压目录要求无中文无空格 配置环境变量 环境测试 如果出现如下窗口内容,表示环境安装成功