×

scala

Apache-Spark3.2.1安装(spark3.0安装)

百度用户79129 百度用户79129 发表于2024-04-19 浏览2281 评论0
Spark安装须知 Spark官方下载地址:Spark下载地址注意:选择正确的Spark版本,这里Hadoop版本为3.3.3,对应版本软件包为spark-3.2.1-bin-hadoop3.2.tgz。 *Yarn模式安装需提前安装Hadoop集群,安装手顺参考:Apache-Hadoop3.3.3集群安装 1.Local 模式 Local 模式,就是不需要其他任何节点资源就可以在本地执行 Spark 代码的环境,一般用于教学,调试,演示等。 1.1 解压缩文件 将

mysql

使用navicat连接虚拟机的hive

悠悠然 悠悠然 发表于2024-04-19 浏览6880 评论0
一、软件准备 虚拟机(操作系统为Linux)中已有MySQL、已部署Hive。 本地主机(操作系统为Windows)中下载navicat(我用的是navicat premium 15)。 PS:其实用sqlyog也是可以连接虚拟机的Hive数据的。 在决定用navicat还是sqlyog之前,可以思考这两个问题: ①MySQL和hive的区别; ②sqlyog和navicat的区别。 对于第一个问题,我理解的最直接的区别是:MySQL的数据可以存储在本地,但

scala

基于Idea的Spark大数据分析--scala(基于idea的spark大数据分析)

doviseo doviseo 发表于2024-04-18 浏览6353 评论0
问题重述 • 基于Eclipse或IDEA完成Spark大数据分析 • Spark1.x或2.x版本均可 • 能够读取给定的数据文件 • 出租车GPS数据文件(taxi_gps.txt) • 北京区域中心坐标及半径数据文件(district.txt) • 能够输出以下统计信息 • A:该出租车GPS数据文件(taxi_gps.txt)包含多少量车? • B:北京每个城区的车辆位置点数(每辆车有多个位置点,允许重复) 开发环境: Spark版本 spark-2.1.1-bin-hadoop

分布式

解决Hadoop集群丢失Namenode或Datanode问题

漠然、 漠然、 发表于2024-04-18 浏览6295 评论0
首先,最开始的问题是我无法在网页查看50070端口,所以我格式化了一下namenode,./hdfs namenode -format 并尝试重启hdfs。   发现此时已解决,无50070端口问题,也可在网页查看集群信息,但是竟然datanode消失了   在sbin目录下,我又重新关闭+启动了一波集群    ./start-all.sh 发现此时可以解决仍然无效  查阅资料,发现可能是因为不小心多格式化了几次namenode导致,主从机之间clusterID不一

分布式

Hbase3.0.0及Hadoop3.3.1集群搭建(一)(hadoop3.3.0兼容hbase多少)

下岗青年 下岗青年 发表于2024-04-17 浏览4546 评论0
1.概述 HBase是Hadoop数据库,一种分布式、可扩展的大数据存储。当您需要对大数据进行随机、实时的读/写访问时,推荐使用HBase。该项目的目标是在商用硬件集群上托管非常大的表——数十亿行 X 数百万列。HBase 是一个开源、分布式、版本化、非关系型数据库,基于 Google 的Bigtable 等的结构化数据的分布式存储系统开发。正如 Bigtable 利用 Google 文件系统提供的分布式数据存储一样, HBase 在 Hadoop 和 HDFS 之上提供了类似 Bigtab

scala

2021唯品会秋招数据开发岗笔试题(唯品会前端面试题)

ab11223355 ab11223355 发表于2024-04-17 浏览6087 评论0
由于过了一段时间才写这篇博客,有些题目已经记不清了,同时也没有找到相同的题目,因此只能简单描述,多见谅。 题型分布 单选题X10 不定项选择题X2 问答题X5 简答题X1 单选题 Hadoop HDFS Client端上传文件到HDFS上的时候下列正确的是 A. 数据经过NameNode传递给DataNodeB. 数据副本将以管道的方式依次传递 C. Client将数据写到一台DataNode上,并由Client负责完成Block复制工作 D. 当某个DataNode失败

MSSQL教程

FAILED: HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.me

doviseo doviseo 发表于2024-04-16 浏览9636 评论0
FAILED: HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient 在启动hive后无论是,show databases;还是查看数据:select * from test01; 都是这个错误,说是无法实例化, 搜的大部分都是说在hive目录下初始化MySQL,输入以下命令就能运行 分析得知

未命名

虚拟机开启hive的命令

和煦的糖果风 和煦的糖果风 发表于2024-04-16 浏览4639 评论0
一.什么是hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件 映射为一张数据库表,并提供类SQL查询功能。其本质是将SQL转换 为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,可 以理解为一个将SQL转换为MapReduce的任务的工具。 二.开启hive的命令 通过第二代客户端beeline开启hive服务的命令: nohup /export/server/hive/bin/hive --service metastore & noh