hadoop 第10页 - 星花园站长资源网

Spark安装须知 Spark官方下载地址：Spark下载地址注意：选择正确的Spark版本，这里Hadoop版本为3.3.3，对应版本软件包为spark-3.2.1-bin-hadoop3.2.tgz。 *Yarn模式安装需提前安装Hadoop集群，安装手顺参考：Apache-Hadoop3.3.3集群安装 1.Local 模式 Local 模式，就是不需要其他任何节点资源就可以在本地执行 Spark 代码的环境，一般用于教学，调试，演示等。 1.1 解压缩文件将

mysql

使用navicat连接虚拟机的hive

悠悠然 发表于2024-04-19 浏览6880 评论0

一、软件准备虚拟机（操作系统为Linux）中已有MySQL、已部署Hive。本地主机（操作系统为Windows）中下载navicat（我用的是navicat premium 15）。 PS：其实用sqlyog也是可以连接虚拟机的Hive数据的。在决定用navicat还是sqlyog之前，可以思考这两个问题： ①MySQL和hive的区别； ②sqlyog和navicat的区别。对于第一个问题，我理解的最直接的区别是：MySQL的数据可以存储在本地，但

scala

基于Idea的Spark大数据分析--scala（基于idea的spark大数据分析）

doviseo 发表于2024-04-18 浏览6353 评论0

问题重述 • 基于Eclipse或IDEA完成Spark大数据分析 • Spark1.x或2.x版本均可 • 能够读取给定的数据文件 • 出租车GPS数据文件（taxi_gps.txt） • 北京区域中心坐标及半径数据文件(district.txt) • 能够输出以下统计信息 • A：该出租车GPS数据文件（taxi_gps.txt）包含多少量车？ • B：北京每个城区的车辆位置点数（每辆车有多个位置点，允许重复）开发环境： Spark版本 spark-2.1.1-bin-hadoop

大数据

初学hadoop的心路历程（怎么样学hadoop）

站长资讯网友投稿帖 发表于2024-04-18 浏览2132 评论0

在学习hadoop之前，我就明确了要致力于大数据行业,成为优秀的大数据研发工程师的目标，有了大目标之后要分几步走，然后每一步不断细分，采用大事化小的方法去学习hadoop。下面开始叙述我是如何初学hadoop的。

分布式

解决Hadoop集群丢失Namenode或Datanode问题

漠然、发表于2024-04-18 浏览6295 评论0

首先，最开始的问题是我无法在网页查看50070端口，所以我格式化了一下namenode，./hdfs namenode -format 并尝试重启hdfs。发现此时已解决，无50070端口问题，也可在网页查看集群信息，但是竟然datanode消失了在sbin目录下，我又重新关闭+启动了一波集群 ./start-all.sh 发现此时可以解决仍然无效查阅资料，发现可能是因为不小心多格式化了几次namenode导致，主从机之间clusterID不一

分布式

Hbase3.0.0及Hadoop3.3.1集群搭建(一)（hadoop3.3.0兼容hbase多少）

下岗青年 发表于2024-04-17 浏览4546 评论0

1.概述 HBase是Hadoop数据库，一种分布式、可扩展的大数据存储。当您需要对大数据进行随机、实时的读/写访问时，推荐使用HBase。该项目的目标是在商用硬件集群上托管非常大的表——数十亿行 X 数百万列。HBase 是一个开源、分布式、版本化、非关系型数据库，基于 Google 的Bigtable 等的结构化数据的分布式存储系统开发。正如 Bigtable 利用 Google 文件系统提供的分布式数据存储一样， HBase 在 Hadoop 和 HDFS 之上提供了类似 Bigtab

大数据

【博文引荐】Hadoop中MapReduce多种join完成实例剖析（mapreduce实现join）

站长资讯网友投稿帖 发表于2024-04-17 浏览2830 评论0

本文主要对MapReduce框架对表之间的join操作的几种实现方式进行详细分析，并且根据我在实际开发过程中遇到的实际例子来进行进一步的说明。

分布式

Hadoop3.1.3完全分布式安装（Centos7.x）

????＆Y 发表于2024-04-17 浏览5560 评论0

目录一、环境准备二、JDK的安装三、安装haddoop 四、配置hadoop配置文件五、将jdk、hadoop分发到slave1、slave2节点六、hdfs格式化七、环境变量配置八、集群启动九、进程查看十、WEB UI查看一、环境准备节点名称【主机名】 IP master 170.158.10.101 slave1 170.158.10.102 slave2 170.158.10.103 关闭防火墙 # 在root

scala

2021唯品会秋招数据开发岗笔试题（唯品会前端面试题）

ab11223355 发表于2024-04-17 浏览6087 评论0

由于过了一段时间才写这篇博客，有些题目已经记不清了，同时也没有找到相同的题目，因此只能简单描述，多见谅。题型分布单选题X10 不定项选择题X2 问答题X5 简答题X1 单选题 Hadoop HDFS Client端上传文件到HDFS上的时候下列正确的是 A. 数据经过NameNode传递给DataNodeB. 数据副本将以管道的方式依次传递 C. Client将数据写到一台DataNode上，并由Client负责完成Block复制工作 D. 当某个DataNode失败

MSSQL教程

FAILED: HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.me

doviseo 发表于2024-04-16 浏览9636 评论0

FAILED: HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient 在启动hive后无论是，show databases;还是查看数据：select * from test01; 都是这个错误，说是无法实例化，搜的大部分都是说在hive目录下初始化MySQL，输入以下命令就能运行分析得知

未命名

虚拟机开启hive的命令

和煦的糖果风 发表于2024-04-16 浏览4639 评论0

一.什么是hive Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。其本质是将SQL转换为MapReduce的任务进行运算，底层由HDFS来提供数据的存储，可以理解为一个将SQL转换为MapReduce的任务的工具。二.开启hive的命令通过第二代客户端beeline开启hive服务的命令： nohup /export/server/hive/bin/hive --service metastore & noh

服务器教程

详解Ubuntu16.04下Hadoop 2.7.3的安装与配置（ubuntu16.04安装Hadoop）

星花园站长资源网 发表于2024-04-16 浏览2658 评论0

本篇文章主要介绍了详解Ubuntu16.04下Hadoop 2.7.3的安装与配置，具有一定的参考价值，有兴趣的可以了解一下。

ZBlogIt

Nice to meet you, too!

数据仓库

Hello would you mind letting me know whi...

scala

Apache-Spark3.2.1安装（spark3.0安装）

百度用户79129 发表于2024-04-19 浏览2281 评论0

mysql

使用navicat连接虚拟机的hive

悠悠然 发表于2024-04-19 浏览6880 评论0

scala

基于Idea的Spark大数据分析--scala（基于idea的spark大数据分析）

doviseo 发表于2024-04-18 浏览6353 评论0

大数据

初学hadoop的心路历程（怎么样学hadoop）

站长资讯网友投稿帖 发表于2024-04-18 浏览2132 评论0

分布式

解决Hadoop集群丢失Namenode或Datanode问题

漠然、发表于2024-04-18 浏览6295 评论0

分布式

Hbase3.0.0及Hadoop3.3.1集群搭建(一)（hadoop3.3.0兼容hbase多少）

下岗青年 发表于2024-04-17 浏览4546 评论0

大数据

【博文引荐】Hadoop中MapReduce多种join完成实例剖析（mapreduce实现join）

站长资讯网友投稿帖 发表于2024-04-17 浏览2830 评论0

分布式

Hadoop3.1.3完全分布式安装（Centos7.x）

????＆Y 发表于2024-04-17 浏览5560 评论0

scala

2021唯品会秋招数据开发岗笔试题（唯品会前端面试题）

ab11223355 发表于2024-04-17 浏览6087 评论0

MSSQL教程

FAILED: HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.me

doviseo 发表于2024-04-16 浏览9636 评论0

未命名

虚拟机开启hive的命令

和煦的糖果风 发表于2024-04-16 浏览4639 评论0

服务器教程

详解Ubuntu16.04下Hadoop 2.7.3的安装与配置（ubuntu16.04安装Hadoop）

星花园站长资源网 发表于2024-04-16 浏览2658 评论0

« 2023年9月 »
一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30