hdfs - 星花园站长资源网

首先，最开始的问题是我无法在网页查看50070端口，所以我格式化了一下namenode，./hdfs namenode -format 并尝试重启hdfs。发现此时已解决，无50070端口问题，也可在网页查看集群信息，但是竟然datanode消失了在sbin目录下，我又重新关闭+启动了一波集群 ./start-all.sh 发现此时可以解决仍然无效查阅资料，发现可能是因为不小心多格式化了几次namenode导致，主从机之间clusterID不一

分布式

Hadoop集群搭建--集群启动（启动Hadoop集群）

luxun 发表于2024-06-24 浏览6622 评论0

关注微信公共号：小程在线关注CSDN博客：程志伟的博客一、配置workers [atguigu@hadoop102 hadoop]$ vim /opt/module/hadoop-3.1.3/etc/hadoop/workers 增加以下内容： hadoop102 hadoop103 hadoop104 [atguigu@hadoop102 hadoop]$ xsync /opt/module/hadoop-3.1.3/etc 二、启动集群 2.1 第一启动，

scala

RDD编程实验（rdd编程实验心得）

办公资源 发表于2024-06-23 浏览7777 评论0

RDD编程初级实践基于《Spark编程基础（Scala版）》前言前面已经基于docker搭建好spark集群，集群为一台master和两台slave，主机为windows系统，集群搭建在linux下。一、实验目的 1.熟悉Spark的RDD基本操作及键值对操作； 2.熟悉使用RDD编程解决实际具体问题的方法。二、实验内容和要求 1.spark-shell交互式编程 2.编写独立应用程序实现数据去重 3.编写独立应用程序实现求平均值问题三、实验步

scala

Spark 广播变量：SparkContext.broadcast定义及使用注意事项

simoore 发表于2024-06-23 浏览5774 评论0

今天来讨论一下spark里面的闭包问题，当用户提交了一个用scala语言写的Spark程序，首先这个Spark程序就是一个“Application”，程序里面的mian函数就是“Driver Program”，dirver程序的可能运行在客户端，也有可有可能运行在spark集群中，这取决于spark作业提交时参数的选定，比如，yarn-client和yarn-cluster就是分别运行在客户端和spark集群中。在driver程序中会有RDD对象的相关代码操作，它们是在Worker节点上面运行的

scala

Hadoop入门一(3.2.2版本)（hadoop3.2.1）

零度网络-技术2 发表于2024-06-23 浏览8065 评论0

一.大数据广义大数据：以hadoop软件为主的生态圈(Sqoop、Flume、Spark、Flink、Hbase、Kafka和cdh环境) 狭义大数据：hadoop软件本身，开源的(在gitlab上可以看到源代码和地址) 二.组成 Hadoop由以下三个部分组成： 1.hdfs 存储数据(主要是网盘存储) 2.mapreduce 计算作业(生产上不使用，但设计理念指导着其他框架) 3.yarn 资源(CPU、内存memory)和作业的调度实际上大数据也是这三个东西：

scala

Spark——实验二：Spark安装与验证（spark的安装与使用）

僵尸 发表于2024-06-23 浏览5924 评论0

一. 实验目的学习spark的安装与验证，掌握其主要开发技术。二. 实验内容 1）基于ubuntukylin16.04(10)，安装spark,形成ubuntukylin16.04(11) 2）基于ubuntukylin16.04(11)，安装sbt0.13.15，形成ubuntukylin16.04(14) 3）基于ubuntukylin16.04(14)，参考http://dblab.xmu.edu.cn/blog/1307-2/，完成spark应

scala

spark_0108（SParK）

hello 发表于2024-06-22 浏览11511 评论0

Spark单节点部署 1. 找到安装文件 1 find / -name spark*.tgz 2. 解压文件到指定目录 1 tar -zxvf ~/experiment/file/spark-2.2.0-bin-hadoop2.7.tgz -C /opt 3. 重命名 1 mv /opt/spark-2.2.0-bin-hadoop2.7 /opt/spark 4. 配置环境变量 1 vim /e

分布式

Hadoop完全分布式集群——Hadoop 配置（部署全分布式的Hadoop集群的总结）

忽然一转身 发表于2024-06-22 浏览7484 评论0

前面已完成VMware虚拟机安装与配置（参考前一篇Hadoop完全分布式集群——VMware虚拟机安装与配置_夏雨和阳阳的博客-CSDN博客），下面将进行Hadoop 配置。一、slave1、slave2节点配置修改 slave1、slave2节点都需要进行以下操作： 1.开启虚拟机，输入命令： [root@slave1 ~]#ip addr [root@slave2 ~]#ip addr 2.修改slave1、slave2虚拟机的IP [root@slave1 ~]#vi

swift

主流分布式存储技术对比分析：GFS、HDFS、GlusterFS、Ceph、Swift

tteeqq 发表于2024-06-20 浏览6639 评论0

1 引言目前市面上各个厂家的分布式存储产品五花八门，但是如果透过产品本身的包装看到其背后的核心技术体系，基本上会分为两种架构，一种是有中心架构的分布式文件系统架构，以GFS、HDFS为代表；另外一种是完全无中心的分布式存储架构，以Ceph、Swift、GlusterFS为代表。对具体分布式存储产品选型的时候，要根据其背后的核心架构来分析它本来的原貌，然后才能决定其是否适合我们的具体场景。 2 主流分布式存储技术对比分析 2.1 GFS & HDFS GFS和HDFS都是基于文件

分布式

搭建Hadoop分布式集群的详细教程（搭建hadoop分布式集群的详细教程）

qidouhai 发表于2024-06-20 浏览12063 评论0

目录写在前面一、创建虚拟机，安装Centos 二、VMware VMnet8模式共享主机网络配置三、克隆集群节点HadoopSlave1与HadoopSlave2 四、Linux系统配置五、Hadoop的部署配置六、Hadoop集群的启动写在前面搭建Hadoop集群的过程比较复杂，本文旨在给大家一个参考过程，也欢迎大家在评论区交流自己的心得体会及遇到的问题。搭建Haoop分布式集群所需环境：VMware，CentOS，Hadoop，

分布式

hadoop historyserver启动，无法访问，查看报错等问题（hadoop历史服务器进不去）

UPARK 发表于2024-06-20 浏览6109 评论0

hadoop historyserver启动，无法访问，查看报错等问题 1、historyserver无法启动 2、historyserver已启动，可以看到进程，web无法访问url 3、historyserver已启动，可以访问日志，提示可能未完成日志聚集记录下hadoop遇到的问题 1、historyserver无法启动 mapred-site.xml 文件里配置的server111节点，所以只能在server111节点启动，其他节点均不能启动 2、

分布式

三、Hadoop系统应用之Hadoop集群测试及初体验（超详细步骤指导操作，WIN10，VMware Workstation 15.5 PRO，CentOS-6.7）

正邦鞋业 发表于2024-06-20 浏览6767 评论0

Hadoop集群搭建前安装准备参考：一、Hadoop系统应用之安装准备（一）（超详细步骤指导操作，WIN10，VMware Workstation 15.5 PRO，CentOS-6.7）一、Hadoop系统应用之安装准备（二）（超详细步骤指导操作，WIN10，VMware Workstation 15.5 PRO，CentOS-6.7） Hadoop集群搭建过程参考：二、Hadoop系统应用之Hadoop集群搭建（超详细步骤指导操作，WIN10，VMware Workstation 15.5

ZBlogIt

Nice to meet you, too!

PyQt4 PySide 输入对话框 脚本之家

Hello! I'm at work browsing your blog fr...

分布式

解决Hadoop集群丢失Namenode或Datanode问题

漠然、发表于2024-06-25 浏览7987 评论0

分布式

Hadoop集群搭建--集群启动（启动Hadoop集群）

luxun 发表于2024-06-24 浏览6622 评论0

scala

RDD编程实验（rdd编程实验心得）

办公资源 发表于2024-06-23 浏览7777 评论0

scala

Spark 广播变量：SparkContext.broadcast定义及使用注意事项

simoore 发表于2024-06-23 浏览5774 评论0

scala

Hadoop入门一(3.2.2版本)（hadoop3.2.1）

零度网络-技术2 发表于2024-06-23 浏览8065 评论0

scala

Spark——实验二：Spark安装与验证（spark的安装与使用）

僵尸 发表于2024-06-23 浏览5924 评论0

scala

spark_0108（SParK）

hello 发表于2024-06-22 浏览11511 评论0

分布式

Hadoop完全分布式集群——Hadoop 配置（部署全分布式的Hadoop集群的总结）

忽然一转身 发表于2024-06-22 浏览7484 评论0

swift

主流分布式存储技术对比分析：GFS、HDFS、GlusterFS、Ceph、Swift

tteeqq 发表于2024-06-20 浏览6639 评论0

分布式

搭建Hadoop分布式集群的详细教程（搭建hadoop分布式集群的详细教程）

qidouhai 发表于2024-06-20 浏览12063 评论0

分布式

hadoop historyserver启动，无法访问，查看报错等问题（hadoop历史服务器进不去）

UPARK 发表于2024-06-20 浏览6109 评论0

分布式

三、Hadoop系统应用之Hadoop集群测试及初体验（超详细步骤指导操作，WIN10，VMware Workstation 15.5 PRO，CentOS-6.7）

正邦鞋业 发表于2024-06-20 浏览6767 评论0

« 2023年9月 »
一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30