×

分布式

解决Hadoop集群丢失Namenode或Datanode问题

漠然、 漠然、 发表于2024-06-25 浏览7987 评论0
首先,最开始的问题是我无法在网页查看50070端口,所以我格式化了一下namenode,./hdfs namenode -format 并尝试重启hdfs。   发现此时已解决,无50070端口问题,也可在网页查看集群信息,但是竟然datanode消失了   在sbin目录下,我又重新关闭+启动了一波集群    ./start-all.sh 发现此时可以解决仍然无效  查阅资料,发现可能是因为不小心多格式化了几次namenode导致,主从机之间clusterID不一

scala

RDD编程实验(rdd编程实验心得)

办公资源 办公资源 发表于2024-06-23 浏览7777 评论0
RDD编程初级实践 基于《Spark编程基础(Scala版)》 前言 前面已经基于docker搭建好spark集群,集群为一台master和两台slave,主机为windows系统,集群搭建在linux下。 一、实验目的 1.熟悉Spark的RDD基本操作及键值对操作; 2.熟悉使用RDD编程解决实际具体问题的方法。 二、实验内容和要求 1.spark-shell交互式编程 2.编写独立应用程序实现数据去重 3.编写独立应用程序实现求平均值问题 三、实验步

scala

Spark 广播变量:SparkContext.broadcast定义及使用注意事项

simoore simoore 发表于2024-06-23 浏览5774 评论0
今天来讨论一下spark里面的闭包问题,当用户提交了一个用scala语言写的Spark程序,首先这个Spark程序就是一个“Application”,程序里面的mian函数就是“Driver Program”,dirver程序的可能运行在客户端,也有可有可能运行在spark集群中,这取决于spark作业提交时参数的选定,比如,yarn-client和yarn-cluster就是分别运行在客户端和spark集群中。在driver程序中会有RDD对象的相关代码操作,它们是在Worker节点上面运行的

scala

Hadoop入门一(3.2.2版本)(hadoop3.2.1)

零度网络-技术2 零度网络-技术2 发表于2024-06-23 浏览8065 评论0
一.大数据 广义大数据:以hadoop软件为主的生态圈(Sqoop、Flume、Spark、Flink、Hbase、Kafka和cdh环境) 狭义大数据:hadoop软件本身,开源的(在gitlab上可以看到源代码和地址) 二.组成 Hadoop由以下三个部分组成: 1.hdfs  存储数据(主要是网盘存储) 2.mapreduce  计算作业(生产上不使用,但设计理念指导着其他框架) 3.yarn  资源(CPU、内存memory)和作业的调度 实际上大数据也是这三个东西:

分布式

Hadoop完全分布式集群——Hadoop 配置(部署全分布式的Hadoop集群的总结)

忽然一转身 忽然一转身 发表于2024-06-22 浏览7484 评论0
前面已完成VMware虚拟机安装与配置(参考前一篇Hadoop完全分布式集群——VMware虚拟机安装与配置_夏雨和阳阳的博客-CSDN博客),下面将进行Hadoop 配置。 一、slave1、slave2节点配置修改 slave1、slave2节点都需要进行以下操作: 1.开启虚拟机,输入命令: [root@slave1 ~]#ip addr [root@slave2 ~]#ip addr 2.修改slave1、slave2虚拟机的IP [root@slave1 ~]#vi

swift

主流分布式存储技术对比分析:GFS、HDFS、GlusterFS、Ceph、Swift

tteeqq tteeqq 发表于2024-06-20 浏览6639 评论0
1 引言 目前市面上各个厂家的分布式存储产品五花八门,但是如果透过产品本身的包装看到其背后的核心技术体系,基本上会分为两种架构,一种是有中心架构的分布式文件系统架构,以GFS、HDFS为代表;另外一种是完全无中心的分布式存储架构,以Ceph、Swift、GlusterFS为代表。对具体分布式存储产品选型的时候,要根据其背后的核心架构来分析它本来的原貌,然后才能决定其是否适合我们的具体场景。 2 主流分布式存储技术对比分析 2.1 GFS & HDFS GFS和HDFS都是基于文件

分布式

搭建Hadoop分布式集群的详细教程(搭建hadoop分布式集群的详细教程)

qidouhai qidouhai 发表于2024-06-20 浏览12063 评论0
目录 写在前面 一、创建虚拟机,安装Centos 二、VMware VMnet8模式共享主机网络配置 三、克隆集群节点HadoopSlave1与HadoopSlave2 四、Linux系统配置 五、Hadoop的部署配置 六、Hadoop集群的启动 写在前面        搭建Hadoop集群的过程比较复杂,本文旨在给大家一个参考过程,也欢迎大家在评论区交流自己的心得体会及遇到的问题。       搭建Haoop分布式集群所需环境:VMware,CentOS,Hadoop,

分布式

hadoop historyserver启动,无法访问,查看报错等问题(hadoop历史服务器进不去)

UPARK UPARK 发表于2024-06-20 浏览6109 评论0
hadoop historyserver启动,无法访问,查看报错等问题 1、historyserver无法启动 2、historyserver已启动,可以看到进程,web无法访问url 3、historyserver已启动,可以访问日志,提示可能未完成日志聚集 记录下hadoop遇到的问题 1、historyserver无法启动 mapred-site.xml 文件里配置的server111节点,所以只能在server111节点启动,其他节点均不能启动 2、

分布式

三、Hadoop系统应用之Hadoop集群测试及初体验(超详细步骤指导操作,WIN10,VMware Workstation 15.5 PRO,CentOS-6.7)

正邦鞋业 正邦鞋业 发表于2024-06-20 浏览6767 评论0
Hadoop集群搭建前安装准备参考:一、Hadoop系统应用之安装准备(一)(超详细步骤指导操作,WIN10,VMware Workstation 15.5 PRO,CentOS-6.7)一、Hadoop系统应用之安装准备(二)(超详细步骤指导操作,WIN10,VMware Workstation 15.5 PRO,CentOS-6.7) Hadoop集群搭建过程参考:二、Hadoop系统应用之Hadoop集群搭建(超详细步骤指导操作,WIN10,VMware Workstation 15.5