×

分布式

【 大数据分析Hadoop + Spark 】10分钟搭建Hadoop(伪分布式 )+ Spark(Local模式)环境

平安喜乐 平安喜乐 发表于2024-04-21 浏览5533 评论0
Hadoop(伪分布)+ Spark(Local)软件安装及环境配置 前言 为了对数据进行分析,我们必须进行环境搭建。对于初学者来说,我们一般用Linux搭建环境,本文介绍的就是在Ubuntu上搭建Hadoop(伪分布式 )+ Spark(Local模式)环境。 一、安装虚拟机 1.下载Ubuntu16.04镜像 镜像源文件:下载地址 提取码:ontd 下载完成之后,进行虚拟机安装及配置,镜像位置选择下载好的Ubuntu16.04镜像。 二、Hadoo

分布式

【小白视角】大数据基础实践(二)Hadoop环境搭建与测试(hadoop大数据开发基础)

facesun facesun 发表于2024-04-21 浏览5635 评论0
1.简介 实验环境 Vmware (Ubuntu18.04) Java 1.8 Hadoop 3.1.3 1.1基础知识 Hadoop是一个由Apache基金会所开发的开源分布式计算平台,为了让用户可以在不了解分布式底层细节的情况下开发分布式程序。 Hadoop是一个基础架构系统,是Google的云计算基础架构的开源实现,主要由HDFS、MapReduce组成,其中HDFS是Google的GFS的开源实现,MapReduce是Google的MapReduce的开源实

分布式

如何使用docker搭建Hadoop集群(docker hadoop集群搭建)

阿卜L 阿卜L 发表于2024-04-21 浏览7804 评论0
一. 环境: 1.Ubuntu20 2.Hadoop3.1.4 3.Jdk1.8_301 二. 具体步骤 拉取最新版本ubuntu 镜像 利用挂载将jdk,hadoop 等安装包通过xftp 或者使用命令行scp 命令传到挂载目录。 进入ubuntu 镜像容器docker exec -it 容器id /bin/bash 更新apt-get 系统源apt-get update 更新完后可以下载一些必须工具,如vim 安装sshd 在开启分布式Hadoop 时,需要用到ss

分布式

Hadoop高可用集群搭建(hadoop高可用集群搭建参考)

?? ?? 发表于2024-04-21 浏览3823 评论0
一、集群节点分布。 三个服务器组成一个Zookeeper集群。node-01和node-02作为集群的NameNode,需要运行ZKFC来监控NameNode的健康状态。 二、hadoop高可用集群 (1)先搭建普通的hadoop集群。  (2)修改core-site.xml文件。             该文件是Hadoop的核心配置文件,配置HDFS地址、端口号,以及临时文件 目录。打开该配置文件,添加如下配置内容。 zookeeper地址就是你的三台主机名 cd /ex

架构

一文看懂大数据生态圈完整知识体系【大数据技术及架构图解实战派】

Dirk Dirk 发表于2024-04-21 浏览5578 评论0
一文看懂大数据生态圈完整知识体系 徐葳 随着大数据行业的发展,大数据生态圈中相关的技术也在一直迭代进步,作者有幸亲身经历了国内大数据行业从零到一的发展历程,通过本文希望能够帮助大家快速构建大数据生态圈完整知识体系。 目前大数据生态圈中的核心技术总结下来如图1所示,分为以下9类,下面分别介绍。 图1 一、数据采集技术框架 数据采集也被称为数据同步。随着互联网、移动互联网、物联网等技术的兴起,产生了海量数据。这些数据散落在各个地方,我们需要将这些数据融合到一起,然后从

scala

云计算题库(云计算考试题库)

正邦鞋业 正邦鞋业 发表于2024-04-21 浏览4727 评论0
1.下列关于云存储的描述不正确的是 ( ) A. 可以将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作。 B. 需要通过集群应用、网格技术或分布式文件系统等技术实现 C. 云存储通过服务的形式提供给用户使用 D. “云存储对于使用者来讲是透明的”,也就是说使用者清楚存储设备的品牌,型号的具体细节 答案: D 2.下面哪个操作肯定是宽依赖 A. flatMap B. sample C. map D. reduceByKey 答案:D 3.mapreduce的样例放在哪个目录中 A.

分布式

Hadoop完全分布式部署(hadoop完全分布式部署实验报告)

天道 天道 发表于2024-04-21 浏览4569 评论0
原创申明: 未经许可,禁止以任何形式转载,若要引用,请标注链接地址 全文共计5984字,阅读大概需要3分钟 欢迎关注我的个人公众号:不懂开发的程序猿 一、 任务描述 要想深入的学习hadoop数据分析技术,首要的任务是必须要将hadoop集群环境搭建起来,可以将hadoop简化地想象成一个小软件,通过在各个物理节点上安装这个小软件,然后将其运行起来,就是一个hadoop分布式集群了。 二、任务目标 (1)学会hadoop完全分布式配置 (2)理解完全分布式配置的配置文件

分布式

Hadoop完全分布式集群——Hadoop 配置(部署全分布式的Hadoop集群的总结)

忽然一转身 忽然一转身 发表于2024-04-21 浏览6711 评论0
前面已完成VMware虚拟机安装与配置(参考前一篇Hadoop完全分布式集群——VMware虚拟机安装与配置_夏雨和阳阳的博客-CSDN博客),下面将进行Hadoop 配置。 一、slave1、slave2节点配置修改 slave1、slave2节点都需要进行以下操作: 1.开启虚拟机,输入命令: [root@slave1 ~]#ip addr [root@slave2 ~]#ip addr 2.修改slave1、slave2虚拟机的IP [root@slave1 ~]#vi