ICode9

精准搜索请尝试: 精确搜索
  • 如何安装hadoop集群2022-05-21 23:01:29

    三台机器上传压缩包并解压 cd /kkb/soft/ tar -xvzf hadoop-3.14.tar.gz -C /kkb/install bin/hadoop checknative #查看一下openssl的状态如果为false 那么所有的机器都需要在线安装 openssl-devel sudo yum -y install openssl-devel #三台机器都要装 mv hadoop-3.14 hadoop

  • hadoop集群搭建2022-05-08 21:00:38

    几年前搞过一段时间hadoop,现在又要开始搞了,发现环境都不会搭建了。写个博客记录下搭建过程。 目录1、创建虚拟机及规划2、设置各主机之间免密登录1、在每台主机hosts文件中添加IP与主机名的映射关系2、设置互信(每台主机都执行)3、安装JDK和hadoop1、上传软件包2、安装Java,设置

  • Hadoop3.x2022-03-31 10:32:19

    Hadoop是什么 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 主要解决,海量数据的存储和海量数据的分析计算问题。 广义上来说,Hadoop通常是指一个更广泛的概念————Hadoop生态圈。 Hadoop优势(4高) 高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算机元素

  • Hadoop3.x高可用集群,HDFS、Yarn集群2022-02-15 02:01:08

    集群环境规划 将整个 ha 搭建完成后,集群将形成以下模样 hadoop101 hadoop102 hadoop103 NameNode NameNode NameNode JournalNode JournalNode JournalNode DataNode DataNode DataNode Zookeeper Zookeeper Zookeeper ZKFC ZKFC ZKFC ResourceManager Resource

  • 基于Hadoop3的HA集群搭建2022-02-14 16:48:33

    集群规划 node01 node02 node03 NameNode NameNode NameNode ZKFC ZKFC ZKFC JournalNode JournalNode JournalNode DataNode DataNode DataNode ZK ZK ZK ResourceManager ResourceManager NodeManager NodeManager NodeManager 准备模板虚拟机 关闭防火

  • 大数据之-Hadoop3.x_Yarn_生产环境多队列创建&好处---大数据之hadoop3.x工作笔记01512022-01-23 09:30:00

    然后我们再来看,容量调度器多队列的案例,使用多队列的必要性和好处.   首先我们看到之前我们使用的时候,都是单个队列对吧. 都是只有一个default队列   那么我们想一下如果一共企业,有很多的任务比如1000个1万个,那么,1个队列肯定不能满足要求,那么这个时候就需要采用多队列.

  • [Hadoop] mac搭建hadoop3.X 伪分布模式2022-01-11 12:33:43

    目录 一 Homebrew安装 二 SSH免密登录配置 三 Hadoop安装 四 伪分布式配置 a.hadoop-env.sh配置 b.core-site.xml配置 c.hdfs-site.xml配置 d.mapred-site.xml配置 e.yarn-site.xml配置 五 启动运行 六 测试WordCount 一 Homebrew安装 Homebrew是一个包管理器,是Mac上的软件安

  • 大数据之-Hadoop3.x_Yarn_FIFO调度器---大数据之hadoop3.x工作笔记01442022-01-07 12:58:00

    我们说,当有请求来了以后,resourcemanager接收到请求以后,会生成一个task任务 然后把任务放到,任务队列中去,然后那么;任务队列的执行规则是什么呢? 这里有3个规则,一个是FIFO规则,一个是Fair Scheduler公平调度器, 一个是Capacity 调度器,容量调度器,这里 Apache hadoop3.1.3

  • Hadoop3.x集成Spark2021-11-13 17:05:59

    在离线数仓方面,Spark现在所占据的地位勿庸置疑。我们来看看如何在Hadoop3.x中集成Spark。 1. 下载与解压 从镜像站下载 下载地址,选择3.0.2版本。上传到服务器后解压到/app目录下 tar zxvf spark-3.0.2-bin-hadoop3.2.tgz -C /app # 修改目录名 cd /app # mv spark-3.0.2-bin-

  • [hadoop3.x]HDFS存储类型和存储策略(五)概述2021-10-06 20:33:00

    文章目录 前言历史文章

  • [hadoop3.x]HDFS存储类型和存储策略(五)概述2021-10-01 18:03:53

    文章目录 前言历史文章

  • Hadoop3.x MapReduce Combiner 合并2021-09-09 16:00:00

    一、Combiner 概述 Combiner 合并是 Shuffle 阶段的一个可选操作,旨在提前对数据进行一次合并(将 <a, 1>, <a, 1>, <a, 1> 合并为 <a, 3>),以减少 Reducer 的压力。通常情况下我们会开启大量的 MapTask,而 ReduceTask 的个数很少,所以 Reducer 要拉取和处理数据量非常大,如果提前对

  • Hadoop3.x 之 HDFS 完整使用2021-07-09 12:31:59

    Hadoop3.x 之 HDFS 完整使用 一、HDFS 概述1、HDFS 产生背景2、HDFS 定义3、HDFS 优点4、HDFS 缺点 二、HDFS组成架构1、HDFS组成架构2、NameNode(nn)3、DataNode4、Client5、Secondary NameNode 三、HDFS 文件块大小(面试重点)1、HDFS 文件块大小2、为什么块的大小不能设置太

  • hadoop3自学入门笔记(1)——虚拟机安装和网络配置2021-05-12 12:54:27

    文章目录 前言 软件版本介绍 虚拟机配置规划 虚拟机的创建 复制虚拟机,避免多次安装 虚拟机配置ip 使用 xshell SSH免密码登录 关闭防火墙 参考文献 前言 年过30惶惶不安,又逢疫情,还是不断学习,强化自己的能力。hadoop的视频和书籍在15年的时候就看过,但是一直没动手实践过,要知道

  • hadoop3自学入门笔记(2)—— HDFS分布式搭建2021-05-12 12:54:08

    目录 一些介绍 Hadoop 2和Hadoop 3的端口区别 Hadoop 3 HDFS集群架构 我的集群规划 1.安装JDK 2.配置Hadoop 2.1部署及配置 2.2 将配置复制到其他服务器 2.3配置下hadoop的环境变量,方便输入命令 2.4格式化 3.启动 4.打开浏览器查看HDFS监听页面 参考书籍 一些介绍 Hadoop

  • 大数据技术之Hadoop3.x(完整版)2021-05-12 12:02:50

    课程目录 01.Hadoop_开篇_课程整体介绍.mp4 02.Hadoop_概论_大数据的概念.mp4 03.Hadoop_概论_大数据的特点.mp4 04.Hadoop_概论_大数据的应用场景.mp4 05.Hadoop_概论_大数据的发展场景.mp4 06.Hadoop_概论_未来工作内容.mp4 07.Hadoop_入门_课程介绍.mp4 08.Hadoop_入门_Hadoo

  • Hadoop3.x入门:完全分布式Hadoop集群安装部署2021-03-10 09:53:06

    一、概述    上篇文章我们写了Hadoop3.1.1的源码编译,这里我们将编译的源码进行部署,作为我后面远程代码调试的目标集群,这里我把部署的一些重要的步骤写一写,希望对新手们有空,对Hadoop很熟悉的就不用看了。集群节点:节点主机名说明192.168.0.101master.hadoop.ljsmaster节点192.168

  • Hadoop3.x进阶:源码编译全记录2021-03-10 09:52:45

    一、概述    为了远程调试集群,我本地编译了一下源码,记录下Hadoop3.1.1源码编译记录和遇到的问题,只写关键步骤,其他自行百度。软件版本:    Centos7.2 可联网    Hadoop3.1.1    Maven3.5.2    Jdk1.8    Protobuf2.5.0     cmake3.14.51.官网下载源码包,里

  • Hadoop3.x版本 单机模式安装2021-02-10 12:01:34

    安装环境 VMware 虚拟机 15.5系统镜像 centos7.8hadoop 3.2.2 安装步骤 1、关闭防火墙 2、安装JDK1.8 3、设置环境变量 vi /ect/profile # JDK1.8 自己的目录 JAVA_HOME=/opt/jdk1.8.0_191 CLASSPATH=$JAVA_HOME/lib/ PATH=$PATH:$JAVA_HOME/bin export PATH JAVA_HOME CLAS

  • awk 把两行数据合成一行2021-01-11 16:01:56

    1、现有测试数据如下: cat a.txt hadoop1 1 hadoop2 2 hadoop3 3 2、期望的格式 hadoop1: 1 hadoop2: 2 hadoop3: 3 3、使用awk awk '{if(NR%2!=0)ORS=":";else ORS="\n"}1' a.txt | http://bbs.chinaunix.net/thread-4241658-1-1.html

  • hadoop3自学入门笔记(1)——虚拟机安装和网络配置2020-11-23 15:30:50

    前言 年过30惶惶不安,又逢疫情,还是不断学习,强化自己的能力。hadoop的视频和书籍在15年的时候就看过,但是一直没动手实践过,要知道技术不经过实战,一点提升也没有。因此下定决心边学边做,希望能有所收获。 软件版本介绍 virtualbox 6.1centos7hadoop-3.2.1jdk-8u241-linux-x64xshellxf

  • Hadoop基础(五十四):基于centos搭建Hadoop3.x完全分布式运行模式2020-10-09 15:00:25

    0 简介 分析: 1)准备3台客户机(关闭防火墙、静态ip、主机名称) 2)安装JDK 3)配置环境变量 4)安装Hadoop 5)配置环境变量 6)配置集群 7)单点启动 8)配置ssh 9)群起并测试集群 1 虚拟机准备   2 编写集群分发脚本xsync   1)scp(secure copy)安全拷贝   (1)scp定义:   scp可以实现服务器与服务器之

  • Linux命令一2019-04-20 18:55:42

    1、部署客户端部署xshell、CRT登陆方式账户 root 密码 **协议 SSH22、Linux 命令[root@hadoop3 ~]# root 用户@ 连接符hadoop3 机器名~ 家目录 3、pwd 查看当前目录路径[root@hadoop3 ~]# pwd root 超级管理员 对应的目录 /rootjepson 普通用户的 /home/jepsonLinux 系统

  • Hadoop3新特性2019-04-05 12:49:41

    1.添加Classpath isolation,防止不同版本的jar包出现冲突。 2.支持Shell重写。 3.支持HDFS中的擦除编码【Erasure Encoding】,默认的EC策略可以节省50%的存储空间,同时还可以承受更多的存储故障。 4.DataNode内部添加了负载均衡【Disk Balancer】,进行磁盘之间的负载均衡。 5.MapReduce

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有