Hadoop安装-伪分布式-Pseudo

〇、所需资料

一、前置环境安装

1、包含内容

(1)安装

虚拟机安装、系统安装

(2)配置

ip、host、主机名配置

关闭防火墙及selinux

SSH免密登录

(2)基础环境安装

安装jdk

安装ntpd开启时钟同步

2、参考地址

https://www.cnblogs.com/liujinhui/p/16838546.html

二、Hadoop安装配置

1、解压与环境变量配置

(1)目录介绍

sbin目录:服务的启动脚本

bin目录:功能模块下的一些命令

lib:所需jar包

(2)环境变量配置

vi /etc/profile

增加:hadoop的bin和sbin目录

source /etc/profile使配置文件生效

2、hadoop-env.sh:配置jdk

export JAVA_HOME=/usr/java/default

3、core-site.xml:配置NN

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop01:9000</value>
    </property>
		<property>
				<name>hadoop.tmp.dir</name>
				<value>/usr/local/data/hadoop</value>
		</property>
</configuration>

4、hdfs-site.xml:配置SNN和DN

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
		<property>
		    <name>dfs.namenode.name.dir</name>
		    <value>/usr/local/data/hadoop/dfs/name</value>
		</property>
		<property>
		    <name>dfs.datanode.data.dir</name>
		    <value>/usr/local/data/hadoop/dfs/data</value>
		</property>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
		<property>
		      <name>dfs.namenode.secondary.http-address</name>
		      <value>hadoop01:50090</value>
		</property>
		<property>
		      <name>dfs.namenode.checkpoint.dir</name>
		      <value>/var/bigdata/hadoop/local/dfs/secondary</value>
		</property>
</configuration>

5、slaves:配置DN节点位置

hadoop01

三、启动及验证

1、格式化NN

bin/hdfs namenode -format

2、验证NN对应位置

/usr/local/data/hadoop/dfs/name/xxx

3、HDFS启动与验证

sbin/start-dfs.sh

4、页面及生成文件验证

(1)页面验证

修改Windows的地址:C:\Windows\System32/drivers\etc\hosts

增加ip和主机的映射关系

192.168.40.101 hadoop01

四、使用

1、命令介绍

hdfs dfs【得到支持的命令】

2、创建目录

创建目录:hdfs dfs -mkdir abc(操作的是NN的元数据)

通常会创建:hdfs dfs -mkdir -p /usr/root 【点右上角的go!进行刷新】【对比linux家目录home,此处为user】【-p表示递归创建】

3、上传文件

上传数据:hdfs dfs -put a.txt /usr/root【点go刷新】

上传过程显示:COPYING

4、查看DN文件所在位置

/usr/local/data/hadoop/dfs/data/xxx

5、上传时附加配置

按字节切割:block.size【hdfs-site.xml】

上传时,指定块大小1m,验证如何切割

hdfs dfs -D dfs.blocksize=1024*1024(1048576=1m) -put data.txt

原文地址:http://www.cnblogs.com/liujinhui/p/16838906.html

1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长! 2. 分享目的仅供大家学习和交流,请务用于商业用途! 3. 如果你也有好源码或者教程,可以到用户中心发布,分享有积分奖励和额外收入! 4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解! 5. 如有链接无法下载、失效或广告,请联系管理员处理! 6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需! 7. 如遇到加密压缩包,默认解压密码为"gltf",如遇到无法解压的请联系管理员! 8. 因为资源和程序源码均为可复制品,所以不支持任何理由的退款兑现,请斟酌后支付下载 声明:如果标题没有注明"已测试"或者"测试可用"等字样的资源源码均未经过站长测试.特别注意没有标注的源码不保证任何可用性