首页技术总结正文内容

Windows系统部署单机版Hadoop

技术总结

更新时间：2024-12-22 21:13:59 28

admin 管理员组

文章数量: 887016

本文供个人电脑安装hadoop学习使用，系统：Windows，版本：hadoop-2.7.7

1 前提：

已安装Java并配好环境变量，注意Java的安装位置不要有空格，否则可能hadoop-env.cmd会找不到对应的JAVA_HOME。如非要安装在Program Files目录下，写JAVA_HOME时可尝试用双引号将Program Files引起来，或者使用progra~1替换该部分。
Java安装过程分两次进行。第一次安装的是jdk，第二次安装的是jre(jre可以不用安装，不过建议都进行安装) https://www.bilibili/read/cv17946643/

2 下载安装包 hadoop-2.7.7.tar.gz 来源：

https://archive.apache/dist/hadoop/common/
或从 https://hadoop.apache/release/ 也可。

3 使用tar命令解压hadoop-2.7.7.tar.gz

tar zxvf hadoop-2.7.7.tar.gz (使用管理员身份运行cmd可以避免解压末尾的退出提示tar: Error exit delayed from previous errors.)

4 安装必要插件winutils-master

由于hadoop原本是运行在Linux上的，如需要运行在Windows上，需要下载Winutils-master https://github/cdarlint/winutils （建议到github下载，不要使用程序员提供的中转跳转到gitlab。点击code按钮选择download zip即可）

5 替换

解压winutils-master.zip，选择相应版本，将其bin文件夹替换hadoop-2.7.7\bin 文件夹
（注：上述3，4，5三个步骤可合并到一个步骤里，即直接下载已经替换过的安装包。新手建议使用合并方案，这篇文章提供的百度网盘压缩包是已经替换过的： https://blog.csdn/qq_40919128/article/details/125777002）

6 配置环境变量：

将hadoop-2.7.7文件夹剪切复制到合适位置（如直接放在c盘根目录下）再根据这个位置配置hadoop的系统变量和环境变量。建议将sbin目录也加到path中，这样可以不再需要在sbin目录下才能运行hadoop命令：

7 运行hadoop version查看是否安装好

如出现JAVA_HOME is incorrectly set. Please update hadoop-env.cmd 大概率是因为JAVA_HOME路径有空格，可以修改该文件配置（具体可查看网上资料），本人选择重装Java，不使用默认路径Program Files。

8 移动hadoop.dll文件

将C:\hadoop-2.7.7\bin\hadoop.dll剪切复制到C:\hadoop-2.7.7\sbin以及C:\Windows\System32这两个目录下（不知道这样做的的作用，有文章提到，故从大多数）

9 按如下路径创建文件夹，接下来修改配置文件时要用

C:\hadoop-2.7.7\data\dfs\datanode
C:\hadoop-2.7.7\data\dfs\namenode

10 修改如下四个文件

有的版本在conf\这个目录下，2.7.7版本在etc\目录下
有可能也需要修改hadoop-env.cmd，兹不赘述。
10.1） core-site.xml 其中的localhost可用0.0.0.0或127.0.0.1替换，端口50050要注意不被占用，可使用其它端口号（检查端口号使用情况命令：netstat -ano |findstr “post_number”）

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:50050</value>
</property> 
</configuration>

10.2）hdfs-site.xml 有些版本在路径前加上file:/ ，本人安装hadoop-2.7.7没有这样做，也可成功

<configuration>
<property>
<name>dfs.replication</name>
<!--  value 1，because it is single hadoop -->
<value>1</value>
</property>
<property>
<name>dfs.namenode.http-address</name>
<value>localhost:50070</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
          <!--  Create the directory before use it -->
        <value>/C:/hadoop-2.7.7/data/dfs/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
         <!--  Create the directory before use it -->
        <value>/C:/hadoop-2.7.7/data/dfs/datanode</value>
</property>
 
<property>
<name>dfs.permissions.enabled</name>
<value>false</value>
</property>
 
</configuration>

10.3）mapred-site.xml (如果是mapred-site.xml.template则把.template后缀去掉）同样，端口号可改

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapred.job.tracker</name>
<value>hdfs://localhost:50051</value>
</property>
</configuration>

10.4）yarn-site.xml

<configuration>
<!-- Site specific YARN configuration properties -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
</configuration>

附：2.7.7版本的配置文件官网文档入口,可从中获得更多配置说明： https://hadoop.apache/docs/r2.7.7/

11 初始化namenode

运行 hdfs namenode -format
如果多次格式化，需要看一看data、tmp和logs目录，每次格式化时最好把他们删掉，避免出现一些ClusterId之类的问题，如出现此类问题，可以从头再来一遍。
自白：由于我删掉了配置的tmp文件，重新初始化后C:\hadoop-2.7.7\tmp\hadoop-15276\dfs\data\current目录下面不再有version文件记录datanode的clusterid，导致后面一系列问题。

12 启动hadoop，运行start-all.cmd报错

RuntimeException: Error while running command to get file permissions : ExitCodeException exitCode=-1073741515
参考 https://blog.csdn/qq_45503559/article/details/102965422 ，这可能是Hadoop中bin目录下的winutils.exe缺少依赖msvcr100.dll造成，可以直接下载该文件再粘贴到C:\Windows\System32即可。但是网上关于这个组件的下载资源不好找，可使用下列链接直接下载
vcredist_x64.exe ，然后点击运行，即可在该目录下找到msvcr100.dll
https://www.microsoft/en-us/download/details.aspx?id=26999 （亲测有效）
https://learn.microsoft/zh-CN/cpp/windows/latest-supported-vc-redist?view=msvc-170#visual-studio-2015-2017-2019-and-2022 （备用）
下载后直接运行vcredist_x64.exe可修复 msvcr100.dll缺失问题

安装完毕再次运行start-all.cmd,登录50070Web UI下面什么也没有（有的文章截图中该Web UI有文件上传、删除按钮，但是本人安装后并没有发现对应按钮，可能是版本或者问题，希望有读者指出原因）

注：使用一段时间后，如果有MapReduce作业，会在根目录下生成一个tmp文件夹：
HDFS下/tmp目录的作用：
HDFS下的/tmp目录主要用作mapreduce操作期间的临时存储，如staging、个人目录、hdfs、root目录。 MapReduce工作产生的中间临时数据等将保存在该目录下。MapReduce作业执行完成后，这些文件将自动清除。
如果删除此临时文件，则可能会影响当前正在运行的mapreduce作业
引自：https://blog.csdn/liuwei0376/article/details/120739973

附：常用命令：

启动/关闭hadoop：（sbin目录下）start-all.cmd / stop-all.cmd
查看安全模式： hdfs dfsadmin -safemode get
查看文件夹：hadoop fs -ls / （没有文件夹时返回Error: Could not find or load main class fs）
创建文件夹： hadoop fs -mkdir /zzt
删除文件夹：hadoop fs -rm -r -skipTrash /zzt （-r，recursive，表示递归删除子目录，在文件夹非空时需要加上此参数）
上传文件到指定目录： hadoop fs -put C:\Users\15276\Desktop\cpi.csv /zzt
下载文件到本地：hadoop fs -copyToLocal /sanguo/shuguo/kongming.txt ./

本文标签：单机版系统 Windows Hadoop

版权声明：本文标题：Windows系统部署单机版Hadoop 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1716191430h670174.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

技术交流 – FreeNAS中文网

Windows系统部署单机版Hadoop

1 前提：

2 下载安装包 hadoop-2.7.7.tar.gz 来源：

3 使用tar命令解压hadoop-2.7.7.tar.gz

4 安装必要插件winutils-master

5 替换

6 配置环境变量：

7 运行hadoop version查看是否安装好

8 移动hadoop.dll文件

9 按如下路径创建文件夹，接下来修改配置文件时要用

10 修改如下四个文件

11 初始化namenode

12 启动hadoop，运行start-all.cmd报错

附：常用命令 ：

更多相关文章

Windows搭建Nodejs【全网最详细】

Windows 7 引导信息修复方法

win7如何显示文件后缀？Windows系统没有扩展名如何解决？

ESP32-S2 windows开发环境快速搭建

windows下安装filebeat

windows 修改背景颜色之后重启又恢复的解决方法

Windows服务器时间同步

STC-ISP在Windows 7下使用方法

基于C#实现Windows服务

windows 2012开启远程桌面

MySQL环境配置和Windows命令行登录

MacBook Pro (13 英寸, 2012 年中)安装win7系统

CentOs 7 下修改 Windows 默认启动顺序

windows安装python的包管理器poetry

windows 2016 域服务器时间同步

系统封装失败遇到windows 无法分析或处理

Caffe(CPU-only)版本在windows下的安装及配置

如何将必应（Bing）的背景图片设定成 Windows 7 的主题

2024年在Vmware中安装Win7系统Vmware Tools安装失败解决办法

正版Windows1011系统下载安装详细教程

发表评论

推荐文章

缩略图如何不挤压拉伸图片

容器——ConcurrentHashMap的底层实现原理

怎么调用函数啊急急急

计算机歌曲谱9420,抖音9420是什么歌? 完整版歌词分享

win7修复计算机消失,win7系统引导文件丢失的修复妙招

热门文章

Windows7安装pr哪个版本？win7可以安装pr2019与2020吗

校验银行卡号是否正确

java打出字母然后出整个单词

涨薪跳槽利器！清华大佬总结的 Java 核心突击讲，一应俱全

springboot 移动maven仓库后执行mvn clean报错Could not find artifact

【NoMachine 如何Ctrl + Alt + T启动Linux终端】

Windows7电脑装ubuntu系统成双系统，使用easyBCD建立引导而不使用U盘和使用U盘来进行启动安装。

win10系统改win7系统怎么安装 电脑win10系统改win7系统

win10还能装回win7吗_win10降回win7详细教程

Mysql安全之基础合规配置

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

苹果电脑windows系统换苹果系统

Win11系统崩溃错误修复指南：三种实用方法详解

如何封装一个自己的win7系统并安装到电脑做成双系统

如何在Excel 2019中开启数据分析工具？

批量激活管理工具VAMT 3.0的安装与基本使用方法简介

附：常用命令：

win10系统改win7系统怎么安装电脑win10系统改win7系统