admin 管理员组文章数量: 887019
2024年4月13日发(作者:mybatis plus和mybtis的区别)
使用华为N8500与磁带库管理软件NBU建立NDMP备份
的案例
叶伟贤
【摘 要】本文针对中国农业银行广东省分行新到的华为NAS存储N8500接入物
理带库数据备份系统后,此存储的NDMP备份作业大部分无法成功操作的情况,分
析操作失败的原因,总结出临时解决方案和彻底解决方案两种方法,以供大家参考.
【期刊名称】《金融科技时代》
【年(卷),期】2016(000)001
【总页数】3页(P40-42)
【关键词】金融科技;驱动器路径(SCSIID);NDMP;华为N8500;NBU
【作 者】叶伟贤
【作者单位】中国农业银行广东省分行
【正文语种】中 文
中国农业银行广东省分行(以下简称“农行广东分行”)的离线数据备份系统由一
个装有NBU备份管理软件的服务器统一控制2台磁带库(昆腾I6000和昆腾
I500),通过光纤交换机分别连接多套NAS存储组成,负责完成省域数据中心各
个信息系统的数据备份任务(如图1所示)。
原来光纤交换机连接EMC NS80和Netapp FAS3240,后来增加连接华为
N8500,但华为NAS存储N8500接入物理带库后,此存储上的NDMP备份作
业大部分无法成功操作,其他厂商存储NDMP备份使用相同的驱动器却能够成功
操作。
备份失败的NBU日志如图2所示,可以看到系统安装磁带时会安装很久(15分
钟后失败),正常情况一般为1~2分钟,然后请求其他磁带资源(耗费30分钟)
同样失败,最终返回“error requesting media (tpreq) 98”的错误码。若无
法建立NDMP备份,将不能备份华为N8500存储上应用系统产生的数据。
(一)疑点初定
出现问题后,经分析备份日志,得知在报“error requesting media (tpreq)
98”的错误码之前,NBU返回“media id XXXL5 load operation reported an
error”的错误信息,这个错误信息的意思是机械臂将磁带XXXL5载入到驱动器失
败。从EMM服务器数据库记录的可用资源磁带和驱动器的相关资料可知,发生
这种问题有两种可能性:一是磁带所在带库的实际槽位与EMM服务器数据库记
录信息不一致;二是NDMP server到物理带库驱动器路径与EMM服务器数据库
记录信息不一致。
(二)华为实验室中测试环境的问题复现和定位
在华为实验室中搭建测试环境,通过NBU的“media->Inventory Robot”更新
EMM服务器数据库后,同步了磁带所在带库的实际槽位与EMM服务器数据库记
录信息,重新触发备份仍然报错。因此,故障不是由“磁带所在带库的实际槽位与
EMM服务器数据库记录信息不一致”引起的。
模拟“NDMP server到物理带库路径与EMM服务器数据库记录信息不一致”,
将物理带库驱动器1和驱动器2所接的光纤交换机链路交换一下,即驱动器2接
光纤交换机1,驱动器1接光纤交换机2,然后N8500上扫盘但不重新更新“驱
动器路径”配置。重新启动备份,备份日志与农行广东分行环境的现场故障完全一
致,都是安装磁带时会耗时很久,然后请求其他磁带资源(请求耗费了30分钟)
失败,最终报错“error requesting media (tpreq) (98)”问题已得到复现。
因此,定位问题是由于“NDMP server到物理带库驱动器路径与EMM服务器数
据库记录信息不一致”造成。
(三)原因分析
查看组网变更前后,发现驱动器1和驱动器2在N8500系统中的设备驱动器配置
发生了变化,NBU上未使用“Configure Storage Devices”更新EMM服务器
数据库记录的“驱动器路径”配置,导致NBU master server请求驱动器资源时
还是使用旧的驱动器路径(SCSI ID)配置信息,导致访问驱动器失败。
华为N 8 5 0 0升级前的微码版本为(N8000V200R001C00LNH001SPC102),
连接驱动器路径使用的是/dev下的字符设备,如/dev/st1,/dev/st2等,而这些
字符设备对应的驱动器路径配置会在当前的N8500微码版本中随每次FC驱动加
载而发生变化,即每次FC驱动加载时,N8500会对每个FC端口并发进行探测,
先探测到的序号小,后探测到的序号大,所以在FC发生驱动加载时就会出现驱动
器路径配置发生变化的现象。经分析,主要有两种情况会导致驱动器路径配置发生
变化:N8500连接物理带库的节点重启;N8500连接物理带库链路光纤热插拔后,
N8500重新扫盘。而农行广东省分行未重启过相关节点,但维护过程中出现过光
纤热插拔,因此,问题应是第二种情况导致的。
(一)临时解决方案
为了尽快排除问题,使华为NAS存储N8500对接物理带库NDMP备份作业成功,
农行广东省分行使用临时、快速的方法实现NDMP server到物理带库驱动器路径
与EMM服务器数据库记录信息一致:
1. 在华为N8500存储端扫描磁带驱动器信息,具体步骤如下:
(1)使用master用户登录存储命令行;
(2)执行storage scanbus命令扫描磁带驱动器信息;
(3)执行ndmp stop命令停止ndmp服务;
(4)执行ndmp start命令开启ndmp服务;
(5)执行ndmp status命令查看ndmp服务是否为RUNNING状态,如果是,
表示服务启动成功。
2. 在NBU端,先删除原来使用的驱动器路径配置,再使用“Configure Storage
(1)Devices”更新共享驱动器路径配置,具体步骤如下:
(1)删除N8500所使用的驱动器路径;
(2)以管理员账户登录NetBackup管理控制台;
(3)使用向导扫描带库,在NetBackup管理控制台上,单击“Configure
Storage Devices”,选中NDMP客户端,扫描主机,自动查找磁带驱动器和机
械手;
(4)显示已经扫描到的磁带驱动器和机械手,选择待配置的机械手和磁带驱动器,
更新设备配置信息;
(5)更新带库的磁带信息,选择“Inventory Robot”;
(6)登录NBU界面的Device monitor查看所有驱动器的路径是否都为up状态,
如果有处于down状态的驱动器路径,需要手动up该路径;
(7)测试N8500的备份作业。
(二)彻底解决方案
由于临时方案避免不了光纤热插拔、存储维护等原因,导致驱动器路径发生变化。
为了彻底解决这个问题,华为公司开发出新的微码版本
N8000V200R001C00LNH001SPC103,更改了NDUMP驱动器路径的使用策略。
N8500访问驱动器的设备路径更改为/dev/tape/by-id/xxxxx-nst,它是指向磁带
和机械臂设备的软链接与物理地址固定匹配,因为“xxxxx”对应每个存储设备唯
一的设备ID,此ID不会因为FC驱动重新加载而发生变化,因此在NDMP加载
磁带设备时,采用该软链接/dev/tape/byid/xxxxx-nst可解决此问题。
农行广东省分行目前已将华为N8500的微码升级到
N8000V200R001C00LNH001SPC103版本,彻底解决了该问题。
【相关文献】
[1]张庆丹.省级数据中心NBU备份服务器常见错误及应对办法[J].金融科技时代,2014(8):76-
77.
[2]贺翔,李军,徐伟,等.一种基于NDMP的块级备份/恢复方法及其实现[J].计算机工程,2007
(2):82-84.
版权声明:本文标题:使用华为N8500与磁带库管理软件NBU建立NDMP备份的案例 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.freenas.com.cn/jishu/1712980572h625799.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论