admin 管理员组

文章数量: 887019


2024年4月13日发(作者:mybatis plus和mybtis的区别)

使用华为N8500与磁带库管理软件NBU建立NDMP备份

的案例

叶伟贤

【摘 要】本文针对中国农业银行广东省分行新到的华为NAS存储N8500接入物

理带库数据备份系统后,此存储的NDMP备份作业大部分无法成功操作的情况,分

析操作失败的原因,总结出临时解决方案和彻底解决方案两种方法,以供大家参考.

【期刊名称】《金融科技时代》

【年(卷),期】2016(000)001

【总页数】3页(P40-42)

【关键词】金融科技;驱动器路径(SCSIID);NDMP;华为N8500;NBU

【作 者】叶伟贤

【作者单位】中国农业银行广东省分行

【正文语种】中 文

中国农业银行广东省分行(以下简称“农行广东分行”)的离线数据备份系统由一

个装有NBU备份管理软件的服务器统一控制2台磁带库(昆腾I6000和昆腾

I500),通过光纤交换机分别连接多套NAS存储组成,负责完成省域数据中心各

个信息系统的数据备份任务(如图1所示)。

原来光纤交换机连接EMC NS80和Netapp FAS3240,后来增加连接华为

N8500,但华为NAS存储N8500接入物理带库后,此存储上的NDMP备份作

业大部分无法成功操作,其他厂商存储NDMP备份使用相同的驱动器却能够成功

操作。

备份失败的NBU日志如图2所示,可以看到系统安装磁带时会安装很久(15分

钟后失败),正常情况一般为1~2分钟,然后请求其他磁带资源(耗费30分钟)

同样失败,最终返回“error requesting media (tpreq) 98”的错误码。若无

法建立NDMP备份,将不能备份华为N8500存储上应用系统产生的数据。

(一)疑点初定

出现问题后,经分析备份日志,得知在报“error requesting media (tpreq)

98”的错误码之前,NBU返回“media id XXXL5 load operation reported an

error”的错误信息,这个错误信息的意思是机械臂将磁带XXXL5载入到驱动器失

败。从EMM服务器数据库记录的可用资源磁带和驱动器的相关资料可知,发生

这种问题有两种可能性:一是磁带所在带库的实际槽位与EMM服务器数据库记

录信息不一致;二是NDMP server到物理带库驱动器路径与EMM服务器数据库

记录信息不一致。

(二)华为实验室中测试环境的问题复现和定位

在华为实验室中搭建测试环境,通过NBU的“media->Inventory Robot”更新

EMM服务器数据库后,同步了磁带所在带库的实际槽位与EMM服务器数据库记

录信息,重新触发备份仍然报错。因此,故障不是由“磁带所在带库的实际槽位与

EMM服务器数据库记录信息不一致”引起的。

模拟“NDMP server到物理带库路径与EMM服务器数据库记录信息不一致”,

将物理带库驱动器1和驱动器2所接的光纤交换机链路交换一下,即驱动器2接

光纤交换机1,驱动器1接光纤交换机2,然后N8500上扫盘但不重新更新“驱

动器路径”配置。重新启动备份,备份日志与农行广东分行环境的现场故障完全一

致,都是安装磁带时会耗时很久,然后请求其他磁带资源(请求耗费了30分钟)

失败,最终报错“error requesting media (tpreq) (98)”问题已得到复现。

因此,定位问题是由于“NDMP server到物理带库驱动器路径与EMM服务器数

据库记录信息不一致”造成。

(三)原因分析

查看组网变更前后,发现驱动器1和驱动器2在N8500系统中的设备驱动器配置

发生了变化,NBU上未使用“Configure Storage Devices”更新EMM服务器

数据库记录的“驱动器路径”配置,导致NBU master server请求驱动器资源时

还是使用旧的驱动器路径(SCSI ID)配置信息,导致访问驱动器失败。

华为N 8 5 0 0升级前的微码版本为(N8000V200R001C00LNH001SPC102),

连接驱动器路径使用的是/dev下的字符设备,如/dev/st1,/dev/st2等,而这些

字符设备对应的驱动器路径配置会在当前的N8500微码版本中随每次FC驱动加

载而发生变化,即每次FC驱动加载时,N8500会对每个FC端口并发进行探测,

先探测到的序号小,后探测到的序号大,所以在FC发生驱动加载时就会出现驱动

器路径配置发生变化的现象。经分析,主要有两种情况会导致驱动器路径配置发生

变化:N8500连接物理带库的节点重启;N8500连接物理带库链路光纤热插拔后,

N8500重新扫盘。而农行广东省分行未重启过相关节点,但维护过程中出现过光

纤热插拔,因此,问题应是第二种情况导致的。

(一)临时解决方案

为了尽快排除问题,使华为NAS存储N8500对接物理带库NDMP备份作业成功,

农行广东省分行使用临时、快速的方法实现NDMP server到物理带库驱动器路径

与EMM服务器数据库记录信息一致:

1. 在华为N8500存储端扫描磁带驱动器信息,具体步骤如下:

(1)使用master用户登录存储命令行;

(2)执行storage scanbus命令扫描磁带驱动器信息;

(3)执行ndmp stop命令停止ndmp服务;

(4)执行ndmp start命令开启ndmp服务;

(5)执行ndmp status命令查看ndmp服务是否为RUNNING状态,如果是,

表示服务启动成功。

2. 在NBU端,先删除原来使用的驱动器路径配置,再使用“Configure Storage

(1)Devices”更新共享驱动器路径配置,具体步骤如下:

(1)删除N8500所使用的驱动器路径;

(2)以管理员账户登录NetBackup管理控制台;

(3)使用向导扫描带库,在NetBackup管理控制台上,单击“Configure

Storage Devices”,选中NDMP客户端,扫描主机,自动查找磁带驱动器和机

械手;

(4)显示已经扫描到的磁带驱动器和机械手,选择待配置的机械手和磁带驱动器,

更新设备配置信息;

(5)更新带库的磁带信息,选择“Inventory Robot”;

(6)登录NBU界面的Device monitor查看所有驱动器的路径是否都为up状态,

如果有处于down状态的驱动器路径,需要手动up该路径;

(7)测试N8500的备份作业。

(二)彻底解决方案

由于临时方案避免不了光纤热插拔、存储维护等原因,导致驱动器路径发生变化。

为了彻底解决这个问题,华为公司开发出新的微码版本

N8000V200R001C00LNH001SPC103,更改了NDUMP驱动器路径的使用策略。

N8500访问驱动器的设备路径更改为/dev/tape/by-id/xxxxx-nst,它是指向磁带

和机械臂设备的软链接与物理地址固定匹配,因为“xxxxx”对应每个存储设备唯

一的设备ID,此ID不会因为FC驱动重新加载而发生变化,因此在NDMP加载

磁带设备时,采用该软链接/dev/tape/byid/xxxxx-nst可解决此问题。

农行广东省分行目前已将华为N8500的微码升级到

N8000V200R001C00LNH001SPC103版本,彻底解决了该问题。

【相关文献】

[1]张庆丹.省级数据中心NBU备份服务器常见错误及应对办法[J].金融科技时代,2014(8):76-

77.

[2]贺翔,李军,徐伟,等.一种基于NDMP的块级备份/恢复方法及其实现[J].计算机工程,2007

(2):82-84.


本文标签: 驱动器 路径 备份 配置 服务器