admin 管理员组文章数量: 887021
2024年3月29日发(作者:jdk安装包怎么安装)
Linux内核I/O系统报错日志与硬盘故障对应
关系
Jun04
2011Leave a Comment Written by chen
日志信息
故障现象描述
SMART
规范定义“
Medium Error
”
与硬盘关系
(
1
)硬盘扇区
坏
scsi1: ERROR on channel 0,
错误是一种不可恢复的错误,可能由
id 7, lun 0, CDB: Read (10)
或(
2
)硬盘与
00 73 fc 62 bf 00 00 80 00
于介质的缺陷或记录的数据错误。该
Info fld=0x73fc6326, Current
磁盘控制器连
sdi: sense key Medium Error
错误有别于“
Hardware Error
”。
Additional sense:
接信号质量不
Unrecovered read error
出现
Medium Error
的主要原因是硬
稳定,导致数
盘坏,或者硬盘的数据无法读写。
据出现异常
原生指令排序(Native Command
Queuing,简称NCQ),原先是改善
服务器硬盘存取控制技术,应用在
mptbase: ioc1:
IOCStatus=804b SCSI和SATA 1.0/2.0/3.0接口硬盘
该信息与硬盘
LogInfo=31080000
Originator={PL}, Code={SATA 读写的加速技术,其接口开启磁盘阵
是否故障无直
NCQ Fail All Commands After
列RAID亦有所提升。透过硬盘固件、
接联系
Error}, SubCode(0
×
0000)
硬盘控制器以及操作系统三者的互
相配合,改善硬盘内部磁区的读取顺
序,可以提高硬盘效能约30%,亦能
end_request: I/O error, dev
sdi, sector 1945920256
EXT2-fs error (device sdi1):
read_inode_bitmap: Cannot
read inode bitmap
–
block_group = 222,
inode_bitmap = 14547217
EXT2-fs error (device sdi1):
ext2_get_inode: unable to
read inode block
–
inode=951895,
block=15202501
mptbase: ioc1:
IOCStatus=8000
LogInfo=31110d00
Originator={PL},
Code={Reset},
SubCode(0x0d00)
mptbase: ioc1:
IOCStatus=804b
LogInfo=31110d00
Originator={PL},
Code={Reset},
SubCode(0x0d00)
够轻微减轻硬盘损耗的速率。NCQ
对用于服务器上的硬盘的效率提升
尤为明显。
PL:Protocol Layer,指磁盘控制器中的
协议层
(
1
)硬盘扇区
坏。
内核不能从硬盘上的文件系统读取
或(
2
)硬盘与
数据。
磁盘控制器连
接信号质量不
稳定,导致数
据出现异常。
该信息不能作
驱动准备让磁盘控制器IOC单元复
为硬盘故障的
位,出现该操作原因为驱动发现多次
依据。打印该
读写硬盘数据失败。
信息的原因,
IOCStatus=0×8000
与硬盘
/
磁盘控
磁盘控制器配置页面处于共享的递
制器
IOC
单元
/
归方式。
硬盘与控制器
IOCStatus=0×8048
尝试读取不存在的超级配置数据。
之间的链路有
IOCStatus=0x804b
关。
IOC
错误
超级数据序列号由0xffffffff变为0
码含义见前
mptscsih: ioc1: attempting
task abort!
(sc=000001007b4cf340)
scsi1 : destination target 8,
lun 0
command = Read (10) 00 5f
2a 4d 3f 00 10 00 00
mptbase: ioc1:
IOCStatus=8048
LogInfo=31130000
Originator={PL}, Code={IO
Not Yet Executed},
SubCode(0
×
0000)
mptscsih: ioc1: task abort:
SUCCESS
(sc=000001007b4cf340)
mptscsih: ioc1: attempting
target reset!
mptscsih: ioc1: attempting
bus reset!
(sc=000001007b4cf340)
mptscsih: ioc1: Attempting
host reset!
(sc=000001007b4cf340)
mptbase: Initiating ioc1
recovery
面。
磁盘控制器驱动尝试取消读写任务。该信息与硬盘
本示例代码中,表明取消在
target 8
,是否故障无直
lun 0
的读数据任务。
接联系
该信息与硬盘
磁盘控制器驱动报告报告当前
IOC
是否故障无直
(
I/O Controller
)单元状态码
接联系
该信息与硬盘
磁盘控制器驱动报告读写任务取消
是否故障无直
成功
接联系
该信息不能作
为硬盘故障的
磁盘控制器驱动尝试复位依据。打印该
target/bus/host
,并重新恢复
IOC
信息的原因,
(
I/O Controller
)单元
与硬盘
/
磁盘控
制器
IOC
单元
/
硬盘与控制器
之间的链路有
关。
scsi: Device offlined
–
not
硬盘
offline
,硬盘的位置为
host 1
硬盘处于故障
ready after error recovery:
channel 0 id 8 lun 0
状态或丢失
host 1 channel 0 id 8 lun 0
SCSI error : <1 0 8 0> return
SCSI
层报告在
host 1 channel 0 id 8
code = 0
×
10000
硬盘处于故障
end_request: I/O error, dev
lun 0
设备上读写错误,返回码为
sdj, sector 1596607807
状态或丢失
scsi1 (8:0): rejecting I/O to
0
×
10000
,表明设备已不在位。
offline device
mptsas: ioc1: attaching sata
系统新加入新的硬盘,硬盘所在位置
device, channel 0, id 11, lun
插入新的硬盘
0, phy 0
为
phy 0
,即第一个物理槽位。
从系统中拔掉一块硬盘,硬盘对应的
mptsas: ioc0: removing sata
device, channel 0, id 21, phy
物理位置为
phy 2
,即第
3
个物理槽拔除一块硬盘
2
位。
Remounting filesystem
read-only
文件系统变为只读,原因为文件系统与硬盘是否故
遭到破坏
障无直接关系
版权声明:本文标题:Linux内核I_O系统报错日志与硬盘故障对应关系 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.freenas.com.cn/jishu/1711722482h610862.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论