admin 管理员组

文章数量: 887021


2024年3月29日发(作者:jdk安装包怎么安装)

Linux内核I/O系统报错日志与硬盘故障对应

关系

Jun04

2011Leave a Comment Written by chen

日志信息

故障现象描述

SMART

规范定义“

Medium Error

与硬盘关系

1

)硬盘扇区

scsi1: ERROR on channel 0,

错误是一种不可恢复的错误,可能由

id 7, lun 0, CDB: Read (10)

或(

2

)硬盘与

00 73 fc 62 bf 00 00 80 00

于介质的缺陷或记录的数据错误。该

Info fld=0x73fc6326, Current

磁盘控制器连

sdi: sense key Medium Error

错误有别于“

Hardware Error

”。

Additional sense:

接信号质量不

Unrecovered read error

出现

Medium Error

的主要原因是硬

稳定,导致数

盘坏,或者硬盘的数据无法读写。

据出现异常

原生指令排序(Native Command

Queuing,简称NCQ),原先是改善

服务器硬盘存取控制技术,应用在

mptbase: ioc1:

IOCStatus=804b SCSI和SATA 1.0/2.0/3.0接口硬盘

该信息与硬盘

LogInfo=31080000

Originator={PL}, Code={SATA 读写的加速技术,其接口开启磁盘阵

是否故障无直

NCQ Fail All Commands After

列RAID亦有所提升。透过硬盘固件、

接联系

Error}, SubCode(0

×

0000)

硬盘控制器以及操作系统三者的互

相配合,改善硬盘内部磁区的读取顺

序,可以提高硬盘效能约30%,亦能

end_request: I/O error, dev

sdi, sector 1945920256

EXT2-fs error (device sdi1):

read_inode_bitmap: Cannot

read inode bitmap

block_group = 222,

inode_bitmap = 14547217

EXT2-fs error (device sdi1):

ext2_get_inode: unable to

read inode block

inode=951895,

block=15202501

mptbase: ioc1:

IOCStatus=8000

LogInfo=31110d00

Originator={PL},

Code={Reset},

SubCode(0x0d00)

mptbase: ioc1:

IOCStatus=804b

LogInfo=31110d00

Originator={PL},

Code={Reset},

SubCode(0x0d00)

够轻微减轻硬盘损耗的速率。NCQ

对用于服务器上的硬盘的效率提升

尤为明显。

PL:Protocol Layer,指磁盘控制器中的

协议层

1

)硬盘扇区

坏。

内核不能从硬盘上的文件系统读取

或(

2

)硬盘与

数据。

磁盘控制器连

接信号质量不

稳定,导致数

据出现异常。

该信息不能作

驱动准备让磁盘控制器IOC单元复

为硬盘故障的

位,出现该操作原因为驱动发现多次

依据。打印该

读写硬盘数据失败。

信息的原因,

IOCStatus=0×8000

与硬盘

/

磁盘控

磁盘控制器配置页面处于共享的递

制器

IOC

单元

/

归方式。

硬盘与控制器

IOCStatus=0×8048

尝试读取不存在的超级配置数据。

之间的链路有

IOCStatus=0x804b

关。

IOC

错误

超级数据序列号由0xffffffff变为0

码含义见前

mptscsih: ioc1: attempting

task abort!

(sc=000001007b4cf340)

scsi1 : destination target 8,

lun 0

command = Read (10) 00 5f

2a 4d 3f 00 10 00 00

mptbase: ioc1:

IOCStatus=8048

LogInfo=31130000

Originator={PL}, Code={IO

Not Yet Executed},

SubCode(0

×

0000)

mptscsih: ioc1: task abort:

SUCCESS

(sc=000001007b4cf340)

mptscsih: ioc1: attempting

target reset!

mptscsih: ioc1: attempting

bus reset!

(sc=000001007b4cf340)

mptscsih: ioc1: Attempting

host reset!

(sc=000001007b4cf340)

mptbase: Initiating ioc1

recovery

面。

磁盘控制器驱动尝试取消读写任务。该信息与硬盘

本示例代码中,表明取消在

target 8

,是否故障无直

lun 0

的读数据任务。

接联系

该信息与硬盘

磁盘控制器驱动报告报告当前

IOC

是否故障无直

I/O Controller

)单元状态码

接联系

该信息与硬盘

磁盘控制器驱动报告读写任务取消

是否故障无直

成功

接联系

该信息不能作

为硬盘故障的

磁盘控制器驱动尝试复位依据。打印该

target/bus/host

,并重新恢复

IOC

信息的原因,

I/O Controller

)单元

与硬盘

/

磁盘控

制器

IOC

单元

/

硬盘与控制器

之间的链路有

关。

scsi: Device offlined

not

硬盘

offline

,硬盘的位置为

host 1

硬盘处于故障

ready after error recovery:

channel 0 id 8 lun 0

状态或丢失

host 1 channel 0 id 8 lun 0

SCSI error : <1 0 8 0> return

SCSI

层报告在

host 1 channel 0 id 8

code = 0

×

10000

硬盘处于故障

end_request: I/O error, dev

lun 0

设备上读写错误,返回码为

sdj, sector 1596607807

状态或丢失

scsi1 (8:0): rejecting I/O to

0

×

10000

,表明设备已不在位。

offline device

mptsas: ioc1: attaching sata

系统新加入新的硬盘,硬盘所在位置

device, channel 0, id 11, lun

插入新的硬盘

0, phy 0

phy 0

,即第一个物理槽位。

从系统中拔掉一块硬盘,硬盘对应的

mptsas: ioc0: removing sata

device, channel 0, id 21, phy

物理位置为

phy 2

,即第

3

个物理槽拔除一块硬盘

2

位。

Remounting filesystem

read-only

文件系统变为只读,原因为文件系统与硬盘是否故

遭到破坏

障无直接关系


本文标签: 硬盘 读写 磁盘控制器 驱动