监视/重建硬件RAID(Linux)

2020年12月29日15:58:09 发表评论 42 次浏览

对于专用服务器和服务器电源交易

本文介绍了如何监视硬件RAID, 检测有缺陷的RAID以及在必要时重建RAID。

notlogy根服务器使用3ware, Areca, Adaptec, Broadcom或Dell的硬件控制器。

识别硬件控制器

你可以使用lspci命令来检查服务器上安装了哪个硬件控制器。该命令列出了PCI总线上的所有设备。

如果你使用的是最小系统, 则必须手动安装此程序。为此, 请输入以下命令:

CentOS的7

百胜安装pciutils

Ubuntu 16.04和Ubuntu 18.04

须藤apt-get pciutils

要检查服务器上安装了哪个硬件控制器, 请输入以下命令:

lspci | grep RAID

例子:

[root @ localhost〜]#lspci | grep RAID

01:00.0 RAID总线控制器:Adaptec系列6-6G SAS / PCIe 2(版本01)

[root @ localhost〜]#lspci | grep RAID

02:00.0 RAID总线控制器:Broadcom / LSI MegaRAID Tri-Mode SAS3408(rev 01)

[root @ localhost〜]#lspci | grep RAID

01:09.0 RAID总线控制器:3ware Inc 7xxx / 8xxx系列PATA / SATA-RAID(版本01)

[root @ localhost〜]#lspci | grep RAID

02:0e.0 RAID总线控制器:Areca Technology Corp. ARC-1110 4端口PCI-X至SATA RAID控制器

RAID控制器管理程序

默认情况下, 将安装管理每个RAID控制器所需的软件。如有必要, 你可以在此处下载相应控制器的软件:

Adaptec RAID控制器:

https://storage.microsemi.com/en-us/downloads/

Broadcom RAID控制器:

https://www.broadcom.com/support/download-search

Dell RAID控制器:

https://www.dell.com/support/home/de-de?app=products

3ware RAID控制器:

https://www.broadcom.com/support/knowledgebase/1211161499498/operating-systems-supported-for-the-lsi-3ware-and-megaraid-contr

槟榔RAID控制器:

https://www.areca.com.tw/support/downloads.html

获取有关硬件RAID控制器的详细信息

Adaptec RAID控制器

Adaptec RAID控制器通过arcconf命令行工具进行管理。使用以下命令查看有关Adaptec RAID控制器和配置的详细信息:

命令 解释
arcconf GETCONFIG 1 此命令显示有关RAID控制器, 配置, RAID阵列, 可用磁盘及其当前状态的信息。
arcconf getconfig 1 PD 使用此命令可显示有关现有硬盘的信息。
arcconf getlogscontroller-number设备¦死亡¦事件[清除¦表格] 使用此命令显示日志条目。你可以使用以下参数指定显示的日志条目的类型:
示例:arcconf getlogs 1设备列表 设备:显示所有日志条目, 其中包含控制器可以在所有连接的设备上检测到的错误。
  DEAD:显示记录设备和磁盘故障的所有日志条目。
  事件:显示所有日志条目, 其中包含有关特殊事件的信息(例如, 重建, LDM等)
  你还可以指定以下参数:
  表格格式:以表格格式显示日志。
  clear:删除指定的控制器协议。
arcconf getlogs控制器号设备¦死亡¦事件[清除¦表格]> DATEINAME.log 此命令将日志条目写入文件。
示例:arcconf getlogs 1设备列表> device.log  

你可以在这里找到更多信息:

用户指南ARCCONF命令行实用程序

Broadcom RAID控制器

Broadcom RAID控制器由StorCLI命令行工具管理和控制。使用以下命令显示有关Broadcom RAID控制器和配置的详细信息:

命令 解释
storcli64 / c0显示全部 此命令显示有关RAID控制器和配置的信息。
storcli64 / c0 / eall / sall show 使用此命令可显示有关现有硬盘的信息。
storcli64 / c0 / eALL / sALL显示全部 此命令显示有关可用磁盘及其当前状态(序列号, 温度等)的信息。
storcli / cx显示eventloginfo 使用此命令显示日志条目。

你可以在此处找到更多信息:

12Gb / s MegaRAID Tri-ModeStorCLI用户指南

戴尔RAID控制器

Dell RAID控制器使用PowerEdge RAID控制器命令界面(PERCCLI)。使用以下命令查看有关Dell RAID控制器和配置的详细信息:

命令 解释
perccli64 / c0 / e32 / s0显示全部 使用此命令可显示有关磁盘0的信息。
perccli64 / c0 / e32 / s1显示全部 使用此命令显示有关磁盘1的信息。
perccli64 / c0显示 使用此命令可显示有关现有硬盘的信息。
perccli / c0显示eventloginfo 此命令显示控制器0的日志条目。

你可以在这里找到更多信息:

Dell EMC PowerEdge RAID控制器CLI参考指南

3ware RAID控制器

要获取有关3ware RAID控制器的详细信息, 请键入以下命令:

# dmesg|grep 3ware
3ware Storage Controller device driver for Linux v1.26.02.002.
scsi0 : 3ware Storage Controller
3w-xxxx: scsi0: Found a 3ware Storage Controller at 0xd800, IRQ: 18.
scsi 0:0:0:0: Direct-Access 3ware Logical Disk 0 1.2 PQ: 0 ANSI: 0
3ware 9000 Storage Controller device driver for Linux v2.26.02.010.

tw_cli

3ware RAID控制器通过3ware Storage Controller管理命令行界面。要打开命令行界面, 请输入命令tw_cli。使用救命命令以显示所有可用命令。要退出控制台, 请键入出口.

# tw_cli
//XXX> help

Copyright(c) 2004-2006 Applied Micro Circuits Corporation(AMCC). All rights reserved.

AMCC/3ware CLI (version 2.00.06.007)


Commands Description
-------------------------------------------------------------------
focus Changes from one object to another. For Interactive Mode Only!
show Displays information about controller(s), unit(s) and port(s).
flush Flush write cache data to units in the system.
rescan Rescan all empty ports for new unit(s) and disk(s).
update Update controller firmware from an image file.
commit Commit dirty DCB to storage on controller(s). (Windows only)
/cx Controller specific commands.
/cx/ux Unit specific commands.
/cx/px Port specific commands.
/cx/bbu BBU specific commands. (9000 only)
/ex Enclosure specific commands. (9KSX/SE only)
/ex/slotx Enclosure Slot specific commands.
/ex/fanx Enclosure Fan specific commands.
/ex/tempx Enclosure Temperature Sensor specific commands.

Certain commands are qualified with constraints of controller type/model support.
Please consult the twi_cli documentation for explanation of the controller-qualifiers.

The controller-qualifiers of the Enclosure commands (/ex) also apply to Enclosure
Element specific commands (e.g., /ex/elementx).

Type help <command> to get more details about a particular command.
For more detail information see twi_cli's documentation.

//XXX>

要查看有关RAID系统状态的信息, 请键入以下命令:

//XXXX> info

Ctl Model Ports Drives Units NotOpt RRate VRate BBU
------------------------------------------------------------------------
c0 8006-2LP 2 2 1 0 2 - -

//XXXX> info c0

Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
------------------------------------------------------------------------------
u0 RAID-1 OK - - - 232.885 ON -

Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 232.88 GB 488397168 4ND0XYFE
p1 OK u0 232.88 GB 488397168 4ND0YH77

要显示硬件RAID控制器警报, 请键入以下命令:

//XXXX> show alarms

Ctl Date Severity Alarm Message
------------------------------------------------------------------------------
c0 - INFO (0x0F:0x0007): Initialization complete: Unit #0
c0 - INFO (0x0F:0x000C): Initialization started: Unit #0

警报消息以以下格式显示:

//XXXX> show alarms

Ctl Date Severity Alarm Message
------------------------------------------------------------------------------
c0 - INFO (0x0F:0x000B): Rebuild started: Unit #0
c0 - ERROR (0x0F:0x0002): Unit degraded: Unit #0

要从第二个端口的RAID中删除有缺陷的磁盘, 请输入以下命令:

//XXXX> maint remove c0 p1
Removing port /c0/p1 ... Done.

更换有故障的硬盘后, 必须识别新硬盘。为此, 请输入以下命令:

//XXXX> maint rescan
Rescanning controller /c0 for units and drives ...Done.
Found the following unit(s): [none].
Found the following drive(s): [/c0/p1].

要在第二个端口上安装并重建磁盘, 请输入以下命令:

//XXXX> maint rebuild c0 u0 p1
Sending rebuild start request to /c0/u0 on 1 disk(s) [1] ... Done.

要查看有关重建RAID的信息, 请键入以下命令:

//XXXX> info c0

Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
------------------------------------------------------------------------------
u0 RAID-1 REBUILDING 0 - - 232.885 ON -

Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 232.88 GB 488397168 4ND0XYFE
p1 DEGRADED u0 232.88 GB 488397168 4ND0YH77
使用软件3ware Disk Manager 2监视3ware RAID控制器

3ware提供软件3ware磁盘管理器2(3dm2)。使用此软件, 你可以管理和监视3ware RAID控制器。

你可以在此处下载3ware Disk Manager 2:

https://www.broadcom.com/support/knowledgebase/1211161499498/operating-systems-supported-for-the-lsi-3ware-and-megaraid-contr

3ware文档

有关安装, 配置和使用的更多信息, 请参考3ware文档。你可以在这里找到它:

https://www.broadcom.com/support/knowledgebase/1211161499541/lsi-3ware-user-documentation-downloads

槟榔RAID控制器

要获取有关Areca RAID控制器的详细信息, 请键入以下命令:

# dmesg|grep -i areca
ARECA RAID ADAPTER0: FIRMWARE VERSION V1.43 2007-4-17
scsi0 : Areca SATA Host Adapter RAID Controller
scsi 0:0:0:0: Direct-Access Areca ARC-1110-VOL#00 R001 PQ: 0 ANSI: 5
scsi 0:0:16:0: Processor Areca RAID controller R001 PQ: 0 ANSI: 0

下面列出了一些示例命令。你可以在救援系统中访问控制器:

arcmsr_cli64
Copyright (c) 2004 Areca, Inc. All Rights Reserved.
Areca CLI, Version: 1.71.240( Linux )


Controllers List
----------------------------------------
Controller#01(PCI): ARC-1110
Current Controller: Controller#01
----------------------------------------

CMD Description
==========================================================
main Show Command Categories.
set General Settings.
rsf RaidSet Functions.
vsf VolumeSet Functions.
disk Physical Drive Functions.
sys System Functions.
net Ethernet Functions.
event Event Functions.
hw Hardware Monitor Information.
exit Exit CLI.
==========================================================
Command Format: <CMD> [Sub-Command] [Parameters].
Note: Use <CMD> -h or -help to get details.
CLI>

用命令<cmd>信息你可以请求系统信息。例如, 输入硬件信息命令, 显示硬件监视器信息:

CLI> hw info
The Hardware Monitor Information
===========================================
Fan#1 Speed (RPM) : 2673
HDD #1 Temp. : 48
HDD #2 Temp. : 47
HDD #3 Temp. : 51
HDD #4 Temp. : 0
===========================================
GuiErrMsg<0x00>: Success.

CLI>

要显示有关磁盘的信息, 请键入以下命令:

CLI> disk info
# ModelName Serial# FirmRev Capacity State
===============================================================================
1 ST3750640AS 5QD5G7Z1 3.AAK 750.2GB RaidSet Member(1)
2 ST3750640AS 5QD5G6JR 3.AAK 750.2GB RaidSet Member(1)
3 ST3750640AS 5QD5G7XQ 3.AAK 750.2GB RaidSet Member(1)
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

使用以下命令显示有关Areca RAID控制器的系统信息。

CLI> sys info
The System Information
===========================================
Main Processor : 500MHz
CPU ICache Size : 32KB
CPU DCache Size : 32KB
System Memory : 256MB/333MHz
Firmware Version : V1.43 2007-4-17
BOOT ROM Version : V1.43 2007-4-17
Serial Number : Y813CAAAAR101890
Controller Name : ARC-1110
===========================================
GuiErrMsg<0x00>: Success.

CLI>

要显示当前事件, 请键入以下命令:

CLI> event info
Date-Time Device Event Type
===============================================================================
2009-07-09 07:23:14 H/W MONITOR Raid Powered On
2008-09-29 08:06:24 H/W MONITOR Raid Powered On
2008-09-29 07:51:37 H/W MONITOR Raid Powered On
...

使用以下命令获取有关当前RAID集的信息:

CLI> rsf info
# Name Disks TotalCap FreeCap DiskChannels State
===============================================================================
1 Raid Set # 00 3 2250.5GB 0.0GB 123 Normal
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

在此示例中, RAID集包含3 x 750 GB。

要显示有关逻辑RAID卷的信息, 请键入以下命令:

CLI> vsf info
# Name Raid# Level Capacity Ch/Id/Lun State
===============================================================================
1 ARC-1110-VOL#00 1 Raid5 1500.3GB 00/00/00 Normal
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

如果要使用Areca RAID控制器更改硬件RAID, 则需要输入密码。默认密码为" 0000"。例:

<CLI> set password=0000.
槟榔文档

有关安装, 配置和应用程序的更多信息, 请参考Areca文档。你可以在这里找到它:

http://areca.starline.de/RaidCards/Documents/Manual_Spec/Software

更换硬盘后的必要步骤

如果更换了有缺陷的硬盘, 通常会自动开始重建RAID系统。为了确保RAID系统的功能, 我们建议监视RAID系统的重建。


内容

  • 识别硬件控制器
  • RAID控制器管理程序
  • 获取有关硬件RAID控制器的详细信息
  • tw_cli
  • 更换硬盘后的必要步骤
  • 到达顶点
一盏木

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: