[原创] IBM N3300更换新硬盘

[复制链接]

该用户从未签到

5

主题

4

回帖

58

积分

[INTOHARD]班长

Rank: 2

积分
58
发表于 2015-11-17 00:01:58 | 显示全部楼层 |阅读模式
本帖最后由 小蚂蚁. 于 2015-11-17 09:35 编辑

某医院有两台IBM-N3300存储,其中一台有三块硬盘亮黄灯,也就是这三个硬盘坏了,存储还能正常工作。
此N3300已经过保,医院无力支付昂贵的续保费用,所以想找到我代为处理这个case!

要求为:代购三块适用于N3300的硬盘,并进行更换!

处理过程:
      某宝海淘n久,购得三块IBM 500GB SAS硬盘,然后屁颠屁颠的跑医院去上线。拔下坏硬盘,更换硬盘架,然后插上好硬盘。发现这三个硬盘的指示灯为绿色(心想:嗯,硬盘还是好的!)但是在有数据访问的时候,其他原有硬盘的指示灯都会闪烁,这三个新硬盘的指示灯并没有任何变化。心想,估计还要到控制台配置下!

     于是开始研究这个N3300,首先这是个SAN,同时支持ISCSI和FC,可以插12块硬盘(支持多大容量未知),有两个控制器(后来才知道,这两个控制器是独立的)。有console和web管理口。我想从web管理口进去看看这个机器的其他配置,还有设置页面!但是和医院的IT沟通了N久,发现这信息科的人什么都不知道,就会开机关机!我在没有管理口地址,账号和密码的情况下觉得这事太不好搞了,简直无从下手。网上查了好多资料,也没有什么有用的信息,走投无路只好改从串口进了!接好串口线,打开xshell发起连接,比较幸运的居然通了,然后就是尝试各种账号和密码的组合,可能是运气好,简单的试了几个之后,最终以root:root成功登录到管理终端!然后就是比较让人陌生的命令行了,好歹gg我Linux玩的比较多,这也就是时间多少的事情!

      我开始查看每一个命令的帮助信息,逐渐也理解了这个破机器的一些工作方式,但是有一些名词和概念还是比较生僻,不像我之前接触到的各档次存储。一时弄得我又很头疼,然后网上查了查这些东西,发现很多都和netapp有关系,然后又仔细看了看终端的命令行提示,突然意识到:这TM不是IBM的存储,这是netapp给IBM做的OEM,瞬间头就大了,觉得这趟赔了!一开始就觉得IBM的存储都是DS什么什么的,就没听说过N系列的(本人年龄小,大侠别见怪),原来如此啊!

      尝试着执行了几条命令,获取到了这个存储的一些信息,大概如下:

n3300a> disk show
   DISK       OWNER                  POOL   SERIAL NUMBER  
------------ -------------          -----  -------------  
0c.00.0      n3300b    (142252806)   Pool0  JYWMDDZL           
0c.00.11     n3300a    (142253442)   Pool0  JYWN4AJL           
0c.00.2      n3300b    (142252806)   Pool0  JYWMXM9L           
0c.00.9      n3300a    (142253442)   Pool0  JYWMDEYL           
0c.00.3      n3300a    (142253442)   Pool0  JYWABG6L           
0c.00.6      n3300b    (142252806)   Pool0  JYWMP4GL           
0c.00.5      n3300a    (142253442)   Pool0  JYWM9M9L           
0c.00.7      n3300a    (142253442)   Pool0  JYWABMLL           
0c.00.4      n3300b    (142252806)   Pool0  JYWP6H2L           
0c.00.8      n3300a    (142253442)   Pool0  3SK1TKTQ00009117KKBJ
NOTE: Currently 2 disks are unowned. Use 'disk show -n' for additional information.
n3300a> disk show -o
disk show: Missing owner name.
disk  show [-o | -s | -n | -v | -a]  - lists disks and owners
n3300a> disk show -n
   DISK       OWNER                  POOL   SERIAL NUMBER  
------------ -------------          -----  -------------  
0c.00.10     Not Owned              NONE   3SK1TXGH00009117NBM3
0c.00.1      Not Owned              NONE   3SK1TVN300009117L6BH

从这里可以明显发现我新加的三块磁盘的SN和原有的明显不同,心中开始打鼓,害怕这破存储会识别硬盘,非netapp的不能用!然后就是有两块没有所有者,也没有划到pool中,所以现在要想办法把这两个加到池中!

查了些资料,也打电话给netapp工作的前同事请教,owner就是控制器的意思!

n3300a> sysconfig -r
Aggregate aggr0 (online, raid_dp, degraded) (block checksums)
   Plex /aggr0/plex0 (online, normal, active, pool0)
     RAID group /aggr0/plex0/rg0 (double degraded)
      RAID Disk Device   HA  SHELF BAY CHAN Pool Type  RPM  Used (MB/blks)    Phys (MB/blks)
       --------- ------   ------------- ---- ---- ---- ----- --------------    --------------
       dparity FAILED    N/A                   418000/856064000
       parity   0c.00.3  0c    0   3   SA:A   0  SAS  15000 418000/856064000  420584/861357448
       data     0c.00.5  0c    0   5   SA:A   0  SAS  15000 418000/856064000  420584/861357448
       data     0c.00.9  0c    0   9   SA:A   0  SAS  15000 418000/856064000  420584/861357448
       data     0c.00.11 0c    0   11  SA:A   0  SAS  15000 418000/856064000  420584/861357448
       data     0c.00.7  0c    0   7   SA:A   0  SAS  15000 418000/856064000  420584/861357448
       data FAILED    N/A                   418000/856064000

Pool1 spare disks (empty)
Pool0 spare disks (empty)
Broken disks
RAID Disk Device   HA  SHELF BAY CHAN Pool Type  RPM  Used (MB/blks)    Phys (MB/blks)
--------- ------   ------------- ---- ---- ---- ----- --------------    --------------
bad label 0c.00.1  0c    0   1   SA:A   0  SAS  15000 418000/856064000  420156/860480768
bad label 0c.00.8  0c    0   8   SA:A   0  SAS  15000 418000/856064000  420156/860480768
bad label 0c.00.10 0c    0   10  SA:A   0  SAS  15000 418000/856064000  420156/860480768
Partner disks
RAID Disk Device   HA  SHELF BAY CHAN Pool Type  RPM  Used (MB/blks)    Phys (MB/blks)
--------- ------   ------------- ---- ---- ---- ----- --------------    --------------
partner  0c.00.2  0c    0   2   SA:A   0  SAS  15000 0/0               420584/861357448
partner  0c.00.0  0c    0   0   SA:A   0  SAS  15000 0/0               420584/861357448
partner  0c.00.6  0c    0   6   SA:A   0  SAS  15000 0/0               420584/861357448
partner  0c.00.4  0c    0   4   SA:A   0  SAS  15000 0/0               420584/861357448
从这里可以看出,我链接的这个控制器上一共管理的8块磁盘,其中的7块做了一个raid_dp(也就是netapp自己的raid6),剩下一个应该是热备盘。在这组raid中损坏了一块数据盘和一块校验盘,所以他现在运行在降级状态!
使用命令查看这个存储的网络设置,比较巧的发现了IP地址,然后顿感柳暗花明。之前还在发愁这个上线后风险,不敢操作呢,这回有了web管理弄起来可以比较直观。上张截图:
IBM <wbr>N3300更换新硬盘
然后研究了半天这个web管理,最后发现搞不定(这个过程很痛苦,我不想再回忆它了)!无奈,继续看串口命令行!

当时是夜里11点了,我有点困也比较烦,心想反正数据已经备份了,现在机器也是可以下线的,直接把这三个盘上线得了!(小朋友可千万不要学我,我是有备份的……),上截图:

IBM <wbr>N3300更换新硬盘
发现无法上线,提示“bad label”,做到这个地步我整个人都不好了!更加确信这三个硬盘没有netapp授权,这个机器不让用的想法了!但是钱也花了,总不能栽在这吧?然后又探索“bad label”!

       功夫不负有心人,终于发现这破机器有个超级权限,进入这个权限模式下会提示如下内容:

Warning: These advanced commands are potentially dangerous; use
          them only when directed to do so by IBM
          personnel.

然后再次对新硬盘进行分配,一切无比顺利,新加的硬盘可以直接分配到raid中缺失的位置,并且自动做同步操作!

       然后我就觉得可以睡个好觉了!

       经此一事,对netapp的san有了比较深的理解,之后还帮这医院从新做了下配置,划分了500GB+的未使用空间出来,也真不知道之前的支持是怎么做的……

如需交流请联系QQ:3161174854

文章转载自:http:// blog.sina.com.cn/s/blog_1553d510e0102wjxm.html

该用户从未签到

1

主题

104

回帖

209

积分

[INTOHARD]排长

Rank: 3Rank: 3

积分
209
发表于 2015-12-25 14:05:08 | 显示全部楼层
支持原创,感谢分享.
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表