记录一次惨烈的服务器故障

一台当作内部服务器用的笔记本电脑A经过长途颠簸挂了。

从车上搬回家,接电接网,过了一会发现服务并未上线,感觉问题有些严重,接显示器发现连显示器也不能点亮。

幸好有备用机B,打开布满灰尘的备用机接电,卧槽!也不能点亮显示器。连续两台无法点亮,难道是显示器坏了?从墙上拆下一个电视机,A、B接电视机,发现也无法点亮。难道电视机也是坏的?我拿了一台我现在正在用的确定是好的笔记本电脑C,接显示器和电视机,都能正常点亮。说明显示器和电视机都是好的,确认A、B都挂了。

现在最要紧的抢救A硬盘上的数据,但它是Linux的ext4文件系统,在Windows下不能读取。有几款软件号称能读取,但是实际测试了一下,不但不能读取反而导致Windows不能正常关机了。我担心对硬盘的内容产生破坏,所以就没有再继续走这条路。

在Windows下搞一个虚拟机安装Linux,再用这个虚拟机挂载实体硬盘行不行呢?尝试了很长时间,仍然没有进展,仍旧只能挂载虚拟硬盘。

决定在物理机上安装一个Linux系统。

找出另一台吃灰的老笔记本D,倒是可以顺利开机,但是在安装过程进行到几分钟就黑屏,发出硬盘掉电的声音。但是试验发现,此时电脑并未关机,按电源开关仍然能从刚才的进度继续安装。拆开发现主板有一处变色,疑似电容爆浆了。黑屏过于频繁,平均一分钟黑屏一次,即使安装成功了指望从这台电脑恢复数据也不可能,所以放弃D。

又找出另一台吃灰的迷你主机E(cubieboard),它当初外接一块硬盘,并通过fstab实现开机自动挂载。后来这个硬盘挂了,cubieboard在启动过程中找不到硬盘,接其他硬盘也不行,卡死无法进入系统,就变砖了。这次又重新找出来,希望能死马当活马医。尝试了TTL转USB线,能成功连接E并查看E的信息,但连接上的界面并不是我们常见的登录Linux的shell,我也不知道它叫什么命令行环境。总之,只有很少的几个命令,也不能访问硬盘的文件系统,更不可能修改fstab了。

至此B、D、E三个备用机全被证明没有办法用,最终只好把我移动办公用的笔记本电脑C备份上面的数据,然后格盘重装Deepin,搭建环境,导数据,最终经过超过40个小时的奋战,系统终于重新上线了。但还有很多问题需要解决:还有老大难的硬盘自动挂载,这次不敢用fstab了,打算自己写个脚本,在开机之后再挂载,这样的好处是:即使挂载失败也不会导致电脑变砖,至少已经登录进系统了。

这件事告诉我一个道理:备用机可以性能低一些,但如果不靠谱就等于没有。