我的博文
本次服务器故障及数据恢复记录
11月6日晚,周二的网络课堂突然全体掉线而中断,恢复后再次全体掉线,按往常的习惯,重新启动服务器再开启网络课堂一般就会正常。于是远程控制重启服务器,十几分钟过去了却没见服务器启动起来,马上QQ联系上海公司方机房的管理人员,他们答应立即给重新启动服务器,等了半天也没有什么动静,最后那边答复说:你们的服务器坏了,显示:ntdetect失败,系统启动不了了。天呐,看起来是系统损坏,我们做的是双硬盘raid1镜像,应该不会有什么大的问题吧,不过晚上课是进行不了了。
机房那边也立即给查看服务器了,到了7日,那边消息说服务器修复了,是把硬盘拆下来,把那个ntdetect文件拷贝到硬盘里面进行修复的,但是服务器连不通,也无法登录,我给了他们管理员的用户名密码也无法登录,这下麻烦了,服务器失去控制了,网站也无法打开。上海方面说他们想办法恢复登陆的问题。8日,上海方面消息说可以登录了,马上登录服务器,结果发现从2006年5月以后所有的数据全部丢失,但是早已删除的以前用来测试的数据却大摇大摆的在那里,网站的程序和数据全部没有了,太不可思议了!
再联系上海方面,那边回答说我们不管数据问题,我们只管服务器是否连通,我们看过你们服务器的硬盘了,两个硬盘的数据一模一样,所以你们也别想着恢复数据了,准备重做系统吧。不敢相信啊,如果真的是这样,那么一年来我们所经营的网站内容将全部丢失,恨的是备份工作没有做到位啊,就算是程序本地有一些可以恢复,数据库内容本地也有一些备份损失几天也不算多大的损失,大概有5G的病例图片内容却是无法挽回了,1年多来那么多网友的辛勤劳作积累的成果啊,怎么办?
这次的现象确实蹊跷,如果上海那边说的情况成立,两个硬盘的内容完全一致,那么我们网站的内容哪里去了?不可能自动返回到2006年的内容。如果2006年5月份两个硬盘其中一个出问题了,另一个硬盘工作,现在这块硬盘也出问题了,上海那边给修复的是2006年出问题的硬盘,造成老数据再现,这个倒是可以理解的解释,但是如何会老数据覆盖新数据?还是不好理解,如此上海方面的说法不成立,或者上海方面把硬盘主从颠倒了,造成老数据覆盖新数据。这样想着,我远程登录服务器仔细察看,发现磁盘管理处只能看到一块硬盘,感觉里面肯定有问题,看来还是要去上海一趟看个究竟。
通知了上海方面,乘9日晚8点的火车,次日凌晨5点到达上海站,乘坐公交于7点钟来到外高桥保税区内的外高桥电信机房。值班室内的公司方小伙子还不错,小伙子警告我机房内辐射大、温度低,不能时间太长,登记后直接进入机房察看服务器。
不出所料开机画面检测只看到一块硬盘,心中暗喜,这样数据有救可能性较大。于是打开机箱做两块硬盘单独运行测试,发现其中一块硬盘系统不能认出,小伙子找来一根新的硬盘数据线接上后可以认出,进入系统后发现所有的数据都在,一场虚惊啊,赶紧备份所有数据。10点多的时候备份工作完成,于是连上两块硬盘,结果系统一块也认不出,而单独连接都可以认出来,测试了一个多小时,最后发现是硬盘上的跳线设置错误,可能是他们拆除硬盘的时候给安装错了。一切连接妥当,盖上机箱,就准备上架了,心想这么简单就恢复了。新的问题出来了,WEB服务无法启动,提示:存储空间不足,不能运行此命令,系统盘下面也有一些检测错误的文件。可能是系统运行期间硬盘线损坏导致的数据错误。
上网搜索得到修改注册表的方法可以解决WEB服务的问题,但是按照网上的方法修改后,依然没有效果。于是重新安装了IIS,但是重新启动后故障依然存在。无意中查看用户表发现计算机名改变,默认用户权限可能不再有效。干脆动了较大的手术,删除了默认用户,重新设置计算机名,删除IIS重新安装,1个多小时后,WEB服务启动了,可是数据库又打不开了。这下没走弯路了,肯定是用户名问题,于是重新设置SQL2005的用户名权限,重新启动,一切OK!
一看手机已经13点多了,有N个来电、N个短信,机房内噪音太大根本没有任何察觉。赶紧短信告诉小荷数据已经完全恢复。那边回复几个“!!!”。
该找个地方休息休息了,还没有吃饭哩。
上海的地名真简单,机房所在称为外高桥保税区,原因是这里有一条很长的高架桥,高架桥外面的叫外高桥,是保税区所在。内面叫高桥,高桥内有生活区,半年前送维修后的服务器到上海就是在高桥的一个宾馆住的,还是去那里。原来的宾馆已经更名了,叫汉庭快捷酒店,记得半年前这里叫亿居快捷酒店。这里有158元的单间,没有窗户,不过还算便宜,空间虽然很小,但看起来很干净,服务态度比半年前的那家要好很多。
第二张照片是我快要离开的时候坐在床上自拍的。
第三章是这家宾馆提供免费上网服务,就在门厅的边上,我就使用着左边电脑远程控制机房内恢复好的服务器进行全面的恢复设置,从晚上的6点多到9点多,就剩下博客没有完全恢复访问了。
共0条评论