LANカードの交換で小ハマリしたのでメモ。
サーバが、どうにも不安定だ。
ある時突然、サーバ上のファイルが開くことができなくなったり、RDPでも、コンソールからでも、sshでもログインできなくなったりする。
サーバ全体がフリーズした状態になってしまう。
しかし、しばらくすると復活して普通にアクセスできるようになり、またアクセスできなくなる。
正しくはフリーズではなく、操作が極端に遅くなる。
どうも、バックアップを実行している時に、発生しやすいように思える。
真っ先に疑ったのは、やはりディスク。
ディスクに問題があれば異音が発生してそうだが、特に異音はないように思う。
非RAIDの内臓ディスクには、smartctl で S.M.A.R.T. を検査し、更に、CHKDSK で検査してみるが、問題は発見されない。
RAIDのディスクは、常時稼働している監視ツールで再確認、更にはディスクを取り外して smartctl で検査してみるが、問題は発見されない。
外付けのディスクは CHKDSK で検査してみるが、問題は発見されない。
この状態で稼働を再開すると、同じ症状に陥る。
ディスクに問題は無いようだ。
何が原因なのだ?
次に疑ったのは RAIDカード。
RAIDカードを交換し、リビルドを実行してみる。
この状態で稼働を再開すると、同じ症状に陥る。
RAIDカードに問題は無いようだ。
何が原因なのだ?
ここまでで一週間かかったが、まだ問題は解消しない。
ここまでで何回再起動をしたかわからない。
そして、ある時、再起動をかけたら起動できなくなってしまった。
Windows の起動中画面のまま進まない。
うわー、サーバの環境を壊してしまったか。ディスクのダメージが大きくなったか。
なんてこった!
しかし、セーフモードでの起動を試してみると、起動できる。
むむ、何が原因なのだ?
まてよ、この起動してこない状態、稼働中にフリーズしたようになる状況と同じじゃないか?
セーフモードはネットワーク無しで起動しているが、ネットワークありで起動すると、起動しない。
これだ! オンボードのLANインターフェースが故障したんだ!
BIOSの設定でオンボードのLANインターフェースをオフにして、Windows を起動してみる。
起動した!
オンボードのLANインターフェースを修理するのは無理だと思うので、LANカードを増設する事にする。
ストックしてある部品から、BUFFALO LGY-PCI-TXD を掘り出してきて、サーバに取り付ける。
BUFFALO のサイトからドライバをダウンロードして、インストールする。
このLANカード、かなり骨董品だと思うのだけれど、驚くべき事に、Windows 10 にも対応しているらしい。
更に、現在でも販売しているようだ。すごいな。
LGY-PCI-TXD(BUFFALO直販)
さて、ネットワークの設定をすると…
がくっ。orz
なんやねん。
WEBで検索してみると、BIOSで無効化したLANインターフェースの情報が残っていて、このエラーが発生するらしい。
追加されたネットワークは「識別されていないネットワーク」となり、使用できない。
無効化したインターフェースを削除する必要があるようなのだが、コントロールパネルの「ネットワークと共有センター」を見ても、デバイス・マネージャで見ても、無効化したインターフェースは見えない。
どうやって削除すりゃいいわけ?
更にググる。あった。
なになに、環境変数をひとつ設定した状態でデバイス・マネージャを起動し、非表示のドライバを表示すると、無効化したLANインターフェースが見えるようになって、削除ができるって?
やってみよう。
コマンドプロンプトを起動し、コマンドをふたつ入力する。
環境変数「DEVMGR_SHOW_NONPRESENT_DEVICES」を設定した状態でデバイス・マネージャを起動するところがミソだ。
SET DEVMGR_SHOW_NONPRESENT_DEVICES=1
DEVMGMT.MSC
デバイス・マネージャが起動する。
「表示」メニュー → 「非表示のデバイスの表示」をポイントすると、おー、無効化したLANインターフェースがグレー表示で見えた!
無効化したLANインターフェースを削除する。
ネットワークを再設定する。
はふぅ、無事、設定が通った。
しかし、LANカードの交換などは、普通にありそうな話なので、もう少し簡単に削除できるようにならないものなのだろうか。