VMware ESX サーバーのコンソール ボリュームが読み取り専用になりました。VM を保存するにはどうすればよいですか?
質問
2 つの RAID ボリューム、VMware カーネル/コンソールは RAID1 上で実行され、vmdks は RAID5 上に存在します。コンソールでログインを入力すると、SCSI エラーが発生するだけで、パスワードのプロンプトは表示されません。賞賛に値しますが、VM は実際にはまだ実行されています。ただし、再起動するとカーネルが再起動せず、VM がダウンする可能性があると考えています。
VM のデータベースとディスクのバックアップはありますが、vmdk 自体のバックアップはありません。
私の選択肢は何ですか?
私たちの現時点での最善のアイデアは、
- VMware Converter を使用して、P2V 移行であるかのように、実行中の VM からライブ vmdk を作成します。
- ホストサーバーを再起動し、RAID 診断を実行し、「h」で何が起こったのかを確認します。
- おそらく RAID ボリュームを再構築した後、ESX を再度起動してみます。
- 場合によっては、ボリュームに ESX を再インストールし、VM を再接続する必要がある
- これが機能しない場合は、手順 1 で作成した「ライブ」vmdk を別の VM ホストに接続します。
解決
それはバックプレーンでした。RAID1 の両方のドライブと RAID5 の 1 つのドライブにアクセスできませんでした。信じられないことに、VMware ハイパーバイザーは 3 日間、ホスト ディスクにアクセスせずにメモリから実行し続け、管理している VM を稼働させ続けました。
上記のステップ 3 で、ハードウェアの問題を診断し、RAID コントローラー、ケーブル、バックプレーンを交換しました。再起動後、ドライブの構成をクエリするようにコントローラーに指示して、RAID を再初期化しました。両方とも劣化していましたが、両方とも正常に修復されました。
ステップ 4 では、ESX を再インストールする必要はありませんでした。ただし、起動時には VM を登録しませんでした。VM を再署名するようにカーネルに指示するには、埋もれている管理要素を掘り出す必要がありました。(VM ドキュメントで「再署名」を検索してください。)
私たちのフォールバック計画は機能したと思います。「孤立」して実行されていた VM の VMware Converter イメージはテストされ、データ損失なく正常に実行されました。できるだけ多くのサービスをシャットダウンし、VM を可能な限り読み取り専用状態にした後、この状態になった VM に対して VMware Converter イメージングを実行することを強くお勧めします。修復として vmdk を別の場所または元のホストにロードすることは、通常、バックアップを使用してサーバーを最初から再構築するよりもはるかに高速です。