こんにちは!Narimasaです!
今回は「Amazon EC2編~3分で設定できるAuto Recovery~」と題してCloudwatchアラームを設定することでEC2のシステム障害から自動復旧できるAuto Recoveryを紹介します。
Auto Recovery
1月12日に発表されたばかりのEC2に関する新機能です。EC2インスタンスのシステムに障害が検出された際、自動的に障害のない環境で再起動させることが可能になります。インスタンスIDやIPアドレスの他、EBSボリュームの割り当て等も維持された状態で再起動される為、手動操作に比べて素早く復旧させることができます。
注意点
・1月20日現在、ノースヴァージニアリージョン内のC3,C4,M3,R3,T2のインスタンスで提供されています。(順次拡大予定)
・VPC内で稼働しているインスタンスである必要があります。(EC2-Classicインスタンスでは利用できません)
・ハードウェア専有インスタンスでは利用できません。
・EBSに基づいたインスタンスである必要があります。(インスタンスストアボリュームに基づくインスタンスでは利用できません)
・インスタンス内部で稼働しているサービスについては別途自動起動の設定が必要です。
設定してみる
利用可能なインスタンスであることを確認して、設定を行います。
EC2の管理画面から対象のインスタンスを選択し、「Monitoring」タブから「Create Alarm」をクリックします。
アラーム対象のメトリクスは「Status Check Failed (System)」となりますので、こちらを選択します。
SNSで通知を行いたい場合はSNSトピックを指定します(予め作成しておく必要があります)
作成後、「Monitoring」タブ内の「◯ of ◯ in OK」の部分をクリックし、対象アラームの「View」をクリックします。
Actionsの項目から「+EC2 Action」をクリックし、「Recover this instance」を選択します。
ちなみに「Status Check Failed (System)」以外を選択していると下記のエラーが表示されます。
以上で設定完了です。
現時点では動作テストをすることができませんが、設定自体は簡単なのでAWS環境で稼働するサーバ全てに設定しておきたいですね。
次回もお楽しみに!!