Amazon EC2編~3分で設定できるAuto Recovery

こんにちは!Narimasaです!

今回は「Amazon EC2編~3分で設定できるAuto Recovery~」と題してCloudwatchアラームを設定することでEC2のシステム障害から自動復旧できるAuto Recoveryを紹介します。

Auto Recovery

1月12日に発表されたばかりのEC2に関する新機能です。EC2インスタンスのシステムに障害が検出された際、自動的に障害のない環境で再起動させることが可能になります。インスタンスIDやIPアドレスの他、EBSボリュームの割り当て等も維持された状態で再起動される為、手動操作に比べて素早く復旧させることができます。

注意点

・1月20日現在、ノースヴァージニアリージョン内のC3,C4,M3,R3,T2のインスタンスで提供されています。(順次拡大予定)
・VPC内で稼働しているインスタンスである必要があります。(EC2-Classicインスタンスでは利用できません)
・ハードウェア専有インスタンスでは利用できません。
・EBSに基づいたインスタンスである必要があります。(インスタンスストアボリュームに基づくインスタンスでは利用できません)
・インスタンス内部で稼働しているサービスについては別途自動起動の設定が必要です。

設定してみる

利用可能なインスタンスであることを確認して、設定を行います。

EC2の管理画面から対象のインスタンスを選択し、「Monitoring」タブから「Create Alarm」をクリックします。

console

アラーム対象のメトリクスは「Status Check Failed (System)」となりますので、こちらを選択します。
SNSで通知を行いたい場合はSNSトピックを指定します(予め作成しておく必要があります)
Create Alarm

作成後、「Monitoring」タブ内の「◯ of ◯ in OK」の部分をクリックし、対象アラームの「View」をクリックします。
view

「Modify」をクリックします。
Modify

Actionsの項目から「+EC2 Action」をクリックし、「Recover this instance」を選択します。
Action

ちなみに「Status Check Failed (System)」以外を選択していると下記のエラーが表示されます。
error

以上で設定完了です。
現時点では動作テストをすることができませんが、設定自体は簡単なのでAWS環境で稼働するサーバ全てに設定しておきたいですね。

次回もお楽しみに!!

この記事を書いた人

aws-recipe-user