AutoHealing by AutoScalingで自動復旧の仕組みを取り入れていますが、ちゃんと復旧時間を計ったことがありませんでしたので、ulimit及びFluentdのfluent-plugin-bigqueryのパラメータをいじるタイミングがありましたので、簡単に計測してみました。
ELB heath checkを予め以下で設定してあります。
タイムチャートは以下となりました。
2015 February 11 09:38 nginx stop
2015 February 11 09:40 unheathly
2015 February 11 09:40 Terminating EC2 instance – Waiting For ELB connection draining
2015 February 11 09:40 Terminating EC2 instance
2015 February 11 09:41 Launching a new EC2 instance
Connection Draingは、60秒にしています。
5分以内には復旧が見込まれる結果に。自動復旧する場合は、ELB heath checkを推奨。(EC2 heath checkだとAutoScaling発動までかなり待たされる)