質問・問題
Auroraの運用において、自動スナップショットの取得が失敗した場合に検知を行いたいと考えておりますが、設定方法を教えてください。
回答・解決方法
ガイド作成時点(2023年12月25日時点)では、自動スナップショットの失敗に対してイベントIDが実装されておらず、自動スナップショットの失敗イベントを直接通知、検知する方法はございません。
間接的な方法としては、自動スナップショットの取得開始イベントと取得完了イベントの通知[1]を行い、取得開始イベントが通知されているにも関わらず取得完了イベントが通知されない場合は自動スナップショット取得が失敗したと見なす、といった運用は可能であるかと存じます。
またそもそも Aurora ではデフォルトで自動(継続的)バックアップが有効であり、仮に日次の自動スナップショット取得が失敗していた場合でも、継続的バックアップからバックアップ保持期間中の任意の時点に復旧 ( Point in Time Recovery : PiTR ) が可能です[2]。
このため、自動スナップショット取得失敗の通知、検知方法だけでなく、自動スナップショットの失敗イベントの通知が本当に必要か、PiTR で代替可能な要件ではないかも合わせてご検討いただければ幸いです。
[1] Amazon RDS のイベントカテゴリとイベントメッセージ - Amazon Aurora
DB クラスタースナップショットイベント
https://docs.aws.amazon.com/ja_jp/AmazonRDS/latest/AuroraUserGuide/USER_Events.Messages.html#USER_Events.Messages.cluster-snapshot
=====抜粋=====
バックアップ RDS-EVENT-0168 自動クラスタースナップショットを作成しています。
バックアップ RDS-EVENT-0169 自動クラスタースナップショットが作成されました。
=====抜粋=====
[2] Aurora DB クラスターのバックアップと復元の概要 - Amazon Aurora
https://docs.aws.amazon.com/ja_jp/AmazonRDS/latest/AuroraUserGuide/Aurora.Managing.Backups.html
=====抜粋=====
Aurora は、クラスターボリュームを自動的にバックアップし、バックアップ保持期間中、復元データを保持します。Aurora の自動バックアップは連続的かつ増分的であるため、バックアップ保持期間内の任意の時点にすばやく復元できます。
=====抜粋=====