コース: DevOpsの基礎

今すぐコースを受講しましょう

今すぐ登録して、23,200件以上登録されている、業界エキスパート指導のコースを受講しましょう。

適切なコミュニケーションを図る

適切なコミュニケーションを図る

コース: DevOpsの基礎

適切なコミュニケーションを図る

コミュニケーションは重要な要素です。 ここでは、「非難しない事後分析」と 「透明なアップタイム」という 2つの取り組みを解説します。 どちらも、平時以上に高度な コミュニケーションスキルを必要とします。 まず、非難しない事後分析です。 顧客に影響する重大な障害の発生から、 24 時間ないし 48 時間以内に行うことで 新鮮な記憶を生かします。 全員の協力で事前にタイムラインを 作成することは効果的です。 話し合いの進行役を1人決めてください。 ただし、障害を起こした当事者に この役を負わせるのは、 気まずいので避けた方がいいでしょう。 私のチームでは、話し合いの前に、 客観的事実をできるだけ詳細に 時系列のタイムラインで 書き出してもらうようにしています。 時刻は UTC(ユーティーシー)、 協定世界時にすることを勧めます。 「社長から電話があり、 サイトがダウンしている原因を問われる」 といったヒューマンイベントと、 「500 エラーが急増する」といった モニタリングやログのイベントを 関連付けられるからです。 目的は過程の究明で、 責任の追及ではないことを伝えましょう。 事後分析の目的は、 同様の障害を再発させないことで、 非難ではないと明言しましょう。 事後分析のたびに、 全員に認識させることが重要です。 最初に、インシデントの記述に 間違いがないかを全員で確認し、 考えられる原因を話し合います。 追加、訂正、別の推測など、 自由な発言を促しましょう。 事態の収拾のために取った 対策の内容についても、全員に確認します。 ここまでで完了としたいところですが、 本当の学びはここからです。 タイムラインを見直して、 抜けている点がないかを確認し、 顧客が受けた影響についても話し合います。 そして、問題を早期に 察知するための手段を考えます。 障害は避けられないものです。 予防するための対策と同時に、 早期発見と復旧のための対策が 必要なのです。 最後は、 チケットやアクションアイテムの作成です。 内容は、モニタリングやテストの追加、 プロセスの手直しなど、さまざまです。 記録に残し、 全員で期日を約束しましょう。 以上が非難しない事後分析です。 続いて、透明なアップタイムです。 SaaS(サース)のアプリや サービスが止まれば、 ユーザーの被害は甚大です。…

目次