株式会社エーピーコミュニケーションズ │ Technology

INSIDE APC

メニューを開く 検索する

ABOUT THIS SITE

あなたにエーピーコミュニケーションズを知ってもらうためのSiteです

2017/10/18

SRE(Site Reliability Engineering)勉強会を実施しました

このエントリーをはてなブックマークに追加

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム」の翻訳者である玉川竜司さんをお招きして、勉強会を実施しました。

SRE(Site Reliability Engineering)とは
Googleで培われたシステム管理とサービス運用の方法論である。
Infrastructure as CodeやDevOpsの広がりとともに日本でもSRE(Googleが蓄積したベストプラクティス)が普及し始めており、世界規模のサービス展開を行っている大企業やインターネット関連企業を中心に運用技術者(インフラエンジニア)からSREへの転換が加速している。
--ウィキペディアより

前半は玉川さんによるSREに関する講義。
翻訳時の裏話や日本での事例なども交えつつ、SREを支える技術や組織のあり方についてご説明いただきました。

後半は、弊社のエンジニア3名と玉川さんとのパネルディスカッション。
SLO(サービスレベル目標)の決め方や障害対応に対する考え方、これまでのインフラ運用とSREの違い、どのようにしてSREの手法を取り入れていくのか、などについて意見交換をしました。

組織論的な内容が多かったこともあり、エンジニアではない立場で聞いていても興味深い内容で、特に「英雄的な献身に頼るのではなく、組織としての仕組みづくりを重視する」や「”トイル(*1)”の撲滅」というSREの原則は、エンジニアだけではなく組織運営をよりよくしていくのにも有効な考え方だと感じました。

*1:トイル
手作業で繰り返し行われ、 自動化することが可能であり、戦術的で長期的な価値を持たず、作業量がサービスの成長に比例すると いった傾向を持つもの

このエントリーをはてなブックマークに追加