こんにちは。SREの @kazeburo です。8月17日に株式会社ハートビーツ様が主催する「hbstudy#75」において、メルカリSREの取り組みについての発表をしてきましたので、資料を公開します。
hbstudyでは、SRE大全というテーマで、#74において先日発売となりました「SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム」の翻訳者の発表があり、また#76にてXFLAG スタジオのSREによる発表が予定されています。
発表内容
トークの時間が2時間ありましたので、前半、後半にわけて資料を作成しました。内容も多く盛り込んでおります。
- メルカリがSREを採用した理由
- メルカリSREチームの紹介
- OnCall/運用当番について
- 先日のCDN変更での個人情報漏洩について
- PHPアプリケーションの最適化
- セキュリティの取り組み(パスワードリスト攻撃対策事例)
- メルカリSREの今後
資料はこちらからも参照できます。
前半
後半
質問も多くいただきました。多かったのはSREの採用と評価についてだったと思われます。メルカリSREでは、ソフトウェアエンジニアに加えて、OS、ネットワーク、ハードウェア、RDBMS、Microservice、自動化など幅広い領域のエンジニアを募集しています。様々な知識、洞察力を生かすことで信頼性の高いサービスを支えていきます。
また、評価において障害の発生が影響することがあるかとの質問もいただきましたが、直接的に影響することはない、影響すべきではありません。発生した障害について正しい認識をし、同じような障害が起きない仕組み、自律的なシステムをソフトウェアエンジニアリングをもって作り上げることが評価されると考えております。
メルカリSREの取り組みに興味のある方は、ぜひ連絡をください。話を聞きたいという方もよろしくお願いします。