見出し画像

「巨大インフラ産業で戦うSRE」SRE NEXT 2024で登壇しました #srenext

こんにちは!@m_noriiです。

2024年8月3日(土)、4日(日)に開催された、SRE NEXT 2024 にて、
OPENLOGIのスポンサー枠で、「巨大インフラ産業で戦うSRE」というタイトルで登壇しました。
こちらの登壇については、私個人のブログでも触れているのですが
今回のOPENLOGI noteでは、登壇内容についてもう少し深堀りしていきたいと思います。


自己紹介

私は2020年1月にOPENLOGIにジョインしました。
入社当時はインフラチームの一員として、2022年4月からはこのチームをベースとしたSREチームとして
開発基盤、インフラ運用、サービス運用、セキュリティ等、組織の横断的課題の解決を行っています。

Photo by SRE NEXT Staff


登壇内容



OPENLOGIのサービスと信頼性

私は過去在籍していた会社では、ソーシャルゲームや口コミサイトの運用に関わっていました。
もちろんそれらのサービスでも信頼性は大事なのですが、OPENLOGIのサービスにおける信頼性は、異なる性質を持っています。

物流に関わるステークホルダーの中には、商品を販売するEC事業者さん、商品を入庫・保管・出庫する倉庫さん、それを配送する配送事業者さんがいます。もちろんその商品を受け取る商品を購入した方もいます。
オープンロジシステムではこの「入庫・保管・出庫」のサイクルを毎日回しているので、弊社のサービスに障害が起こってしまうと、物流が止まることになり影響範囲が大きいです。
また、配送事業者に荷物を引き渡す時間が決まっていることから、時間的制約のあるバッチ処理もあり
毎日滞りなくサービスが稼働していることがマストな要件になります。
(一方で、ソーシャルゲームのような瞬間的な波動アクセスのようなものはあまりありません)

このあたりが、私がOPENLOGIにジョインしてから、過去扱ってきたサービスとの性質の違いでギャップに当初とまどった部分でもあり、面白さを感じた部分でもありました。

ボーイスカウトからチームへ

私が入社した直後は、まだエンジニアの人数も少なかったこともあり
インフラチームはありつつも、たとえば CI/CDの整備やアラート監視・インシデント対応などは、エンジニアメンバーの中で、それぞれ得意なメンバーがボーイスカウト的に動いている状況でした。
それはまだリソースが限られていた時期の動きとしては、そうせざるを得なかったという面があります。

そこから徐々にエンジニアが増えていく中で、役割分担が明確化されSREがチームとして組成されていきました。

SREチームの取り組みの中で、個人的に感慨深かったのはデプロイ・リリースの自動化でした。
入社した当初は、長いリリース手順書に書いてある複数のコマンドを1つ1つ実行していく、ということをしていました。手動であるがゆえのミスも時々発生していました。

それが、今ではほぼ自動でデプロイ・リリースができるようになり、4年半でここまできたんだなぁと感慨深く思います。

一方で、自動化したことにより正常時はほぼミスがなくなった反面、自動化した部分がブラックボックス化してしまうという別の問題があります。何かトラブルが発生したときにその自動化スクリプトの中で何をしているかを把握している人が少なく、対処に時間がかかってしまうという(自動化あるあるだと思うのですが)ことは、解決していきたい今後の課題ですね。


SREと対話

SREチームが組織横断の課題解決に取り組む、というのは役割の性質上、他の開発チームとの連携がとても重要です。
エンジニアの人数が少なかったころは、他チームであってもある程度関係性があって(コロナ前は出社している人が多く関係値ができていた、という面もあると思います)困ったことがあってもすぐに相談できていましたが、エンジニアの数が増えチーム数も増えてくると、一種のサイロ化のような現象もでてきました。

そこで、各チームが抱えている悩み事をヒアリングする場として、1年ほど前からプロダクト開発チームとSREチームが一緒にMTG(Sync Mtg)する時間を設けています。
この取り組みにより、SREチームとして解決しなければいけない課題が新たに見えてくることもありました。

ただ、こちらの取り組みも一定効果は感じているものの、まだまだ改善したいと考えています。
例えば、はてな社のパフォーマンスワーキンググループ のようなエッセンスを取り入れたいなと思っています。


Beyond NEXT

今回のSRE NEXTのテーマは「Beyond NEXT」ということで、OPENLOGIのSREのBeyond NEXTは?についても、登壇の最後に触れました。

登壇資料だけをみると、SREやPlatform Engineeringのプラクティスがすごく整備されているように感じるかもしれませんがまだまだ発展途上です。改善を進め、事業に貢献するSREでなければいけない、と考えています。
やりたいことはたくさんあります!(伸びしろしかない!)
しかしリソースが足りていません 😓
そこで・・・


一緒に物流業界の課題解決に挑む仲間を大募集中です!

OPENLOGIでは、SREはもちろん、物流課題の根本解決に向かって一緒に挑むエンジニアを大募集中です。

私がリファラルで紹介したメンバーがOPENLOGIに入社した感想をせきららに語る記事も先日公開しています。こちらもぜひお読みください。

少しでもご興味お持ちいただけた方は
以下のURLからご希望の職種を選択の上、
カジュアル面談のお申し込みを心よりお待ちしております!