はてなで働くエンジニアにアンケートシリーズ第26回は、MackerelチームのSRE、id:heleeenに話を聞きました。
- 夢中になれるサービスの開発にしっかり参加してみたい
- Mackerelを普段から運用することがサービス改善のきっかけに
- リモートワークのコミュニケーションへ些細なことでも持ち込めるように
- SLIの再編であるべきSLI/SLOの姿に近づけられた
- 現状を改善したい気持ちを常に持つ
- 社内に限らず「他者へのリスペクト」が強い人が多い
夢中になれるサービスの開発にしっかり参加してみたい
── Q1. はてなidとその由来を教えてください
id:heleeen です。旧姓を言い間違えられたことからついた呼び名をidにも使っています。ぱっと見で読みづらいのですが、これで「ヘレン」と読みます。ちなみに日本人です。
── Q2. いつどんなきっかけで入社されましたか?
前職の同僚のエンジニアが、同僚自身がヘビーユーザーかつ好きなサービスの開発に携わっていることに誇りを持ち、また自分の思いとプロダクトの方向性の違いに葛藤しながらも幸せそうに働いている姿を、隣で見ていました。
私はその時、その同僚の関わるサービスも含めて社内のいくつかのサービスを運用するSREだったのですが、自分が継続的なユーザーであり好きなサービスと言えるものには関わりがなく、その同僚のように自分が夢中になれるサービスの開発にしっかりと参加してみたい気持ちを持ち始めていました。
また、前職には新卒で入社しており、他の会社でも働いてみたいと感じ始めた頃に、以前からMackerelを通して関わりのあった id:missasan さんからお声がけいただきました。CREとしてお誘いをいただいたのですが、キャリアとしてはまだしばらくはSREでありたいと思い、SREとして入社しました。
Mackerelを普段から運用することがサービス改善のきっかけに
── Q3. 現在の仕事を教えてください
Embedded SREとしてMackerelの運用に携わっています。具体的には、SLI/SLOの策定から実装と運用、監視運用、CI/CDの構築や改善、クラウド運用などを主に行っています。
MackerelはSREのためのサービスでもあるので、Mackerelユーザーとしてチーム内で機能開発のためのヒアリングを受けたり、インターンの開発テーマや新機能を考えたりすることもあります。日頃Mackerelを利用してシステムを運用することがドッグフーディングとなり、サービス改善のきっかけにもなるのが面白いところですね。
── Q. チーム内の立ち位置を教えてください
今のMackerel開発チームには、OpenTelemetry対応のような特定の機能開発を行うチームと、SREなど職能で分かれたチームが混在しています。私はそのSREチームの一員として活動しているのですが、SREが関わったほうがよさそうと感じた機能開発のチームにも参画しています。
SREとして日々のタスクをこなしつつ、SREテックリードとして中長期的な計画や見通しについて思いをはせていることも多いです。
Mackerel開発チームの中でいくつかのチームに分かれていることによって情報の分断や他のチームとの距離ができてしまうことに対する懸念があったので、スプリントごとにSREからの情報共有をテキストで行ったりもしています。最近は気分が乗ればポエムも書いていて、反応をもらえることも多くてうれしいです。
リモートワークのコミュニケーションへ些細なことでも持ち込めるように
── Q. 1日の仕事の流れを教えてください
およそ11時ごろに活動を始めて20時ごろに退勤しています。午前の機能開発チームとのデイリースクラム、午後のMackerel開発チーム全体でのデイリースクラムとSREチームの会話の時間が固定された予定です。
日によっては他のスクラムイベント、1on1、ポストモーテム読書会、社内勉強会、全社横断組織での作業を行う時間などが入ります。それらの会議の合間にコードレビューやタスクを進めています。
SREの会話の時間では各個人のタスクの状況の確認や共有も行っているのですが、どちらかというと日常の困りごとの相談や雑談を主な目的としています。リモートワークでのコミュニケーションのハードルを下げるために、些細なことでも持ち込める場を確保しておく狙いがあります。
SLIの再編であるべきSLI/SLOの姿に近づけられた
── Q. 最近うまくいったことは何ですか?
Mackerelでは2019年にSLI/SLOの運用を始めました。それから4年ほどたち、現在のSLIが本当にユーザー体験を計測できているか疑問に感じたため、クリティカルユーザージャーニーという手法を用いて再編しました。
実装は今進めているところなのですが、よりユーザーの感覚に近い定義ができ、あるべきSLI/SLOの姿に近づけられました。他のSLI/SLOも同様の手法を用いて検討される流れができたのがよかったです。
SLIの再編の詳細については、2023年12月に開催した「Mackerel Meetup #15 Tokyo」で発表しました。
speakerdeck.com
【開催レポート】チームとコミュニティで監視を育てる 〜Mackerel Meetup #15 Tokyoを開催しました! - Mackerel お知らせ #mackerelio
── Q. 最近うまくいっていないと感じることは何ですか?
人材育成について思い悩むことがあります。例えば、新しく加わったSREがどうすれば自立して仕事やアラート調査ができるようになるか、SREだけではなくアプリケーションエンジニアも含めて、障害発生時の対応をどのように会得してもらうかなどがあります。自分がいつの間にかできるようになっていたことを他人ができるようにするって難しいですね……。
ドキュメントを充実させたり、講習を行ったりといった施策も実施しているのですが、自動化や仕組み化して人間が自然と導かれる形にできれば一番いいなと思っています。
現状を改善したい気持ちを常に持つ
── Q. 普段大切にしていることは何ですか?
現状に甘んじることなく変わり続けることです。
かつてMackerelでは、リリース作業の負担の重さなどを理由に本番リリースを週2回行っていたのですが、リリースフローを変更して負担を減らすことで毎日リリースを行うようにしました。フローを変えるだけではなく頻度も上げたのは、それだけでは開発者にもユーザーにも体験の変化が弱いと感じていたためです。
毎日リリースを行えるほどにサービスの安定性が高いのでできたことではありますが、次に本番リリースがいつあるかを意識しなくてよくなったという気持ちの変化も起きました。飽き性でめんどくさがりというのも影響しているかもしれないですね。
これはうまくいった例であり、残念ながら多忙で手が回りきらないところもあって歯がゆい思いもしているのですが……現状を改善したい気持ちは常に持っています。
社内に限らず「他者へのリスペクト」が強い人が多い
── Q. はてなはどんな会社ですか?
社内の人々だけではなく、社外の開発者やお客さまに対するものも含めて、他者へのリスペクトが強い人が多いと感じています。
例えば何かの課題に対して提案があったときに、背景や目的も含めてしっかりと耳を傾けて理解しようとし、もし仮に提示された計画があまり適さないものであった場合は、よりよい改善策があるかをお互い納得できるまでディスカッションする様子もあります。
他にも、チームでは採用していない技術や個人的な目標に真剣に取り組んでいる人を影から応援したり見守ったりしているのも、相手の意志を重んじていることが背景にあると考えています。
デイリースクラムでの提案やふとした思いつきを日常的に言えているのは、そういった他人を無下にしない環境の影響もありそうですね。そういう面で、開発者にとっての居心地の良さのレベルがとても高いと思っています。
はてなのSREは、サービス開発の中で、システムの設計から構築、運用をリードし、サービスの信頼性と開発速度を両立する仕事です。サービスに求められる信頼性を定義し、チームでサービスを運用していく中での道標となる仲間を募集しています。ご連絡をお待ちしております!
▼ SRE(Site Reliability Engineer)職 転職・中途 - 採用情報
▼ SRE(Site Reliability Engineer)職の新卒採用 - 採用情報