はてなのサイト信頼性エンジニアリング(SRE)

はてなでSRE(Site Reliability Engineering)に取り組むエンジニアや、取り組んでいる事例についての記事カテゴリーです。

はてなでは、サービス開発の道標となるSREの仲間を募集しています。

SRE(Site Reliability Engineer)職 転職・中途 - 採用情報
SRE(Site Reliability Engineer)職の新卒採用 - 採用情報

サービスの一般公開前からSLI/SLOと向き合う

SRE

Mackerel チームで SRE を担当している id:taxintt と申します。 はてなの SRE が毎月交代でブログ記事を書く Hatena Developer Blog の SRE 連載、3月分は私が担当します。2月の記事は id:masayosu さんの はてなにおけるEKSの運用と自動化 (2024年版) でし…

はてなにおけるEKSの運用と自動化 (2024年版)

SRE

サービスプラットフォームチームで SRE を担当している id:masayosu です。 先月からですが Hatena Developer Blog にて SRE 連載を始めました。先月の記事は はてなブログの DB を RDS for MySQL 8.0 にアップグレードした話 - Hatena Developer Blog です…

自分が夢中になれるサービスの開発に関わりたいと思った | はてなで働く heleeen にアンケート [#26]

はてなで働くエンジニアにアンケートシリーズ第26回は、MackerelチームのSRE、id:heleeenです。SREとしての働き方、リモートワーク下のコミュニケーションなどについて聞きました。

はてなブログの DB を RDS for MySQL 8.0 にアップグレードした話

SRE

この記事は、はてなエンジニア Advent Calendar 2023の2024年1月17日の記事です。 はてなエンジニア Advent Calendar 2023 - Hatena Developer Blog id:hagihala です。先日、はてなブログの DB を RDS for MySQL 5.7 から 8.0 へアップグレードしたので、工…

はてなブックマークのステージング環境を支える技術

SRE

id:cohalzです。この記事ははてなエンジニア Advent Calendar 2023 の29日目の記事です。 28日目の記事は id:SlashNephy さんの おうち Kubernetes クラスタ運用記 ~2023~ でした。 はてなブックマークにおけるステージング環境について紹介します。 はてな…

はてなのポッドキャスト Backyard Hatena #30 - Embedded SREと福岡(id:cohalz) #byhatena

はてな「技術グループ」によるポッドキャスト「Backyard Hatena」を更新。第30回ではSREの id:cohalz を迎えて、はてなのSREの仕事についてや、福岡からのリモートワークについてお話を聞きました。

Fluent Bitでアクセスログをステータスコードやレスポンスタイムでフィルタリングする

SRE

こんにちは id:cohalz です。はてなブックマークのチームではWebアプリケーションのアクセスログを取るためにnginxを入れてCloudWatch Logsに送り、障害時などにCloudWatch Logs Insightsを使って分析を行うというフローが主流となっています。 しかし全リク…

SRE座談会を公開しました

SRE

はてなの採用サイトにて、SRE(Site Reliability Engineer)座談会を公開しました。今回の座談会では、id:masayosu、id:taxintt、id:cohalz、id:motemen の4人で、はてなのSREがチームを横断して行っている活動について話しました。影響範囲を所属するチーム…

Amazon RDSからAuroraへ Mackerelのデータベース移行で何が改善したか

SRE

Mackerelでは2023年3月に実施したメンテナンスで、データベースをAmazon RDSからAmazon Auroraに移行しました。Auroraにするとパフォーマンスが改善し、よりリソース効率を上げられる点などのメリットがあります。移行にあたっては検証環境でパラメータの違…

はてなブックマークで利用しているCloudFrontのAWSアカウントを移行した

SRE

こんにちは、id:cohalzです。2023年4月に実施したはてなブックマークのメンテナンスではCloudFrontを別のAWSアカウントに移行しました。 この記事ではCloudFrontを別のAWSアカウントに移行した背景とどのように移行したのかを説明します。 はてなブックマー…

はてなブログをECSに移行してリリース頻度も改善した話

SRE

この記事ははてなエンジニア Advent Calendar 2022の26日目のエントリです。 こんにちは id:cohalz です。はてなブログでは2022年7月にインフラをAmazon EC2からAWS ECS(AWS Fargate)に移行するプロジェクトが完了しました。 プロジェクトは2021年9月から始…

はてなのポッドキャスト Backyard Hatena #15 - はてなブログのECS化と爬虫類(id:dekokun) #byhatena

はてな「技術グループ」によるポッドキャスト「Backyard Hatena」を更新。第15回では、はてなブログチーム SRE の id:dekokunに、はてなブログのECS化について話を聞きました。

Kubernetesのadmission webhookでMackerelの監視を便利にしたい

はてなで、有志で集ったメンバー普段の開発から離れ、テーマを決めて集中して取り組む開発合宿というイベントで、サーバー管理・監視サービスMackerelによるコンテナ監視で必須になるmackerel-container-agentというプログラムを題材に、Kubernetesのadmissi…

AWS Control Tower の Landing Zone v3.0 の更新内容を読み解く

SRE

AWS Control Tower の Landing Zone version 3.0 について更新内容を読み解いて注意点などをまとめました。

Hatena Engineer Seminar #20「AWS Renovation 編」をオンラインで開催しました #hatenatech

2022年6月7日(火曜日)に開催した Hatena Engineer Seminar #20 「AWS Renovation 編」のレポートです。はてなのSRE 4名が登壇し、Amazon Web Services 上におけるそれぞれの取り組みについて紹介しました。トークの発表資料と動画アーカイブを掲載していま…

kubernetesをキャッチアップし、知識を蓄積していく | はてなで働く masayosu にアンケート [#20]

はてなで働くエンジニアにアンケートシリーズ第20回は、サービスプラットフォームチームのSRE、id:masayosuです。SREとしての働き方やkubernetesに関わる取り組みなどについて聞きました。

Hatena Engineer Seminar #20 「AWS Renovation 編」を6月7日にオンライン開催します #hatenatech

2022年6月7日(火)に Hatena Enegineer Seminar #20 「AWS Renovation 編」を開催します。はてなのSRE 4名が登壇し、Amazon Web Services 上におけるそれぞれの取り組みについてご紹介します。申し込み方法は connpass のイベントページをご確認ください。…

はてなのポッドキャスト Backyard Hatena #9 - id:masayoshi に聞くはてなのSRE組織を配信中です #byhatena

はてな「技術グループ」によるポッドキャスト「Backyard Hatena」を更新。第9回ではSREのid:masayoshiと、はてなのSREについてやSRE会の活動、採用などについて話しました。

【追記あり】 2023年新卒エンジニア向けに、はてなオンライン会社説明会 を実施します!

SRE

株式会社はてなでは、2023年卒業予定の方に向けて、オンラインでの会社説明会を実施します。初回は2022年2月21日(月)で、2月〜3月に複数回開催予定。現在決まっている日程と開催URLはこの記事に記載した通りです(今後の開催URLや日程の追加があればこの記…

「はてラボ」のサービスも利用しているEKSクラスタの構成と運用について

SRE

プラットフォームチームでは、はてラボの「はてなアンテナ」「はてな匿名ダイアリー」など大小さまざまな30近いサービスを、Amazon EKS(Elastic Kubernetes Service)上でマルチテナントなクラスタとして運用しています。EKSの構成上の工夫や、維持する運営…

はてなの技術組織2021

これは、はてなアドベントカレンダーの25日目の記事です。昨日は id:nabeop による Hatena Developer Blog 編集部の活動の紹介 でした。 こんにちは。CTO の id:motemen です。CTO としては、はてなにおけるエンジニア組織全体を見ています。この機会に、は…

バッチ処理における冪等性の検討 ─ クラウドネイティブもしくは、はてなダイアリーの自動移行を題材に

SRE

はてなエンジニア有志によるCloudNative推進会における「クラウドネイティブなバッチ処理」の議論も踏まえつつ、はてなダイアリーにサービス終了にともないはてなブログに自動移行した際のバッチ処理で、どのように冪等性を考えて実装したのかを説明します。

Amazon ECSのログストリームを見やすく階層的に整理できるawslogs設定

SRE

Amazon ECSでコンテナを動かすとき、ログドライバーとしてawslogsを利用してAmazon CloudWatch Logsにログを出力する際に、awslogs-stream-prefixパラメータには何を設定するとよいかについて考察します。

Google Cloud の IAM で、開発体制や組織の文化に合わせて検討したこと

SRE

はてなでも、サービスごとに技術選択の多様化が進み「Google Cloud 上でサービスを構築する」という選択肢も十分ありえる状態になってきました。性質の異なる複数のサービスを複数の開発チームが展開する際に、開発速度を落とさず安心して Google Cloud を利…

【追記あり】 2月〜3月に、はてな2022年新卒エンジニア向け オンライン会社説明会 を実施します!

SRE

株式会社はてなでは、2022年卒の方に向けた新卒採用のオンライン説明会を開催します。初回は、2021年2月5日(金)12時(正午)から。3月にかけて複数回開催予定です。ご参加お待ちしています。

異常なオープンネス文化が特徴的 | はてなで働く nabeop にアンケート [#11]

はてなで働くエンジニアにアンケートシリーズ第11回は、システムプラットフォーム部のSRE・id:nabeopです。入社したきっかけや現在の仕事内容などについて話を聞きました。

2022年度 新卒採用を開始しました!

SRE

本日、2022年度新卒採用を開始しました。2022年度新卒採用は以下の4職種で採用を行います。 Webアプリケーションエンジニア iOS、Androidアプリエンジニア SRE デザイナー 京都・東京の両拠点での積極採用を行っています。皆さまのご応募をお待ちしています…

Mackerelでは計画メンテナンスをどう実施しているか? RedisをElastiCacheに移行した裏側をご紹介

SRE

Mackerelでは、Amazon EC2で稼働しているRedisおよびRedis ClusterをすべてAmazon ElastiCache for Redisへ移行しました。最後の移行ではElastiCacheのオンライン移行を利用し、サービスを計画停止して実施しました。この裏側でどのように作業を進めたのかを…

SREはインフラ担当だけでなくチーム全体で取り組んでいくもの | はてなで働く cohalz にアンケート [#9]

Hatena Developer Blogの「はてなで働くエンジニアにアンケート」シリーズ、今回ははてなブログチームのSRE、id:cohalzに話を聞きました。

頑張らなくていいチームだからこそ自分の強みを増やしていきたい | はてなで働く do-su-0805 にアンケート [#8]

Hatena Developer Blogの「はてなで働くエンジニアにアンケート」シリーズ、今回はシステムプラットフォーム部のSREであるid:do-su-0805に話を聞きました。

はてなブログのキャッシュ周りをきちんと改善したら、アプリケーションサーバの台数を半分にできた話

SRE

はてなブログでは2019年12月から、Varnishを中心としたキャッシュ周りのさまざまな改善を進めてきました。その結果、ブログ記事のキャッシュヒット率が1日平均で8%から58%に向上したり、アプリケーションサーバの台数が以前の半数以下に削減できたりといっ…

「マンガが快適に読める」を数値化し、SLOをマンガビューワに導入するまで

SRE

Webマンガサイトで利用される「GigaViewer」のチームでは、開発速度と信頼性のバランスをとるためSLO(Service Level Objective)を策定しました。マンガビューワで必要な「マンガが快適に読める」などのサービスレベルをどのようにSLI(Service Level Indic…

AWS と GCP を VPN でつないでみたら、マルチクラウドの夢が広がった話

社内の開発合宿で AWS と GCP を VPN で接続して、実運用に載せた場合の課題や構成を検討しました

AWS re:Invent 2019に今回も行ってきました

SRE

はてなでSREをしている id:dekokun とアプリケーションエンジニアをしているid:astj です。 先日(というには少し日が空いてしまいましたが…)ラスベガスで行われた AWS re:Invent 2019 に、はてなから私たち2名が参加してきました。これで、はてなとしては3…

Hatena Engineer Seminar #13 を開催しました #hatenatech

こんにちは!Web アプリケーションエンジニアの id:KGA です。2/5(水)に Hatena Engineer Seminar #13 を開催いたしました。新型コロナウイルス感染症に関する対応の一環として YouTube Live でのライブ配信を予定しておりましたが、配信トラブルにより実施…

Hatena Engineer Seminar #13 を2月5日(水)に開催します!(2020年1月31日、2020年2月4日 追記)

こんにちは、Webアプリケーションエンジニアの id:KGA です。「Hatena Engineer Seminar #13」を、2月5日(水)にはてな東京オフィス SHIBAFU にて開催します!今回は はてな で働く若手エンジニアがどういう仕事をしているか、実際の内容やその仕事をする上で…

はてなエンジニア Advent Calendar 2019完走しました!

こんにちは! id:yutailang0119 です。 今年も1日も落とすことなく、大幅な遅れもなく? *1 無事 はてなエンジニアAdvent Calendar を完走することができました! 去年のまとめエントリー developer.hatenastaff.com 表彰 最多ブックマーク賞 今年の最多ブッ…

はてなエンジニア採用サイト公開+2021年度 新卒採用を開始しました!

SRE

本日、エンジニア専用の採用サイトをオープンいたしました。 はてなで働くエンジニアの情報を少しでもお届けできればと思っています。hatenacorp.jpCTOからのメッセージや技術スタックなどの情報も掲載していますので、採用情報に興味がない方も是非ご覧にな…

AWS Transit Gateway はじめました

SRE

AWS Classic VPN の終了にあたり TGW を使った構成に変更しました。その時の手順や検証で得られた知見をブログエントリとしてまとめました。

Mackerelで開発した時系列データベースについての論文がIEEEの国際会議「COMPSAC 2019」で発表されました

SRE

Mackerel チームのWebアプリケーションエンジニア id:astj です。さくらインターネットさんのプレスリリースにある通り、はてなのMackerelチームより、私 id:astjと、同じくWebアプリケーションエンジニアの id:itchynyも執筆に参加した論文「HeteroTSDB: An…

AWS Cloud Development Kit -CDK- Meetupではてなから新サービス事例などを紹介します

SRE

京都市中京区から参りました。アプリケーションエンジニア、id:aerealです。来たる7月18日にAWS Loft Tokyoで開催されるAWS Cloud Development Kit -CDK- Meetupで、SREのid:cohalzとわたくしid:aerealがはてなにおけるAWS CDK活用事例についてお話しさせて…

一歩引いて、自分自身や取り組む問題を俯瞰する | はてなで働く hayajo_77 にアンケート [#5]

こんにちは、id:hitode909です。前回のCRE編にひきつづき、同じくMackerelチームのSREとして働かれている、id:hayajo_77さんにお話を伺います。 エンジニアHubのコンテナ技術入門記事やコンテナエージェントの開発など、専門性を生かして活躍されてるのでお…

はてなでのKubernetes利用の取組み

SRE

こんにちは、入社 3 年目の SRE の id:kizkoh です。今年から別のチームに異動になったのですが、以前は Mackerel チームで仕事をしていました。このエントリでご紹介するのは私が以前担当していた Mackerel での Kubernetes(k8s) クラスタ利用の取組みにな…

自動でMackerelの監視設定をGitHub上に管理する

SRE

こんにちは,SREのid:cohalzです. Mackerelの監視設定をバックアップするため,またはどんな変更があったのか把握するために,自動でGitHubリポジトリに管理するものを作りました. 監視設定を変更すると,自動で以下のような変更が即座にGitHubにも反映さ…

技術に対して偏見や先入観を持たない | はてなで働く taketo957 にアンケート [#3]

こんにちは、hitode909です。SRE(Site Reliability Engineer)は読んで字の如くサイトの信頼性を高める職業で、サーバーの運用にとどまらず、サービスの信頼性に対して工学的にアプローチする職種です。今回は、新卒入社のSRE、taketo957にお話を聞いてみま…

社内で LVS 勉強会を開催しました

SRE

システムプラットフォーム部で SRE をやっています id:nabeop です。 以前ご紹介した通り、はてなでは定期的に勉強会を実施していますが、この勉強会とは別枠で LVS の勉強会を突発で開催しました。 speakerdeck.com きっかけ はてなでの LVS/keepalived の…

はてな 2020年度 新卒採用サイトを公開しました!

SRE

本日、はてな2020年度新卒採用サイトを公開しました。hatenacorp.jp2020年度新卒採用は以下の4職種で採用を行います。 Webアプリケーションエンジニア iOS、Androidアプリエンジニア SRE デザイナー 京都・東京の両拠点での積極採用を行っています。皆さまの…

re:Invent2018に行ってきました

はてなでSREをしている id:hokkai7go です。この記事は はてなエンジニア Advent Calendar 2018 - Qiita の19日目の記事です。 個人的には初めてで、はてなとしては2年連続3回目のre:Invent参加となりました。このブログではre:Inventというイベントがどのよ…

hatena.ne.jp ドメインのゾーンを AWS Route 53 に引っ越した話

こんにちわ、株式会社はてなのシステムプラットフォーム部で SRE をやっている id:nabeop です。この記事ははてなエンジニア Advent Calendar 2018 の14日目の記事です。昨日は id:Pasta-K でした。 今日は hatena.ne.jp ドメインのゾーンを AWS Route 53 に…

Let's Encrypt 証明書の自動更新システムを作る

この記事は はてなエンジニア Advent Calendar 2018 11日目の記事です. こんにちは,システムプラットフォーム部でSREをしているid:cohalzです. はてなでは証明書を自動更新してくれる仕組みを作っており,今回はその紹介をします. はてなの証明書自動更…