Mackerel で行った障害対応演習を紹介します

SRE

こんにちは、Mackerel チーム SRE の id:heleeen です。 この記事は、はてなの SRE が毎月交代で書いている SRE 連載の4月号で、先月分は id:taxintt さんのサービスの一般公開前からSLI/SLOと向き合うです。 今回は、先日 Mackerel チームで行った障害対応…

Amazon RDSからAuroraへ Mackerelのデータベース移行で何が改善したか

SRE

Mackerelでは2023年3月に実施したメンテナンスで、データベースをAmazon RDSからAmazon Auroraに移行しました。Auroraにするとパフォーマンスが改善し、よりリソース効率を上げられる点などのメリットがあります。移行にあたっては検証環境でパラメータの違…

Mackerelでは計画メンテナンスをどう実施しているか? RedisをElastiCacheに移行した裏側をご紹介

SRE

Mackerelでは、Amazon EC2で稼働しているRedisおよびRedis ClusterをすべてAmazon ElastiCache for Redisへ移行しました。最後の移行ではElastiCacheのオンライン移行を利用し、サービスを計画停止して実施しました。この裏側でどのように作業を進めたのかを…