sre
RedshiftのMERGE SQL commandがGAになったので、趣味人が分厚く語りたいと思います。
AWS Fargateのタスクが時々再起動する必要があることと、自動化による管理の簡素化について解説。定期的にタスクを入れ換えることで、管理上の問題を解決することができます。具体的には、Step FunctionsのAWS SDK統合を使用してシンプルなstate machineを実…
SREチーム(新卒)の市川恭佑です。Google Cloud が主催するオンライン形式のイベント Innovators Live Japan につきまして、この度、3月9日(木)開催のウェビナー「実録!SRE」の1コーナーを担当することになりました。
SREチーム(新卒)の市川恭佑です。これはカヤックSRE連載の2月号です。CircleCIからGoogle CloudにOIDCでアクセスする方法について、 前回ソースコードを紹介しましたが、今回はこれを深掘りして解説します。
SREチーム(新卒)の市川恭佑です。これはカヤックSRE連載の1月号です。 みなさんの記憶に新しいと思いますが、先日CircleCIで大きなセキュリティインシデントがありました1。 このインシデントを受けて、環境変数やContextに保存された外部サービスへの認証情…
あけましておめでとうございます。SREチーム(新卒)の市川恭佑です。 カヤック技術ブログでは本記事が2023年初エントリですが、Happy Lunar New Year!の方が違和感のない時期になってしまいました。 本年、新たにカヤックSRE連載と題した企画を始めるので、概…
SREチーム(新卒)の市川恭佑です。 2022年12月19日にprimeNumberさんとカヤックのエンジニアで合同勉強会を開催しました。 primeNumberさんとは去年の5月に開催された勉強会でご一緒しましたが、その際はオンライン形式だったのでオフラインでの開催は初めて…
誰かが設定した秘密情報の出どころがわからなくて苦労したことがある人からのお願いです。
SREチーム(新卒)の市川恭佑です。今回は、Amazon Web Services(AWS)に慣れている開発者がGoogle Cloudを用いた開発において筆者が感じた技術的なギャップについて紹介します。
前年のMackerel Advent Calendar 2021 ではSREにおいて大事なSLO/エラーバジェットをMackerelのメトリックとして投稿するツールshimesabaについて話しました。 1年経って、Mackerelを用いたSLI/SLO/エラーバジェットの運用が安定化してくると、次に気になっ…
この記事では筆者が開発しているAmazon ECSデプロイツール ecspresso (v2)と、Terraformを組み合わせて、 TerraformによるECS関連リソース作成とecspressoによるECSサービスのデプロイを一発で実行する手法について説明します。
TonamelというWebサービスにおいて負荷試験を導入した事例を紹介します。 このエントリは「先送りされがちな負荷試験の導入について心理的なハードルを下げる」ことを目的としています。
2022年11月11日に、PR TIMESさんとカヤックのエンジニアで、オンライン合同勉強会を開催しました。今回はそのレポートをお送りします。
ステージング環境はインフラ面でも本番環境と一致しているのが望ましいものの、実際にそうとは限りません。そこで今回はPoC的な段階ではありますが、Terraform管理された2つの環境の差分を自動で検出する試みについて。
カヤックが運用するサービス「まちのコイン」のアプリケーション基盤を、開発運用コスト削減のためにAmazon EKSからAmazon ECSに移行した事例を紹介します。
今回は、AWSのコンテナレジストリであるAmazon ECRから、不要になったコンテナイメージを安全に削除するツールをOSSとして作った話です。
先月の記事で紹介したエラーバジェット算出ツール『shimesaba』について、今回は実際にどのようにSLI/SLOを運用しているのか?という内容をshimesabaを使った設定例を交えつつ話します。
SLOを実践する上で、エラーバジェットはとても大事なものとなります。 そのエラーバジェットをMackerelをお使いの場合に簡単に算出できるツールshimesabaの紹介と具体的な導入方法に関する記事となります。
Webアプリケーションのステージング環境では、検証の精度を高めるために、量・質ともに本番環境に類似したデータベースが求められる局面が頻出します。本記事では、カヤックにおける、この課題への取り組みについて紹介いたします。
アジャイルでは「包括的なドキュメントよりも動くソフトウェアを」とは言うものの、ドキュメントが重要でないということはありません。コストを削減するための、また自分のためのドキュメンテーションという観点からその重要性について見ていきます。
SREチームの長田です。 5/14(土)・5/15(日)に開催される「SRE NEXT 2022」にカヤックSREチームの藤原が登壇します。 sre-next.dev 「1年間のポストモーテム運用と、そこから生まれたツールsre-advisor」というタイトルでポストモーテムの運用と、 そこから生…
カヤックではSREが関わっている社内の複数プロダクトで、ポストモーテムを2020年末から運用してきました。 社内には多数のプロダクトがあるため、エンジニアは自分が関わっているもの以外の事故や事例に疎くなりがちでした。ポストモーテムの運用を通して、…
SREチームの長田です。 3月24日(木)に行われるウェビナー「AWS で実践!Analytics Modernization ~事例祭り編~」に、 カヤックのSREチームメンバーである池田が登壇します。 pages.awscloud.com 「Amazon Redshiftを1年運用して感じた教訓とその対策方針」…
既存のリソースをterraform importする際の作業を楽にする方法として、aws-cliやgcloud-cliの出力を利用して必要な情報を自動生成する手法について紹介します。
複数のサービスを運用しているカヤックで、SREチームがどのような目標を持って活動しているのかを紹介します。
SREチームの藤原です。 このエントリは KAYAC Advent Calendar 2021 兼 Mackerel Advent Calendar 2021 の9日目の記事です。 カヤックとMackerelとわたし カヤックで運用している自社サービスやソーシャルゲームでは、サーバの監視に Mackerel を利用してい…
この記事はMackerel Advent Calendar 2021の7日目です。 こんにちは、SREチーム所属の@mashiikeです。 皆様はSLOとエラーバジェットという言葉を聞いたことはありますか? サービスの信頼性を保証することを目標するSRE(Site Reliability Engineer/Site Re…
SREチームの藤原です。KAYAC Advent Calendar 2021 4日目の記事です。 早速ですが Amazon ECS をお使いの皆様、何か新しく起動したい ECS タスクがあって、タスク定義を書き起こして(もしくはマネージメントコンソールで定義して)、一発で起動に成功できます…
SREチームの藤原です。 2021年11月4日に、PR TIMES さんとカヤックのエンジニアで、オンライン合同勉強会を開催しました。 発端 各社の勉強会文化が消滅した結果、同業者の人と知り合う機会が消滅してしまったので、新卒1,2年目の人が横の繋がりを作ることが…
SREチームの長田です。 CloudFrontでstaticなファイルを配信しようとした時に少々ハマったのでそのメモです。 TL;DR CloudFront distributionのS3 Originは、Managed Policyの Managed-AllViewer を使うと機能しない。 何をしたのか statcなファイルを配信す…