こんにちは。
株式会社ビズリーチでSREグループに所属している、今村悠人です。
ビズリーチ事業部のSREグループ(以下、SREチーム)は「ビズリーチ」サービスを担当しており、信頼性向上を通じてプロダクトの成長を支えています。
この記事では、スクラム運用で直面した課題を乗り越える中で得られた実践的な知見を、皆さまのチーム運営のヒントとしてお役立ていただけるよう詳しくご紹介します。

概要

SREチームの開発体制

私たちはスクラムの思想を取り入れた開発体制をとっています。 チームの構成は以下のとおりです。

また、1週間を1スプリントとして日々の業務を進めており、スクラムの主要なセレモニーは以下のとおりです。

SREチームで発生していた問題

SRE チームがスクラム運用を始めて 5 年目に入った頃、問題が表面化しました。
2024 年 2 月から 7 月の 6 か月間、プランニングで合意したタスクの進捗が滞り、 平均完了率は 53%、スプリントゴール達成率は 32% にとどまりました。
言い換えれば、計画したタスクの半分近くが未完了のまま終わり設定したゴールも 3 回に 1 回しか達成できていませんでした。
これらの数値が示す停滞は プロジェクト遅延 を招き、ひいては チームの士気を下げる悪循環 へと発展していきました。

原因の深堀り:「分からない」の頻発

この問題がなぜ起きているのかをレトロスペクティブの中で掘り下げました。
その結果、以下のような問題があることがわかりました。

「わからない」状態でのスプリント開始

プランニングが終わったタイミングでタスクに対する曖昧さが残ったままスプリントを開始していました。
大規模なシステムであっても、経験豊富なメンバーは蓄積した知識を元におおよその見積もりを立てられましたが、 そうでないメンバーにとっては「この修正はどうすればいいのだろうか」、「このリソースを修正することによる影響は何なのか」という疑問が解消されないままでした。
そのため作業の途中で「この先はどうすればよいのか」という疑問が生じ、その解消に時間を費やす必要がありました。このことが、全体の進捗を妨げる一因となっていました。また、それが続いたことで、気づかないうちに、経験豊富なメンバーを含めた作業品質が低下し、ひいては信頼性も損なわれていました。

これらの状況は、以下の3点にまとめられます。

こうしたことから、さまざまな対策は都度実施しつつも、 プランニングを変えることの効果が大きいと考えました。

POとDeveloperの認識のズレ

リファインメントの中で受け入れ条件を定める際、POとDeveloperの間で認識が揃っていたと思っていたものがスプリントを進めていくと実際はズレていたケースが発生していました。
これによって手戻りが頻発し、結果的にタスクが完了できない状態が続いてしまっていました。

解決策:「分からない」を徹底的に排除する

レトロスペクティブで「プランニングの改善が必要」と結論付けたのですが、具体的に何を改善したのかを紹介します。

プランニングの改善①:「あとはやるだけ」の状態を目指す

あえて明確なタイムボックスを引かず、タスクの 不確実性や属人性を潰す ことに注力しました。 タスクを構造化したうえで誰でもできる状態を目指してタスク分解を行います。具体的には以下の流れで分解をしていきます。

  1. タスクを明確化
    • タスク実施の目的を共有し、構成図やコードを見ながら修正箇所と影響範囲を洗い出します
    • この段階で少しでも「分からない」ことがあったら遠慮なく発言し、Developer全員で認識を統一します
  2. 選択肢を列挙
    • 明確になった情報を元にどのような選択肢があるかを考え、それぞれのメリット/デメリットを整理します
    • このときも構成図やコードを見て、実際の修正イメージを擦り合わせます
  3. 方針の決定・作業の細分化
    • 方針を決定し「1時間で完了できる」タスクに分割します

細分化の際はホワイトボードツールを使ってタスクに依存がないかやテスト範囲を可視化します。

プランニングでのタスクの細分化
実際に細分化したタスク。(一部画像加工しています)

プランニングの改善②:POとの認識ズレ解消

プランニングした結果、新たに選択肢が生まれた場合、POと確認し受け入れ条件の追加を行っています。 見直した結果に応じて スコープの調整やタスクの分割 をその場で行うことで、タスク実行に対する不安を極力排除するようにしています。

プランニングの改善③:1週間のガントチャートの作成

タスクのスケジュール作成
作成したガントチャート例

スプリント進行上での改善①:作成したガントチャートの見直し

以下のプロセスで遅れが見込まれる場合は現在の計画を見直しています。

スプリント進行上での改善②:継続的な改善サイクル

レトロスペクティブ では作成したガントチャートを用いて振り返りを行います。

分析結果は次のスプリントに活かせるようにストックすることで 継続的な改善サイクル を回しています

改善結果:達成率の向上

プランニングに時間をかけたことで、作業時間が減りタスク完了率が下がることを懸念していましたが、実際には完了率は 上がりました。
達成率が低迷していた2024 年 2 月〜 7 月と比較すると、その次の半年(2024 年 8 月〜2025 年 1 月)ではスプリントゴールの達成率が半年で 60% と約2倍となり、タスクの完了率も 66% と約10%増加しました。
なお、2025年2月から現時点(執筆時)の間では、スプリントゴールの達成率は 72% 、タスクの完了率は 75% を記録しており、昨年と比較しても着実に改善が進んでいることがわかります。

結果グラフ
プランニングにかける時間と達成率の推移
※補足:タスク完了率の向上はスプリントで扱うタスク量を減らした結果ではありません。過去実績に基づき最大ポイント数までタスクを積み続けており、スプリントに投入する総ポイント数に大きな変化はありません。

「分からない」をなくすことが信頼性の核心

今回のスクラム改善の取り組みは、単にタスクの完了率やスプリントゴールの達成率を向上させるだけでなくSRE本来のミッションである 「システムの信頼性向上」 にも大きく貢献しています。

「プランニングの改善」 で行ったことは、「タスクの曖昧さを解消しあとは実行するだけ」の状態を目指すことでした。
不確実性のある作業は それ自体が問題や障害の温床となります。 だからこそ、今回のように 計画段階で疑問点を一つ残らず解消し、チームの認識を完全に一致させることが極めて重要です。 こうした事前の取り組みこそが、開発中のリスクを未然に防ぎ、システムの高い可用性と信頼性を実現する鍵となるのです。

また「スプリント進行上での改善」では 特に「属人化の解消」に力を入れました。 レビューのやり方を見直したり、ペア作業を促したりすることで、チーム内での知識共有を活性化させたのです。 このおかげで、今では誰か特定のメンバーがいなくてもチーム全体で障害対応にあたれるようになり、これがシステムの信頼性を支える重要な基盤となっています。

まとめと今後の展望

私たちSRE チームは、スプリント開始前に残っていた曖昧さを洗い出し「分からない」をゼロにするプランニングへと刷新しました。
タスクを1時間で実行できる粒度に分解し、POとの認識ズレを解消していった結果、 スプリントゴール達成率は 32% から 72%、平均完了率も 53% から 75% へ大幅に向上し 、システムの信頼性も底上げされています。

今後は プランニングの質を保ちつつ、費やす時間を短縮していく ことを考えています。 具体的には以下のような取り組みがあるかと思います。

今後もチームとして試行錯誤を重ねながら「より価値のあるプランニング」ができる状態を目指していきます。

ビズリーチでは新しい仲間を募集中です。
プロダクト組織が拡大する今、信頼性向上の余地や未解決の課題は多く、まだまだ伸びしろが多いです。
私たちの挑戦や事業に少しでもワクワクした方は、ぜひ気軽に声をかけてください。一度お話ししましょう!

今村 悠人
今村 悠人

2017年新卒のエンジニアです。好きなものは、ゲーム、アニメ、漫画、カメラ、美味しいご飯、睡眠、温泉。特に、旅館にある「あのスペース」も好きです。