sre_og-1200x630

今後活躍するのはSRE!大規模システムに欠かせない新しいタイプのエンジニア像

システム開発に関わるすべての人は、広くはエンジニアということになりますが、分類すると、もっと細かく分けることができます。アプリケーションエンジニアやデータベースエンジニア、セキュリティエンジニア、ネットワークエンジニアなど多様に存在しますが、最近新たに加わった新しいエンジニア像があります。それがサイト信頼性エンジニア、略してSRE(Site Reliability Engineering)です。

  • 大規模システムほどサイト信頼性に問題が生じる
  • SREには総合的なシステム開発能力、システム稼働に対する責任感、自動化を推進する能力が求められる
  • SREは優秀な人材しかなれず、オールラウンドプレイヤー的な働き方が求められる
  • 自社システムを持つ企業はSRE設置に積極的でこの流れは今後も続く

規模が大きくなるほど顕在化するサイト信頼性

立ち上げ段階のシステムは、ユーザーが少ないためサーバーにかかる負荷も少なく、システム構造も最初はシンプル作りです。そのため正常に動作し、サーバーレスポンスも早いですが、徐々にユーザーが増えて機能追加も行っていくにつれ、サーバーレスポンスが遅くなったり、システム不良が生じたりします。
今までは1秒ほどでレスポンスがあったのに、5秒になってしまう、サイトが接続できなくなってしまう、ハードウェアを増設したがうまく機能していないなどシステム上の問題が続々と発生し始めます。ユーザー数は多いシステムなので常に誰かが利用しており、問題対応は急務です。モタモタしていると、サイトの接続不良にイライラしたユーザーは二度と訪問してくれなくなるかもしれません。

規模が大きくなったシステムはユーザーに受け入れられている証なので、あとはそれをどのように正常に動作し続け、さらに優れたシステムとなるように改善していくことが重要となります。このように大規模となったシステム信頼性は重要な課題となって企業に重くのしかかります。

sre_00

SREというポジションと役割

システムが大規模になったことで生じる問題に対処し、サイトを維持・運営、さらに成長させるために必要なエンジニアがSREです。このSREと呼ばれるエンジニア像はアメリカのグーグル社が作ったと言われています。
グーグルは言わずと知れたITのトップ企業であり、検索エンジン「グーグル」は世界中で何億人もの人が利用するサイトです。当然サーバーにかかる負荷は一般企業のそれを大きく凌駕している点も鑑みると、グーグルからSREが誕生したのも納得できます。SREに必要となる能力は次のようになっています。

参考:http://itpro.nikkeibp.co.jp/atcl/column/14/346926/030600869/

総合的なシステム開発能力

システムは、サーバー、ネットワーク、プログラムなど様々な技術が絡み合って構築されます。すべての分野を1人のエンジニアでは担えないため、それぞれ専門エンジニアが存在し、それぞれのプロフェッショナルが集まってシステム開発は行われます。
とは言うもののプロフェッショナルの意見を聞いて、内容を理解し、指示を与えるエンジニアも必要となります。指示するためにはすべての知識を知っておかねばなりません。
つまり、広い知識を持ったエンジニアが必要です。システム不良の原因を突き止めて、サーバーを増設すべきか、プログラムをいじるべきか、判断するためには総合的なシステム開発技術に精通している必要があります。

sre_01

システム稼働に対する責任感

もはや生活の一部となっているようなシステムであれば、システム不良が起こるとユーザーの生活にも悪影響を及ぼします。そのためSREは、システム稼働に対する責任感を持っていなければなりません。システムを止めないという責任感です。
また一方でどれだけ注意していても、システムには絶対と言っていいほど障害が発生します。障害が発生した時のプレッシャーはかなりのものです。
SREにはそのような障害が発生したときにでも逃げ出さずに冷静な目を持ってシステムを稼働させるというメンタル要素も必要となります。

ベースはプロジェクトマネージャーだが、自動化に重点を置く

SREの条件として、総合的なシステム開発能力と稼働に対する責任感と聞くと、いわゆるプロジェクトマネージャー業と何ら変わらないように思えてしまうかもしれません。たしかにSREは既存のプロジェクトマネージャー業務と似ていますし、重複する所も多々あります。
しかし大きく異なる点はシステムをさらに成長させる、特に自動化を目指す方向性にあります。SREは低コストでシステム運用を行うために、人材の雇用ではなく、エンジニアの技術力で作業を自動化する方向を目指します。
人の手が入るとミスを誘発する原因にもなります。SREはスムーズにシステムを動かすという条件のもと、あらゆる仕組みの自動化を目指します。人の手を入れずに仕組み自動化を推進する点がプロジェクトマネージャーとSREで大きく異なります。

sre_02

SREは大変優秀な人材

ただでさえ人材不足に悩まされているIT業界ですが、SREになれる人材はほんの一握りです。技術力、コミュニケーション能力に加えて、自動化する仕組みを構築する能力も必要です。これだけの能力を備えている人材はなかなか見つからないのが現状です。
ずっと開発をやっていただけではダメですし、ずっとプロジェクトマネージャーをやっていただけでもダメで、両方とも経験し、さらに多様領域での開発経験がないとSREとしては即座に活躍するのは難しいかもしれません。

sre_03

SREはどれぐらい普及しているのか

2017年8月にO’Reilly から出版された「Site Reliability Engineering」でSREが一躍有名になりました。それに伴って日本の企業でも大きな企業がSREの設置に動き始めています。
例えば、フリーマーケットアプリ日本一のメルカリや、業務系クラウドサービスを提供しているサイボウズもSRE設置に向けて動いています。今後もこの動きは加速するでしょう。
そしてSREを設置している企業の多くは自社でITサービスを運営していて、請負でシステム開発を行う企業はSRE導入にあまり積極的ではありません。というよりも請負でシステム開発を行う企業にSREは不向きです。

すべてのシステムに関わる動きを知り、障害が起きたらすぐに対応するためにはシステムノウハウ(技術ではなく、システム自体の構造、ルールなど)をしっかりためておかなければいけませんし、そのためにはある程度時間がかかります。基本的には自社開発システムを運営している企業が、SRE設置に動いている傾向があります。

自社システムを持つ企業はSREが今後も増加する

SREは自社システムを安定稼働させるには必要不可欠であり、とても重要なポジションです。まだSREが登場してから日が浅いですが、今後は大手企業を始めとして、自社システムを保有する企業でSREは続々と増加するでしょう。
今まではサーバー稼働等はインフラエンジニアが担当していましたが、今後はそれもSREによって自動化され、インフラエンジニアの必要性がなくなるかもしれません。これはエンジニア側に横断的な働き方が求められている根拠となります。
今までは各分野で安住して、独占していた仕事もエンジニアが横断的に各分野をまたがって仕事をするのが当たり前になればエンジニアでも淘汰される人が出てきます。

一方で横断的に仕事ができるエンジニアは、途中で各分野に専任することもできるため、エンジニア界のオールラウンドプレイヤーとして活躍していけます。今までは分野ごとに分けられていたエンジニアですが、今後はこのような横断的な仕事の進め方が一般的になるとエンジニアのジャンルもどんどん再編されていくかもしれません。

PR:エスキュービズムのインテグレーション事業

エスキュービズムは「ハードウェア」「ソフトウェア」「デジタル」「リアル」という21世紀で求められるビジネスプラットフォームを構築してきました。
こうした「エスキュービズムプラットフォーム」を活用し、 モノ IT、リアル デジタルなどあらゆる垣根を融合していくことで、 業界や企業の課題解決へ導きます。

関連記事

訪日外国人客が集まる街へ インバウンド地方創生プロジェクト
エスキュービズムニュースレター!
IoT用語辞典
お役立ち資料
無料ダウンロード
ページ上部へ戻る

運営者

  • 株式会社エスキュービズム
  • 〒105-0011 東京都港区芝公園2-4-1芝パークビル A館 4階
  • TEL : 03-6430-6730(代表)
  • HP:https://s-cubism.jp/