IaaS障害はどこでどうやって起きるのか？ユーザー企業が受けるサービスダウン以外の影響とは - ITmedia

jn.prelol.com

　日本では今、官民両方でIaaSの活用が進んでいる。政府は2018年にシステム調達の際にクラウドの利用を第一候補にする「クラウド・バイ・デフォルト原則」を発表し、20年にはAmazon Web Services（AWS）上に中央省庁などの情報システムを集約した「第二期政府共通プラットフォーム」を構築し運用を始めた。地方自治体でもIaaSを使うケースが徐々に増えつつある。

　調査会社のアイ・ティ・アール（東京都新宿区）によれば、日本のIaaS、PaaS市場規模は20年度に7777億円を記録し、22年度には1兆円を超えるという。

　一方で、近年ではIaaSの障害による影響の大きさが目立ってきた。AWSや米MicrosoftのAzureなど大手クラウドサービスが企業の情報システムやサービスの基盤として影響力を増したことで、IaaSの障害が起きたときに、さまざまな企業のシステムやサービスが一斉にダウンしてしまう場合がある。

さくらインターネットの横田真俊執行役員

　最近では「人気スマホ向けゲーム『ウマ娘プリティーダービー』にアクセスできなくなる」「気象庁のWebサイトが約5時間ダウンする」などの障害があった。

　しかし、IaaS障害の影響はサービスダウンやデータ消失だけではない。今回はさくらインターネットでクラウド分野を担当している横田真俊執行役員に、IaaS障害の原因と影響について話を聞いた。まずはIaaS障害が“どこ”で“なぜ”起きるのかを知っておくのが重要だ。

特集：IaaSの冗長性確保

"金融機関や官公庁、政府までもが基幹系システムをクラウド環境に移行する“クラウドファースト”時代。しかし、近年はIaaSベンダーの障害による影響も目立ってきた。私たちはこれらの事例から何を学ぶべきか。クラウドのトラブルを「しょうがない」で済まさないための心構えを知る。

IaaS障害が起きる場所と原因

　一口にIaaS障害といってもその発生原因はさまざまだ。それによって影響の内容や規模も変わってくる。

　まずは障害が起きる場所だ。基本的にはデータセンターのどこかに問題が起きることが多い。規模としてはデータセンター全体、一部の部屋、一部のサーバ、一部のインスタンスなどがある。自然災害や火災、データセンター管理者のミスなどが原因で、問題発生箇所が広ければその分、障害の影響範囲も大きくなり得る。

　「障害が起きる場所」にはもう一つ意味がある。IaaSの提供と利用に関わる企業のどこで問題が起きるかだ。IaaSの提供には、サーバの製造販売を行うハードウェアベンダー、データセンター管理者、クラウドサービスを提供するサービスベンダーが関わっている。「ハードウェアに設計上の問題があった」「ドライバに不具合があった」ならハードウェアベンダー、「データセンターの空調管理にミスがあった」ならデータセンター管理者、「サービス提供時に契約履行ミスがあった」ならサービスベンダーなど、原因の切り分けが考えられる。

　次に障害の発生原因だ。主に「災害」と「オペレーションミス」の2種類に分けられる。前者は、機器や管理運用の方法には特に問題がないが、地震や台風などの自然災害によってデータセンターやサーバが破損したり、建物全体が停電したりした場合に起きる。サイバー攻撃による障害も場合によっては一種の災害とみることもできるだろう。

　オペレーションミスは人間の操作が原因で起きる。データセンターの空調管理、プログラムのミスで起きたオーバーフロー、更新パッチの適用し忘れなどが原因になる。障害とは少し違うが、契約期間を間違えてうっかりデータを消してしまったという事務的なミスもあるなど原因は多岐にわたる。

サービスダウン以外の問題

　災害や人為的ミスによってIaaS障害が発生した場合、ユーザー側はサービスダウンをはじめとする被害を受ける。サービスダウンした時間に稼げるはずだった収益を取り逃すという直接的な損害も出るが、問題はそれだけではない。

　一つは企業やサービスのイメージダウンだ。サービスダウンによるイメージの悪化だけでなく、事後対応のスピードや適切さもイメージに直結する。災害でデータセンターが被害を受け障害につながった場合は不可抗力だが、それでもゲームや業務システムは一時的に使えなくなり、プレイヤーやユーザーから不満の声は出る。

　もう一つが対応コストだ。障害発生時の緊急対応にも原因の切り分け作業や広報などに人的リソースが必要だが、障害解消後のリカバリーや報告、追加の調査などが必要な場合があり通常業務を圧迫してしまう。何らかのミスでクラウドサーバに保存していた情報が漏えいした場合には、漏えいした情報の調査費用が別途かかる可能性もある。

　サービスダウンしただけならまだしも、データの破損や消失は情報資産の喪失でもある。ECサイトのデータが消えてしまった場合、再構築まで数カ月単位で損害が発生する。再構築にかかる費用ものしかかる。過去の営業データが消えて経営分析ができなくなるケースもあり得るだろう。

IaaS障害には“なすすべなし”なのか

　では、これらの被害を受けないためにはどうすればいいのか。横田氏によると別々の地域のデータセンターにサーバを分散させているケースが多いという。いわゆる冗長化という手段だ。

　IaaS障害が起きる場所はデータセンター全体、一部の部屋、一部のサーバやインスタンス、起きる原因は災害やオペレーションミスという話だった。起きる場所の最も大きいくくりがデータセンターであることからも分かるように、複数のデータセンターで同時に障害が起きるというのは考えにくい。違う場所にあるデータセンターで同時に空調設定をミスするだろうか。東京と大阪のデータセンターで同時に災害が起きる場合は、IaaSより自分の命を心配したほうがいいのではないか。

　冗長化すれば、1か所で問題が起きても、もう1か所が通常通り動いていればサービスやシステムを維持できる。データセンターを分けるとIaaSの運用コストがかさみすぎる場合は、同じデータセンター内で冗長化する方法もある。別々の部屋にあるサーバにデータを分散させておけば、大規模災害などでデータセンター全体に問題が起きない限りはほとんど問題ない。

　データセンター管理者やクラウドサービスベンダーも災害対策は取っている。ほとんどのデータセンターで停電などに備えた予備電源を用意している。さくらインターネットの場合は災害の少ない場所にデータセンターを建てるなど、立地を選ぶ時点から対策が始まっている。

　それでも災害は起きるときには起きる。18年の北海道胆振東部地震では北海道全域で大規模停電が起きた。さくらインターネットの石狩データセンターは非常用電源で電力復旧までの60時間を耐え抜いた。1つのデータセンター内で冗長化する場合は、データセンターの災害対策について事前に確認しておくのもいいだろう。

石狩データセンターの設備

　もし、IaaS障害が起きたらサービスや事業に大きな損害が起きるミッションクリティカルなシステムを運用する場合、保険に保険を重ねるなら複数のクラウドサービスを契約して冗長化するマルチクラウド環境を検討するのも一つの手だと横田氏は言う。

　もう一つ重要なのが、あらかじめ責任の所在や補償基準を確認しておくことだ。当たり前だが、クラウドサービスベンダーはIaaSの品質について責任を持っている。しかし、IaaSをユーザーが使う上で起きたすべての不具合について補償するわけではない。ユーザー側で発生した問題はユーザー側の責任になる。

　クラウドサービスベンダーが品質保証の基準として設けているのがSLA（Service Level Agreement）だ。「サーバの稼働率を99.95％以上に保つ」といった基準を定め、設定値を下回れば利用料を減額するなどの補償措置をとる。補償の適用基準もあり、これらを事前にすり合わせておくことで、障害発生時の素早い対応が可能になるのがメリットだ。

　IaaS障害に巻き込まれた場合、ユーザーがデータセンターに行って不具合を解消できるわけではなく、復旧を待つしかない場面も多い。だからこそ、あらかじめそれを理解して冗長化などの対策をすることで、IaaSの利点を余すことなく享受できるようになるのだ。

Adblock test (Why?)

"どうやって" - Google ニュース
July 16, 2021 at 02:19PM
https://ift.tt/3B8LGMu

IaaS障害はどこでどうやって起きるのか？ユーザー企業が受けるサービスダウン以外の影響とは - ITmedia
"どうやって" - Google ニュース
https://ift.tt/2DFeZd1
Mesir News Info
Israel News info
Taiwan News Info
Vietnam News and Info
Japan News and Info Update
https://jn.prelol.com/

Bagikan Berita Ini

Search