- 《大好評》LTspice設計実務シリーズ
LTspiceで学ぶ電子部品の基本特性とSPICEの使いこなし(セミナー)
2024/12/5(木)10:00~16:00
お問い合わせ
03-6206-4966
今回は、コンピュータシステム(以下システムと略します)の可用性について解説します。
昨今、「システム障害で問題が発生した」という話題が頻繁に起こっています。
航空会社や交通機関等の予約/販売システム、通信キャリアや銀行のネットワークシステムなど、私たちの生活上必要不可欠なシステムに問題が発生して困ることもしばしばあります。
システムの「可用性」とは、システムがいろいろな原因で停止してしまうことなく稼働し続ける特性や指標を示します。この可用性を探ることで、システムに関する動作の継続性の重要さを考えてみます。
可用性についてお話しする前に、システムの要件であり、また、評価のための指標である「RASIS」について説明したいと思います。
「RASIS」とは、信頼性(Reliability)、可用性(Availability)、保守性(Serviceability)、保全性(Integrity)、安全性(Security)の頭文字からなるものです。簡単にそれぞれについて説明します。
このように、主に5項目によってシステム要件を定義しています。
またシステムの信頼性、安全性、保全性などは、国際規格IEC62278によってRAMS規格の一部としても規定されています。これらの要件を満たすべくシステム設計を行う必要があります。
冒頭でもお話ししましたが、これらの要件の中でシステムが何らかの障害により停止することを避けるために稼働率を高める「可用性」について説明したいと思います。
可用性を高めるには、冗長性をシステムに持たせる必要があります。
冗長というと無駄があるとか重複するというような不必要な意味合いがありますが、システムにおいては何らかの障害に対する予備システムなどを持たせて余裕度を高めることを意味します。
冗長化手段としては、集団制御であるマルチマスター方式、主従制御であるマスター/スレーブ方式、多重制御の代表である二重化方式などがあります。
【図1 冗長化方式分類】
マルチマスター方式は、データベースサーバや通信方式などでも採用される方式です。データが常に更新されることが想定され、更新の競合が発生する場合や、サーバーの性能を超える事態が発生した場合に、データ取得ができなくなりシステム停止の事態が発生するなどを回避するために、集団で構成する方式です。
用途としては、データベースサーバのコントロールや車載ネットワークシステムなどに使用されています。
マスター/スレーブ方式は、システム連携において、一方が制御する側(マスター)、制御を受ける側(スレーブ)の関係で役割分担して行う方法です。
同じ構成の機器や部品、システムなどの機材を複数系統用意する多重化であり、その中でも最も現実的で現在用いられているのは二重化です。
二重化は方式により以下のように分類されます。
【図2 二重化方式】
システム構築する上で最も信頼性を持たせる必要がある、例えば24時間365日稼働することを求められるようなものに使用される方式で、同じ処理を同時に2つの系統やシステム構成で行うものです。処理結果を照合して確認を行いながら処理を進めます。
障害発生時には、発生したシステムを切離して稼働を継続します。
システムが完全に停止することを最大限に避けるシステムです。
現在の用途としては、金融機関などのシステムで運用されることが多いです。
システム構成が2つであり、ハードウェア、ソフトウェア、電力資源など倍のコストがかかる点がデメリットです。
この方式も、2つの系統やシステム構成を持つことはデュアルシステムと同じですが、通常は片方(現用)のシステムのみ稼働し、もう片方(予備)は待機させる点が異なります。
したがってシステムに障害やメンテナンス時の切替えに一定時間を要するため、これを許容するシステムに採用されます。
待機させて障害など発生した場合の切替え手段により以下の3方式があります。
以上の3方式を復旧に要する切替え時間で比較すると、[ホットスタンバイ < ウォームスタンバイ < コールドスタンバイ]となります。
可用性に触れてきましたが、これは、「フォールトトレランス性のあるシステム」の構築が必要であることを示します。
つまり、障害等発生時に現用から予備のシステムに切替えることや、障害箇所を切離してパフォーマンスが下がっても稼働を継続する仕組みや手段を持つシステムであることです。
そのためには、単に予備システムを用意するのみではなく、故障個所が拡散することを防ぐ手段を有することや、一部の機能を切離しても補完処理が可能である、システムを構成するパーツであるハードウェア、ソフトウェアがより信頼性が高いものを使用する等、システム構築時に対策を予め十分取っておく必要があります。可用性を保証したシステムとは、フォルトトレラントシステムの構築でもあります。
システムの構築にあたり、常時稼働が要求され停止が許されないものから、ある程度のシステム復帰まで許容されるものなどシステムへの要求が様々存在します。
これらに対応するようシステム構築がなされますが、障害の可能性をいかに多く想定してシミュレーションを行うか、またハードウェア・ソフトウェアの信頼性を高めたものを使用するかなど、危機管理の体制を充実させることにより被害を極力抑える対応が重要です。(もちろん投資コストとの兼合いですが)
(日本アイアール株式会社 特許調査部 T・T)