ページの先頭です。
サイト内の現在位置を表示しています。
  1. ホーム
  2. ソリューション
  3. コンサルティングサービス
  4. コラム
  5. 業務改善
ここから本文です。

コンサルタントのコラム

ファイルサーバ管理のススメ

[第2回]データの肥大対策とファイルサーバの見える化

2013年11月(2020年10月改訂)

これまで、「ファイルサーバのバックアップ」について書いてきました。今回は、「データの肥大化対策と、ファイルサーバの見える化」について考えてみたいと思います。データの肥大化対策は、これまで書いてきた「有効かつ確実なバックアップ」を実現するために最大の課題の1つもあります。

1.ファイルサーバの現状(おさらい)

第1回にも書きましたが、弊社では「簡易情報アセスメント」というサービスを行なっており、過去40社弱のレポートを作成させていただいています。ここから見えてきた傾向として以下を上げました。

  • データは年率50%程度ずつ増加する
  • 「生成もしくは最終更新から1年以上経過」しているデータは60~80%存在する
  • 「生成もしくは最終更新が最近30日以内」のデータは全体容量の3~10%程度しかない
  • 「過去1年以上参照されていない」データは全体容量の50~80%程度ある
  • 重複するデータが20~30%存在する

2.データの肥大化

まず、データ容量が年50%増加するとはどういうことか、シミュレーションしてみます。

[図]

グラフを見ればわかりますが、年50%でデータが増えるということは、3年後には3倍以上、5年後には8倍弱にまでデータが増えることを意味しています。確かに、これを放置していれば、ディスクはいくらあっても足りなくなることは目に見えています。弊社も例外ではありませんが、定期的にファイルサーバ管理者から、「ディスクが逼迫しているので、不要なデータ削除してください」とアナウンスが出ますが、なかなか効果が上がらないのが現状です。

昨今の資料のビジュアル化、高解像度化、さらにファイルサーバの集約傾向を考えると絶対的なデータ量の増加は防げないと思います。
一番簡単な対策としては、ある程度費用をかけて、ディスク増設が容易なスケーラビリティを持ったストレージを導入することが考えられます。

しかし、データが増えれば、バックアップに問題が出るし、ファイルの検索にも時間がかかるため、なにかしらの対策は必要となります。

3.データの肥大化対策

そこで、注目したいのは、ファイルサーバの現状で上げたうちの2つの項目です。

  • 「過去1年以上参照されていない」データは全体容量の50~80%程度ある
  • 重複するデータが20~30%存在する

「過去1年以上参照されていない」ファイルを主ファイルサーバに保存しておく必要があるのでしょうか?例えば、「過去1年以上参照されていない」ファイルは、「別の保存媒体で保管する」もしくは、圧縮して別サーバ(より安いサーバ)に待避することはできないでしょうか?
また、「重複するデータ」は削除できないのでしょうか?

ここで、またシミュレーションを行ってみます。
シミュレーションの条件は以下のとおりです。

  • データの増加量は、先のシミュレーションと同じとする
  • 過去1年以上参照されていないデータが50%存在する
  • 過去1年以上参照されていないデータは圧縮(圧縮率50%)し、別媒体に退避する
  • 前年圧縮されたデータのうち10%は利用する(活用データとして復帰する)
  • 重複ファイルが30%存在し、これは削除できる(15%の削減)

[図]

まず、現状1TByteのデータは、上記条件で整理を行うと、10分の1以下にまでデータが整理されます。その上で、ファイルサーバに残るデータ量は3年後で、約1.3TByte、5年後でも3TByte以下、圧縮退避用の媒体も5年後で1.5TByte以下で済むことが見て取れます。何もしなかった場合、5年でデータ量が8倍近くとなるのに比べ、その差は歴然としています。

しかし、このシミュレーションには大きな課題があります。それは、以下の3点です。

  • どうやって、重複ファイルを識別し、削除するか?
  • どうやって、1年以上参照されていないファイルを識別し、圧縮退避するか?
  • どうやって、圧縮退避したファイルを必要なときに取り出すのか?

管理者が、手動で行うことは、理論上可能ですが、その手間を考えると現実的ではありません。つまり、このシミュレーションを実環境で行うためには、管理するファイルサーバの見える化と、管理を自動化するツールが必要となるということです。

4.ファイルサーバの管理ツール

ファイルサーバの管理ツールはいくつかありますが、NECには、NEC Information Assessment System(愛称NIAS)という製品があります。
NIASはファイルサーバの、(1)見える化、(2)ファイル整理・容量削減、(3)アクセス権管理を行うファイルサーバ整理・活用ソフトウェアです。

実は、弊社の「簡易情報アセスメント」もNIASの「見える化」機能限定版を用いてデータの収集・分析を行っています。「簡易情報アセスメント」では、ファイルサーバの現状分析しか行えませんが、製品版では目標値を設定してのシミュレーション等もGUIを用いて行うことが可能です。

[図]

シミュレーションをもとに、削除対象ファイルの抽出・リスト化を行い、これを利用者(ファイルオーナ)に整理依頼メールを送付、手動での削除または圧縮を行うことができます。
また、整理ポリシーを設定し、自動でファイル整理を行うことも可能です。この際、元ファイルサーバには圧縮ファイルへのショートカットが残るので、利用者が再利用する際にも影響を与えません。

[図]

これらの機能により、NIASでは、先に上げた3つの課題、

  • どうやって、重複ファイルを識別し、削除するか?
  • どうやって、1年以上参照されていないファイルを識別し、圧縮退避するか?
  • どうやって、圧縮退避したファイルを必要なときに取り出すのか?

を解決することができます。

5.まとめ

今回はちょっとコマーシャルっぽくなってしまいましたが、データの肥大化は多くの組織で共通の課題だと思います。この課題に「精神論」や「管理者の手作業」で対応するのには限界があります。

また、2つのシミュレーションを行いました。基本データは弊社で行っている「簡易情報アセスメント」の結果(平均値)を用いています。当然のことながら、ファイルサーバの使い方には、組織固有の「クセ」があります。まず、自社のファイルサーバがどのような使われ方をしているのかを把握し、その上で対策を検討することをお勧めします。

次回はファイルサーバの情報セキュリティ対策(アクセス管理)について考えてみたいと思います。

執筆

NECネクサソリューションズ
コンサルタント 吉川 明人
[CISA公認情報システム監査人,CRISC 公認リスク情報システム管理者,情報セキュリティアドミニストレータ,ネットワークスペシャリスト,NPO事業継続推進機構会員]

個人的には、1年以上ダイビングに行けていません。機材のメンテナンスが、直近のリスク管理上の課題となっています。

*本コラムは、筆者の個人的な見解に基づいて書かれています。

関連ソリューション

ご質問・ご相談などお気軽にどうぞ

お問い合わせ

資料ダウンロードはこちらから

資料ダウンロード
ページ共通メニューここまで。

ページの先頭へ戻る