情報量爆発と枯渇するストレージ

一昔前に比べるとHDDの大容量化は隔世の感がある。容量だけでなく、価格面で見ても個人が大容量ストレージを持つことは十分に可能な時代になった。テラバイト級のストレージでさえ、パーソナルユースでの利用が
十分現実的になってきた。
実際、テキスト情報だけでなく、動画や音声など、マルチメディア情報を蓄積するようになると、従来とは桁違いのストレージが必要になってくることは間違いないが、果たして我々はどの程度のストレージが必要になるのだろうか?

テラバイトで一生の情報を記録できるか?

マイクロソフトの Gordon Bell が2000年から継続して続けている MyLifeBits
では、自分自身が日々触れるさまざまな情報をすべて蓄積していくことを目指している。このプロジェクトで一月あたりの情報蓄積量としては想定されている情報量は
1ギガバイト(GB)である。つまり、一年で12GB、 1テラバイト(TB)ならほぼ一生の情報が蓄積できるという計算だ。 Gordon
Bell自身がこの7年間で記録した情報は150GBになるという。膨大といえば膨大なデータではあるが、近年の感覚からすると、普通のパソコンに付属しているHDDで足りてしまうサイズである。

ただし、この前提には、高精度の画像情報や映像情報は含まれていない。たとえば、ハイビジョン映像を保存するとなると、
1TBであってもわずか100時間程度しか記録することができない。より高精度の画像、映像情報を記録したり、また、今後想定されるセンサー情報をそのまま蓄積していくとすれば、
MyLifeBits での想定をはるかに上回る情報記録が必要とされるだろう(センサー系の情報の蓄積については、Take IT Easy
2006年10月10日記事でも考察した)。

大容量のデータを記録しておきたいというニーズとストレージの供給関係は今後どのようになっていくのだろうか?

2007年には情報生産量がストレージ供給量を超える?

IDCが今年発表した予測 によれば、2006年のデジタル情報の生産量(複製や視聴量を含む)は
161エキサバイト(EB)だが、
2010年には約1000EB、つまり、1ゼッタバイト(ZB)に到達するという。ゼッタバイトとは10の21乗バイト(100京バイト)のことである。あまりに巨大な数でほとんど想像することすらできないが、たとえば、10億人が年間1テラバイトの情報を扱うとすると、その総量がゼッタバイトに相当する。

一方、ストレージの供給量を見てみると、 2006年では約200EBとなっており、情報生産量(161EB)を上回っているものの、
2007年では情報生産量が
255EBであるのに対し、ストレージ供給量が246EBとなり、情報生産量がストレージ供給量を初めて逆転するという状況が予測されている。むろん、生産された情報すべてが累積記録されていくわけでもないし、需要が高ければ供給量も調整されるであろうから、すぐにストレージが不足するという事態にはならないだろうが、ストレージの供給量は、現状の技術の延長線上では一定の増加しか期待できないのに対して、情報生産量は、生成された情報の再配布や複製、さらには組み合わせ的に新しい情報を機械的に(つまり低コストで)生む出すことができるから、本質的に組み合わせ的に増大する性質を持っている。つまり、今後数年間で見たときには、我々が記録・蓄積しておきたいと考えるだけの情報量を記録できない、という状況が発生する可能性が高いのである。しかも、情報量の増加速度が指数関数的であるとすると、ストレージ供給が間に合わない、という状況はある日突然やってくるかもしれない。逆にいえば、ストレージ供給スピードあるいはコストが今後想定される情報サービスのボトルネックになるということは十分に想定される。

枯渇するストレージとその対策

今までは、ストレージ供給が明らかに情報蓄積ニーズを上回り、安価に供給される状況であったから、何も考えずにそのままためていけばよかった。パソコン内のデータはどんどん膨らんでいくけれど、新しいパソコンのハードディスクは常にそれを上回る容量を供給してくれていた。だが、そうはいかない時代が近いうちに来るのかもしれない。

これはいずれは枯渇する化石資源と消費エネルギーの関係にも似ている。化石資源の残存年数は定かではないが、数十年先には枯渇すると考えられている。このために、化石資源に変わる代替エネルギー手段の開発、また、エネルギー消費そのものを効率化する研究開発が進められてることはご承知のとおりだ。情報量に関しても、新しいストレージパラダイムの研究開発の必要性はいうまでもないが、短期的には、より効率的な情報蓄積方法が考えられなくてはならない。特に、今後情報量増大の主要因となる高精度の画像・映像・音声情報やセンサー情報においては、デジタル情報としての効率的な圧縮方法というだけでなく、希少性や鮮度といった情報そのものの価値判断や、整理・廃棄のために必要な構造化も含めた研究開発が必要である。