JAMSTEC×IBM、データ量が膨大な地球規模の研究を支えるテープソリューション 容量、コスト、信頼性、進化したテープストレージの優位性とはJAMSTEC×IBM、データ量が膨大な地球規模の研究を支えるテープソリューション 容量、コスト、信頼性、進化したテープストレージの優位性とは

提供:日本IBM

異常気象をもたらす気候変動が地球上の大きなリスクとしてクローズアップされる中、海と地球に関する研究開発を行う国立研究開発法人海洋研究開発機構(JAMSTEC)の役割はますます大きくなっている。しかし、地球環境を研究対象とするだけに同機構が取り扱うデータ量は膨大であり、増加の一途をたどっている。それを支えているのがデータ記録用磁気テープだ。なぜデータ保管に磁気テープを選択したのか。導入に至った経緯やテープの優位性についてキーパーソンに話を聞いた。

増え続ける膨大なデータの長期にわたる保管が必要に

――現在も研究用データは増え続けているのでしょうか。

上原 均氏
国立研究開発法人海洋研究開発機構
付加価値情報創生部門 地球情報科学技術センター
計算機システム技術運用グループ グルーブリーダー
上原 均

上原 当機構は海洋と地球環境の研究のために20年にわたって地球規模のシミュレーションに対応できるスーパーコンピュータ「地球シミュレータ」を開発・運用してきました。2021年度には第4世代(ES4)になり、日本国内の研究者だけでなく、IPCC(気候変動に関する政府間パネル)の気候変動の予測プロジェクトにも利用されています。

 防災や減災の対策を立案するために利用されるデータ量は膨大です。想定外のことが発生しないように幅広い範囲のデータが必要になります。対象となるのは広大な地球で、しかも100年といった長いスパンでデータを蓄積しておかなければなりません。

 しかし、研究者が求める容量を提供するのは大変で、データを保管するストレージは常に悩みのタネでした。それがITの進化で加速しています。計算対象のメッシュの単位が細かくなればその分データ量が増え、メッシュが10倍細かくなればトータルのデータサイズは1000倍から1万倍にもなります。画像も4K、8Kと高解像度化が進んでいます。対象となるデータ量は急増している状況です。

――データ保管のポイントはどんなところにあるのでしょうか。

上原 データを永遠に保存したい、利用したいときにすぐに使いたいという研究者のニーズに円滑に対応するためには、膨大な容量とデータを安全に保管する仕組みだけでなく、上書き防止策や迅速な故障対応、スピーディーな書き込み、読み出しの機能が必要になります。それらのコストを抑えて実現しなければなりません。

変化するニーズに対応して常にストレージの見直しを

――JAMSTECは2018年3月にIBMのテープストレージシステムを導入しました。以前はどのようにしてデータを保管していたのでしょうか。

大倉 悟氏
国立研究開発法人海洋研究用機構
付加価値情報創生部門 地球情報科学技術センター
計算機システム技術運用グループ グルーブリーダー代理
大倉 悟

大倉 データ保管の問題がクローズアップされたきっかけは、2002年3月の第1世代の地球シミュレータの導入でした。処理性能が飛躍的に高くなり、扱うデータ量が急増したためにハードディスクのストレージでは対応できない状況になり、テープストレージを導入しました。

 ところが当時のテープストレージは処理スピードが遅く、ハードウェアが故障することもあり、2009年3月に地球シミュレータの第2世代が導入されたタイミングでハードディスクストレージのみに切り替えました。しかし、調達費や電気代などのコストが大きいため、研究者の要求に応えるのに苦労しました。

上原 ハードディスクの製品寿命が5年ほどしかないことも欠点でした。そのたびに半年ほどかけてデータの引っ越しをしました。地球シミュレータのユーザは何百人もいて常時使われているので、マシンを止めずにデータの引っ越しをするには、少しずつ移動するしか方法がなかったのです。

大倉 2015年に第3世代が導入されたときに、ハードディスクストレージの容量を引き上げたのですが、それとは別にデータを長期保管できるストレージの導入が検討され、「テープ」が再び俎上に上ってきたのです。

上原 その頃から論文の裏付けとなるデータを残して公開しなければ成果が認められない流れがでてきて、研究データの長期保管のニーズが高まりました。加えてオープンデータの流れの中でデータの読み込みスピードも求められていました。

 しかも第3世代の地球シミュレータの処理性能は前世代に比べて10倍になり、1つの研究プロジェクトで数ペタバイトのデータが利用されるようになりました。それが国の防災や減災の政策の決定要因になるため簡単には消せません。ハードディスクストレージでは対応は厳しいと考えていました。

 そんなときにテープストレージの機能が向上しているという話を聞き、改めて見直すことになり、2016年頃から検討し始めました。

20年前から大きく進化したテープストレージの機能

――テープストレージの機能が向上した背景には何があったのでしょうか。

田中 康成氏
日本アイ・ビーエム株式会社
テクノロジー事業本部
ストレージ・システム事業部 事業部長
田中 康成

田中 IBMは1952年から独自の技術をベースにテープストレージを開発してきました。2000年頃から業界共通の規格標準を目指して共同開発が行われるようになり、急速に性能が向上していきました。この規格標準は現在、「LTO-9」と言われる第9世代に入っています。さらにIBMでは、独自技術を投入した独自規格のエンタープライズテープTS1100シリーズを開発販売しており、JAMSTEC様にはこちらをご使用いただいています。

 性能の向上には“日本クオリティー”も貢献しています。日本にもテープストレージの開発拠点があり、ファームウェアやソフトウェアの開発を担っています。また、2011年の東日本大震災でテープストレージのデータが無事だったことで注目度が高まったことも追い風になりました。

――IBMのテープストレージを導入した決め手はどこにあったのでしょうか。

大倉 導入の1年前から具体的な候補を決めてスペックを比較していきましたが、読み書きのスピードと一度に扱えるデータ量の大きさが以前のテープストレージとはまったく違っていました。他社の製品と比べてエラー率が低く、カートリッジが頑丈かつコンパクトにできているところも評価しました。

 また、ハードディスクストレージと組み合わせて階層型で管理ができることも魅力でした。研究者はデータがどこに保管されているかを意識することなく使えて、運用側も手間がかからず便利だと思いました。

上原 最初はテープストレージに対して懐疑的でしたがスペックを見て驚きました。性能や機能を知り、一気に導入の機運が高まりました。

大倉 国内外の研究機関で多くの採用実績があることも好印象でした。今後はテープを介したデータ交換も可能になるのではないでしょうか。

田中 メインフレーム時代から培ってきたノウハウがあり、ソフトウェアも高度化させてきました。コストパフォーマンスは20年前の1000倍にもなり、2011年頃から大規模な研究機関での導入事例が増えています。

上原 均氏
「テープストレージに対して懐疑的でしたがスペックを見て驚きました。性能や機能を知り、一気に導入の機運が高まりました」(上原氏)
大倉 悟氏
「製品のライフタイムが長く、データ運用を長いスパンで見ることができるので、運用面でもメリットがあります」(大倉氏)

経済性が高く拡張性もある次世代テープストレージ

――テープストレージの導入でどのような効果があったのでしょうか。

上原 コストが安いというメリットに加え、カートリッジを1巻単位で購入できる拡張性もあります。研究課題やチームごとに調達できるので研究者からは好評です。以前はデータ容量を確保するためにデータを消してもらうお願いをしたこともありましたが、そういうこともなくなりました。

 アクセス頻度が低いデータでも残しておけるので、長期保管に対する研究者の意識も変わってきました。テープストレージのおかげで、世の中のニーズと研究者の意識が合致するようになったのです。研究者からも「数年以上の長期保存ができる」「安定していて助かる」「1巻ごとの増量はありがたい」といった声が上がってきています。

大倉 製品のライフタイムが長く、データ運用を長いスパンで見ることができるので、運用面でもメリットがあります。コンパクトでコストが安く、スペースの心配もありません。導入にあたってはきめ細やかなサポートが受けられました。

田中 康成氏
「データは重要な資産であり、テープは安全に低コストで保持でき、長く使っていただける製品です」(田中氏)

田中 データは重要な資産であり、テープは安全に低コストで保持でき、長く使っていただける製品です。日本企業との共同研究で素材も進化しており、地球環境に配慮したものになっています。テープストレージは「古いが、新しい」製品です。

上原 地球科学は他の研究領域と比べてデータ量が膨大です。しかも国の政策に活用されるためにデータには高い信頼性が求められます。これからも相談に乗っていただけると助かります。