GitHubは「Arctic Code Vault」と名付けられた新しいプロジェクトを発表した。これは、世界中のオープンソースソフトウェアをアーカイブ化し、今ある機械や知識が失われた未来の世界でも利用できる形で残そうという試みだ。
同社はこのアーカイブを、ノルウェーのスヴァールバル諸島にある、閉鎖された炭鉱を利用した施設「Arctic World Archive」に保存する。この施設は北極に近く、ノルウェー政府の「種子の方舟」計画で建設された、地球規模的な危機に備えて農作物の種子を冷凍保存する「スヴァールバル世界種子貯蔵庫」から1マイル(約1.6km)のところにある。
Microsoftの子会社であるGitHubは、2020年2月2日時点でアクティブなすべてのリポジトリーを対象に最初のスナップショットを作成し、データの長期保存サービスを提供するノルウェー企業Piqlのフィルムリール約3500フィート(約1.1km)に記録して保存する。
フィルムの寿命は通常約500年だが、Piqlのフィルムは1000年持ちこたえられるように作られている。同社はまた、記録されたオフラインデータを読み出すための機器「piqlReader」も作っている。
GitHubは、サンフランシスコで開催した自社カンファレンス「GitHub Universe」でこの計画を発表した。
スヴァールバル鉱山は、いくつかの点でデータの長期保存に向いている。この廃鉱山は非武装地帯に位置しており、地球上の人間が住んでいる地域としては屈指の辺鄙な場所にある上、地政学的にも安定している。また、この場所は極めて気温が低く、フィルムのようなストレージ媒体の保管に適している。
フィルムリールは、廃鉱山内の封印された部屋の中に置かれた、鋼鉄で覆われた容器の中に保管される。また、このGitHubのスナップショットは、イタリアやノルウェー、バチカン市国などから送られて来た歴史的なデータと同じ場所に置かれる。
GitHubによれば、2020年版のスナップショットには、パブリックなコードリポジトリーのほかに、「スターの数、依存関係、諮問委員会の意見を元に選ばれた重要な休眠中のリポジトリー」も収録されるという。
同社はまた、「このスナップショットには、各リポジトリーのデフォルトブランチのHEADから、サイズが100KBを超えるあらゆるバイナリーを除外したものが収録される。各リポジトリーは単一のTARファイルとしてパッケージ化される」としている。
「密度と完全性を高めるため、データの大半はQRコードにエンコードされて保管される。また、人間が読める索引とガイドに、各リポジトリーの場所と、データの復元方法の説明を残しておく」(GitHub)
諮問委員会には、人類学、考古学、歴史学、言語学、文書館学、未来学などの幅広い分野の専門家が参加する。
このプロジェクトの参加組織には、スタンフォード図書館、ロングナウ協会、インターネットアーカイブ、Software Heritage Foundation、Microsoft Research、オックスフォード大学のボドリアン図書館が含まれている。
GitHubは、このArctic World Archiveを同社のコールドストレージ戦略の一部として位置づけている。最近「スーパーマン」の映画を記録したクレジットカードサイズの石英ガラス片を公開した、Microsoft Researchの「Project Silica」もこの戦略に含まれている。コールドストレージのデータは、5年強の間隔で更新されるという。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。