Microsoft傘下のGitHubは米国時間7月16日、アクティブな公開リポジトリー全てのスナップショットをノルウェーの保管施設で長期保存するという「Arctic Code Vault」プロジェクトの節目となる、コードの収容作業を完了したと発表した。
GiHubはこのプロジェクトの計画を2019年11月に発表した後、2020年2月2日時点で21TBに上るスナップショットを186巻のフィルムに記録していた。
同社によると、「GitHub自らが世界のオープンソースコードを北極圏までエスコートしていく」予定だったが、新型コロナウイルス感染症(COVID-19)のパンデミックにより断念し、現地のパートナーが箱詰めされたフィルムを受け取り、7月8日に炭鉱跡を利用した施設に搬入したという。
この施設はノルウェーのスヴァールバル諸島にある。スヴァールバル諸島には、地球規模の災害に備えて農作物の種子を冷凍保存する「スヴァールバル世界種子貯蔵庫」も設置されている。
GitHubの戦略的プログラム担当ディレクターであるJulia Metcalf氏は「コードは、スヴァールバルにある人口数千人の町、ロングイェールビーンに到着した。コードが収められた箱はそこで現地の輸送会社に引き渡され、目的地までの中間地点にあるセキュアな倉庫施設で一晩保管された」と述べた。
「翌朝、これらの箱は山中にある炭鉱跡に運び込まれ、永久凍土層の地下数百メートルの奥深い場所に作られた、世界のオープンソースコードを1000年以上にわたって保存するというミッションを実現するための保管庫に収められた」(Metcalf氏)
このリポジトリーには公開コードリポジトリーと、休眠中の重要なリポジトリーが含まれている。またこのスナップショットには、各リポジトリーのデフォルトブランチにおけるHEADから100KBを超えるバイナリーを省いたものが収録されている。各リポジトリーは単一のTARファイルとしてアーカイブ化されており、効率を追求するためにほとんどのデータはQRコードとして収録されている。
また、各リポジトリーが格納されている場所の一覧とデータの復元方法が、人間の目で確認できるインデックスとガイドによって提供されている。
ウェブ上でマルチメディア資料のアーカイブ閲覧サービス「Wayback Machine」を運営しているインターネットアーカイブも4月13日、別途GitHubの公開リポジトリーのアーカイブ作業を開始した。Wayback Machineは、生のGitHubデータをWeb ARChive(WARC)形式のファイルでアーカイブしており、現在のところそのデータ量は55TBに達している。
またインターネットアーカイブは、「git clone」を用いてリポジトリーを利用可能にするというイニシアチブを7月中にも開始する予定であり、リポジトリーコメントやイシュー、その他のメタデータもウェブ上でアクセスできるようにするという。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。