リサーチャーらは、DNA上のデータをリレーショナルデータのスキーマを意識したかたちでエンコーディング/デコーディングする、PostgreSQL用のアーカイブツールと復元ツール(pg_oligo_dumpとpg_oligo_restore)を作り上げ、それらツールを用いて12KBのデータをTPC-HのDNAデータベースにアーカイブし、DNA上で処理を実行した後、復元した。
これは素晴らしい成果だ。これにより、DNAストレージがSQL操作をサポートし、データの一部に対して選択的なアクセスや処理を実行できることが示された。こういったデータが、データベース上で演算処理を実行するためにフェッチされたわけではない点に注意してほしい。Appuswamy氏とHeinis氏は、オリゴ上でSQLのテーブル結合といった操作を実現する方法を発見した。この成果は、生化学ストレージという枠を超え、生化学コンピュートまでもが可能になるということを示すものだ。
しかし、このような成果を実現するうえで、リサーチャーらはDNAを用いた情報のエンコーディングとデコーディングに使用されるテクノロジーに内在する一連の問題に取り組む必要があった。DNA上での操作の実行には、生化学的な操作に適したオリゴを生成するための特別なエンコーディング技法が必要となる。また、DNAに格納されたデータの読み込み処理では、現在のところエラーが発生しやすいものとなっており、従前の取り組みではデータは過剰なまでの複製を必要としていた。つまり、データごとに数多くのコピーを作成しておき、オリジナルが損傷していた場合でもバックアップが使えるようになっていた。
これに対して、Appuswamy氏とHeinis氏はメタデータを使用する手法を考え出した。彼らは書き込みを行うブロックに複数の追加ビットを加えることで、データベースのスキーマを意識させるようにしている。これによりエンコーディング(書き込み)処理中の密度が高まるとともに、デコーディング(読み込み)処理中のエラー識別が支援されるということが示された。彼らによると、これは期待を上回る結果になったという。ほんの少しのメタデータが大きく役に立ったというわけだ。
DNAはデータの未来となるのか?
テクノロジースタックを構成する要素はまだ成熟しきっていないとはいえ、これは大きなブレークスルーだ。データセンター向けの豊富なストレージが既に存在するというのは、今後を大きく変える可能性がある。ただ、ストレージやコンピュートとして現実的に使用できるDNAレベルの容量を持つメディアを作り出すということの意味は、われわれの想像力を超えたものとなっている。