これは難題のように思えるかもしれないが、分子テクノロジーの進歩によって実現への道が切り開かれている。ただし、まだ完璧ではない。その意味するところは、DNAを媒体とした情報の格納と復元を実現するための情報のエンコーディング手法とともに、DNAの合成やDNAシークエンシングもそれぞれ現実的に可能だということだ。
実際に、MicrosoftはDNAを用いたデータの格納/復元システムを世界に先がけて実現してみせた。このDNAがどこから来たのかと考えている人のために書いておくと、これは合成DNAであり、そのDNAが作り出す配列そのものがシステムの一部となっている。
自然界に存在する生物のDNAはヌクレオチドの鎖が2本つながって二重らせん構造を形成している。それとは異なり、データストレージに用いられているDNAは1本鎖のヌクレオチドとなっており、オリゴヌクレオチド(オリゴ)とも呼ばれている。これはヌクレオチドを1つずつ集めてDNAを作り上げるような化学プロセスによって合成される。
これがRaja Appuswamy氏とThomas Heinis氏を交えたディスカッションの出発点だ。フランスに拠点を置く教育機関であるユーレコムのデータサイエンス学部でアシスタントプロフェッサーを務めるAppuswamy氏と、英国のインペリアルカレッジロンドンのSCALE Labの責任者であるHeinis氏は最近、DNAストレージに関する画期的な成果を発表した。
DNAを用いて現実世界のデータを格納する
Heinis氏とAppuswamy氏らは、革新的なデータシステムに向けた研究成果を発表する場である「Conference on Innovative Data Systems Research(CIDR)2019」において、「OligoArchive: Using DNA in the DBMS storage hierarchy」(OligoArchive:DBMSのストレージ階層でのDNAの利用)という研究論文(PDF)を発表した。DNAを用いたデータの格納と復元を実現したのは両氏が初めてではないものの、市販のデータベースと統合したうえで構造化データの格納と復元を実現するとともに、ストレージの枠を超えてコンピュートまでをも実装したのは両氏が初めてとみられる。
データのストレージ階層としてDNAを見た場合、書き込み操作を行うたびにオリゴを合成する必要があるという点を理解しなければならない。現実的には、どのようにすればよいのだろうか?研究室の技術者を待機させておき、化学プロセスに使用する原材料が入った「タンクへの補給」をさせる必要があるのだろうか?