生きたバクテリアは究極のデータストレージになり得るのか?

生物の設計図を記憶しているDNA(デオキシリボ核酸)は、複写、継承可能な性質を有するため、データストレージとして利用できるのではないかと考えられており、目下注目を集めている研究分野の一つである。HDDの耐久性は先日取り上げたように数年持てば良い方だし、DVDなどの光ディスクも10年持つかどうかも怪しいものだ。昔ながらの紙によるデータは1000年保つのに、デジタルメディアは下手をすると明日には無くなってしまう危険性を有している。

DNAはデータの保存を行うことができるが、高い確率で遺伝子変異を起こし、データが壊れやすいという問題があった。今回、慶応大学の谷内江望氏らを中心とする研究グループは、異なるオリゴヌクレオチド配列によりエンコードされた同内容のデータを、枯草菌 (Bacillus subtilis)のDNAの複数の遺伝子座(locus)に重複して挿入することにより、テンプレートDNAやパリティチェック、エラー訂正アルゴリズムを必要とせず、DNAからの安定したデータの読み出しが可能なことを示した

DNAへのデータの書き込みのアイデア自体は比較的シンプルである。Shift KeyとSpace Keyを含む「E=mc^2 1905!」というメッセージはKeyboard Scan Codeに従い%で区切られた16進コード(Hexadecimal Code)に置換される。1桁の16進数は4桁の2進数で表されるため、同じ文字列を示す2進コード(Binary Code)は図Aの一番下のようになる。図Bは上記のメッセージをDNAにエンコードするのに利用されるEncrption Keyを示している。DNAはアデニン(A)、グアニン(G)、シトシン(C)、チミン(T)の4つの塩基から構成されるので、4bitを2つの塩基の組み合わせ(ジヌクレオチド dinucleotide)で表すことができる。図Aの2進コードを図BのEncryption Keyに従って置き換えてやれば、塩基配列によって「E=mc^2 1905!」を表すことができる。

ここからが本研究の独自な点となるが、データに十分な冗長性をもたせるために、図Cに示すように、1bitずつシフトして4つのDNAカセットC1, C2, C3, C4を作る。そしてこれらの4つのDNAカセットは、図Dに示すようにpHASH202もしくはpHASH203プラスミドにサブクローニングされ、枯草菌のゲノムに挿入される。こうすることでメッセージを構成する各1bitの情報は4つの塩基列によりエラー訂正に十分な冗長度をもって保持されることとなる。研究グループでは、コンピュータシミュレーションを行い、このデータの持続性の検証を行っている。コンピュータシミュレーションでは、4組の異なったヌクレオチドカセットを、対応するビットに換算したデータ長で100から10,000まで変化させて10,000セット用意した。ヌクレオチド配列はコンピュータシミュレーションにより、その一部をランダムに変異したり消失したりし、対応するビットデータも変化する。それぞれのセットに対し、4つのカセット配列に対する変異/消去確率を変えて、データの復元率を見積もった。

次のグラフがその結果である。15%以下の変異/消去確率において4つのカセットを用いた場合のデータ復元率は99%を超えている。さらにデータの破損箇所に関しては、各カセットにおける塩基配列から簡単に特定することができるという。簡単に推測できるように、より高い信頼性が必要とされる場合には、RAIDで用いられるアイデアを応用することで、簡単に復元性や冗長性を向上させることができる。

計算上は10文字ほどのデータであれば、枯草菌が世代交代を続けても数百〜数千年は保存できることになる。枯草菌は芽胞 (spore)を形成することで極限環境耐性があることが知られている。たとえば、100℃での煮沸によっても完全に死滅させることが出来ず、芽胞を高温で死滅させるには滅菌処理(sterilization)が必要となる。また高温以外にも、消毒薬などの化学物質やX線などに対して芽胞は極めて高い耐久性を示す。そのため、過酷な環境であっても数百年はデータが存続することが期待できるという。

遠い将来には重要なデータはバクテリアにバックアップするということになるかもしれない。また、宇宙から飛来した隕石に地球外由来のバクテリアが発見されて、その遺伝子(に類するモノ)を調べると興味深いデータが埋め込まれていることがわかった…なんてことが起こるかもしれない。ヒトゲノムの95%はタンパク質形成に無関係な塩基配列だと言われているが、その95%になんらかの情報が埋め込まれている可能性だって無いわけではない。まあ、保護者の連絡先を遺伝子配列に埋め込んだ子供を作ることができれば、迷子がいなくなっていいかもしれないな。