テキスト全文
DNAストレージの基本概念と特徴
#1. DNAコンピュータ勉強会 ~ 第3回:DNAストレージ~
#2. DNAストレージとは • DNA分子を媒体に用いたストレージ技術 • 従来のストレージに対して圧倒的に高密度か つ安定であるのが特徴 • 1gあたり0.46ZBのデータ量(理論値) • 215PB/gまで実現されている
DNAストレージの歴史と進展
DNAストレージの手法と課題
#7. 手法 1. デジタルデータを符号化する 2. DNA鎖を合成する 3. DNA鎖を読み取る 4. 元データを復元する DNA-Based Storage: Trends and Methods, 2016 IEEE
#8. DNAストレージの課題 • DNA鎖合成や読み取りでエラーが発生しやすい • G/Cが多いと二本鎖の水素結合エネルギーが強く、また特殊な構造をとってし まうことがある • 同じ塩基が連続している領域は読み取りでエラーが発生しやすい • 読み取りの際に領域丸ごと抜け落ちることがある • そのため、符号化の時点でこれらを避ける必要がある
#9. DNAストレージの課題(CONT.) • • ランダムアクセスが苦手 • あらかじめ始点・終点の目印をつけておいた領域を全部読むしかない • そのため、細かくデータを分割して保存する必要がある DNA鎖合成に非常にコストがかかる • 読み取りに対して合成の需要が少ないため技術的進歩が遅れている • そのため、需要増の施策によって技術を進歩させる必要がある
ステガノグラフィとDNAデータ保存の論文
#10. 論文紹介 Hiding messages in DNA microdots Nature, 1999 Catherine Taylor Clelland, Viviana Risca, Carter Bancroft
#11. 概要 • ステガノグラフィをDNA鎖で実現 • ステガノグラフィの存在に気づいたとしてもプラ イマーが分からなければ読み出せない • 23文字をDNA鎖に格納し、紙に印字された終止 符に接着剤でつけてメール便で郵送したところ、 送付先で読み出しに成功
#12. 論文紹介 Next-generation digital information storage in DNA Science, 2012 George M. Church, Yuan Gao, Sriram Kosuri
高密度化とエラー耐性の研究
#13. 概要 • 複数のDNA鎖に分割してデータを格納することで大量データ(5.27Mbits)の保 存に成功 • 1本のDNA鎖にはアドレス情報と分割されたデータを格納 • A/Cを0、G/Tを1に割り当て、G/Cが多くなりすぎないように、かつ同じ塩基が 連続しないようにエンコードすることでエラー率を下げている • 著者のGeorge Churchは現在もDNAストレージの第一線で活躍中
#15. 論文紹介 Towards practical, high-capacity, low-maintenance information storage in synthesized DNA Nature, 2013 Nick Goldman, Paul Bertone, Siyuan Chen, Christophe Dessimoz, Emily M. LeProust, Botond Sipos, Ewan Birney
#16. 概要 • 符号化手法の改良により高密度化(2.2PB/g) • 冗長性(4重)を持たせてエラー耐性も強化 • 論文の中でコスト計算をしているのが特徴的
コストとDNA合成手法の課題
#17. コスト • コストの98%がDNA鎖合成にかかった • エンコードコスト:$12,400/MB • デコードコスト:$220/MB • Human Genome Projectをきっかけとし てシーケンサの進化は著しいが、一方で 合成の需要が少ないため技術的進歩が遅 れているという課題感がある
#18. DNA鎖合成手法 DNA-Based Storage: Trends and Methods, 2016 IEEE
#19. 論文紹介 A DNA-Based Archival Storage System IEEE, 2016 James Bornholt, Randolph Lopez, Douglas M. Carmean, Luis Ceze, Georg Seelig, Karin Strauss
#20. 概要 • 基本はGoldman論文を踏襲 • 単純な4重冗長化ではなく、XORエンコードでRAID5likeな冗長化を行い、これによりさらに高密度化を実現 • MicrosoftがDNAストレージに参入 • シーケンシングにナノポア(MinION)を採用し、ポー タビリティと速度の向上を目指している • Twist Bioscience社に大量のDNA合成依頼をし、DNA 合成技術の進化を促そうとしている
最新のDNAストレージ技術と応用
#21. 論文紹介 DNA Fountain enables a robust and efficient storage Science, 2017 Yaniv Erlich, Dina Zielinski
#22. 概要 • 現時点で最も高密度な手法 • 噴水符号(Fountain code)を採用することで高密度化を実現(215PB/g) • 誤り訂正にはReed-Solomon符号を利用 • 参考資料:噴水符号を用いたDNAストレージの大容量化・高信頼化
#23. 論文紹介 CRISPR-Cas encoding of a digital movie into the genomes of a population of living bacteria Nature, 2017 Seth L. Shipman, Jeff Nivala, Jeffrey D. Macklis, George M. Church
#24. 概要 • ゲノム編集を用いて大腸菌に動画データを保存 • 追記を繰り返しても全て保存されている状態を実現 • 生体内での発現イベントを自動で保存し続けるレコーダーの開発を構想している
まとめと今後の展望