由于长序列的合成DNA结构脆弱并且难以读取信息,所以单个DNA片段最多存储200个碱基序列信息。同时,为了避免所有的DNA片段乱糟糟的纠缠在一起没法还原信息,研究者为每个DNA片段设计了额外的“头指针”和“尾指针”序列,以便于在组装读取信息时能够正确的找到首尾相接的片段以及其从属的文件。
步骤3:制造DNA 利用DNA测序仪器,将ATCG碱基序列变为合成DNA分子链。将获得的多个200碱基长度的DNA分子链脱水并冻干成粉末存储到小试管中。
步骤4:建立数据库 每个小试管存储1立方毫米的DNA粉末——大约100万亿个DNA分子链,而100个小试管存储大约1EB数据。为了便于对比,Facebook计划的1EB数据存储的计算机服务器将占据6.2万平方英尺的数据中心,而粉末DNA只需要存储到CD大小的格子盒里,每一个盒子大约能存储几千个小试管。
步骤5:检索数据 由于每个小试管中存储的数据量大到不可思议,必须用非常复杂的DNA聚合酶链反应作为一种“索引函数”来定位特定的DNA序列链。近年来,DNA测序仪器越来越快,并且越来越便宜,用于最后确定每个DNA片段上的碱基序列。
步骤6:逆编码 代码程序分析每一个DNA片段,利用每个片段的识别指针将各个片段信息首尾相接起来,形成原始文件完整的碱基序列编码。前述编码转换程序反过来将生物碱基编码转换为二进制编码,进行数据还原。 数据存储急需革命 此外,对于欧洲热点问题“数据主权”,管理者不断对握有敏感信息的公司——例如,金融服务公司、医疗机构等——施压,要求其进行本地信息存储以防泄密。那么,像DNA这样的便捷、经济的数据存取技术,将极大地改善这种情况。最终,DNA数据存储将以其低成本、生态友好性取代大型服务器工厂。 也许更重要的是,DNA作为数据存储介质更胜一筹的原因在于其使用寿命和耐用性。通常的数字数据存储介质,总是不堪一击的脆弱。硬盘和闪存驱动器总是毫无预警的崩溃,甚至一些只有几年的寿命。磁带和DVD或许寿命更长一些,但终究不是无限期的。 相比之下,假如数据存储在DNA中,给予合适的冻干条件,存储寿命长达几千年之久! 尽管DNA数据存储的概念非常标新立异,但是该技术从实验室研究阶段走向日常应用还需要数年、甚至数十年的研究和发展。 该技术复杂的过程,尤其是生产合成DNA,非常昂贵。目前来说,合成DNA技术暂时还不会出现像DNA测序技术的价格随需求量激增而下降的趋势。但是,如果研究者能够证明DNA数据存储的有效性,或许能够激发相似的市场动态变化。 参考: ?articles.view/articleNo/47351/title/DNA-as-an-Artistic-Medium/ (责任编辑:本港台直播) |