突破!DNA上存储数据成为现实

中宜云控
现在研究人员已取得了重大突破,他们因而能够将DNA存储整合到PostgreSQL这种流行的开源数据库中。法国通信系统工程师学校与研究中心(Eurecom)数据科学系助理教授Appuswamy和伦敦帝国理工学院SCALE实验室负责人Heinis最近发表了DNA存储方面的开创性成果。

几年前,连研究人员都不愿使用DNA来存储数据,觉得这么做太超前了,不具有任何实用价值。今天,你可以使用合适的软件和生化模块来扩展PostgreSQL,并在DNA上运行SQL。

当下全世界的数据浪潮来势凶猛,不仅超出了我们理解数字和衡量单位(比如泽字节)的能力,还超出了我们存储海量数据的能力。一切都变得数字化,一切都在基于算法的应用软件上运行,这些算法拿数据来训练,反过来生成更多的数据,馈送给为更多的下游应用软件和算法……结果可想而知。

简而言之,按照这种步伐,很快就没有足够的数据存储和计算材料以满足需求。这就是为什么人们现在一直在寻找替代的存储介质以存储数据。

现在研究人员已取得了重大突破,他们因而能够将DNA存储整合到PostgreSQL这种流行的开源数据库中。法国通信系统工程师学校与研究中心(Eurecom)数据科学系助理教授Appuswamy和伦敦帝国理工学院SCALE实验室负责人Heinis最近发表了DNA存储方面的开创性成果。

DNA是一种信息编码机制

究其核心,DNA是一个数据存储层。DNA由四种基础部分组成:腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶(又名AGCT)。DNA由这四个碱基组成三个核苷酸形成的三联体(名为密码子)。密码子是给人体细胞下达蛋白质形成指令的单位。

我们的信息技术基础设施基于以比特(包括两个数字:0和1)来存储信息,而DNA信息存储在四个潜在碱基单位的串中。为了将非遗传信息存储在DNA中,我们必须先将二进制数据从比特转换成DNA数据的四单位(AGCT)结构。

理论部分实际上相当简单。与使用硅或磁性介质(其工作原理基于将状态存储为1和0序列的能力)一样,我们可以使用DNA,存储A、G、C和T组成的序列。但是这实际上如何运作?——该如何将数据写入到DNA和从DNA中读取数据?

这可能听起来太过遥远,但分子技术的进步使其变得切实可行,尽管并不称心如意。这一切意味着,确实能够以一种可以在DNA上存储和检索信息的方式来编码信息,分别利用DNA合成和DNA测序。

DNA是数据的未来吗?

尽管技术堆栈的某些部分还不成熟,但这是一项重大突破。让已有的数据中心拥有充足的存储资源可以改变游戏规则。但将DNA这种数量充足的材料充当存储和计算的可行介质具有重大影响,远非我们所能想象。

这可能只是朝这个方向迈出的第一步,但每段旅程都从第一步开始。Heinis和Appuswamy并非单枪匹马开展这项工作。他们的项目OLIGOARCHIVE一直在取得进展,这归功于与法国蔚蓝海岸大学(UCA)和CNRS的其他研究人员进行合作,因而得以壮大研究团队,并扩大研究范围。

将数据存储在DNA中方面的进一步研究将得到欧盟的资助。

在这项技术方面获得优势可能意味着主导未来,因为这个领域的突破将带来巨大影响。Appuswamy和Heinis特别指出,人们的态度表明了这一点:“几年前,人们会觉得这遥不可及。而今天,我们告诉他们我们在做的工作后,他们的态度是‘告诉我们更多’”。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论