从生物学到有机化学:数据存储的灵感,用分子实现听说读写画

BigDataDigest
大数据文摘
信息爆炸,数据井喷,可能未来连云存储也无法承载,而且它无法阻挡住所有黑客,还会持续消耗能量。据估计,到2020年,全球数字化档案估计将达到44万亿Gb,数字化海啸马上就要席卷而来,浪潮之下,我们应该如何面对海量信息?

我们怎样存储信息?

写下来的纸张会被焚毁,电脑可能会被黑,DVD可能会无法读取。威胁无处不在,从简单的一盆水到复杂的网络攻击,都有可能让我们的记录化为乌有。

信息爆炸,数据井喷,可能未来连云存储也无法承载,而且它无法阻挡住所有黑客,还会持续消耗能量。据估计,到2020年,全球数字化档案估计将达到44万亿Gb,数字化海啸马上就要席卷而来,浪潮之下,我们应该如何面对海量信息?

哈佛信息服务中心的计算机存储架与笨拙的数据线

现在,有一种存储信息的新方法可以稳定地存储数百万年的数据,并且不受到黑客的威胁。

它的占用空间非常小,想象一下用一勺蛋白质就可以保存整个纽约市公共图书馆的资料,一锅蛋白质就可以容纳所有地球往事。并且一旦编写,就不会再消耗能量。所需要的只有一个化学家,一些易得的分子和需要存储的信息。

这是哈佛大学与西北大学合作开发的一个项目,研究结果已经在国际学术期刊ACS Central Science发表。该项目提出并实现了利用易获得、低能耗、稳定且能超长时间保存的寡肽分子存储数据(以二进制形式),数据检索准确率超过99%。

从生物学到有机化学:数据存储的灵感

利用生物存储能力来存储数据的想法早已有之,并且已经有了一定的进展。比如,目前我们已经可以通过合成DNA链来记录信息,记录的信息可以从美食照片,烹饪教程一直到撸猫视频。

但是虽然DNA与计算机芯片相比较小,但还是属于大分子。并且,DNA的合成需要大量重复的劳动。如果每条消息都需要从头开始设计编译,那么大分子存储可能会因为过于昂贵耗时而无法实现。

Brian Cafferty

Brian Cafferty,该研发团队的成员之一,也是论文的第一作者介绍说,于是他们的研究团队从生物学转向有机和分析化学寻求灵感,开发使用一种更小、更低分子量的分子来编码信息的方法。

这种存储方式只需一次合成就可以生成足够的小分子,用以编码多个视频,使这种方法无疑比基于DNA的方法更省力也更便宜。

用分子实现听说读写画

该团队选择的低分子量分子是寡肽(两个或多个结合在一起的肽),这些肽常见而稳定,并且比DNA,RNA或蛋白质分子量都要小。

而且由于组成寡肽的氨基酸数量和类型不同,它们的分子质量是有差异的。当不同的寡肽分子混合在一起时,这种差异可以实现相互区分,不同质量的分子就像字母表中的不同字母一样。

将这些“字母”组成单词会有点复杂,该团队将不同质量的寡肽存储在384个不同的“微孔”中,然后将寡肽混合物放置在金属板的表面上,就像将墨水印在书页上一样。如果想要读取“写下”的内容,可以通过质谱仪按质量对微孔中的分子进行分类,查看这个孔中存在哪些寡肽、不存在哪些寡肽,由此读取内容。

然后团队使用二进制编码将混乱的分子翻译成字母和单词。例如,字母“K”在ASCII(美国信息交换标准代码)中被写作01001011,就可以通过使用八种不同质量的寡肽存储“K”。将微孔中存在的四种寡肽读取为“1”,而缺失的四种读取为“0”(如下表)。这些分子二进制代码指向相应的字母;如果存储的信息是图像,则指向相应的像素。使用这种方法,八种寡肽的混合物可以存储一个字节的信息; 32种寡肽的混合物可以存储四个字节,以此类推。

更快,更便捷,更安全

到目前为止,Cafferty和他的团队已经用这种方法记录、存储并“阅读”了物理学家Richard Feynman的着名演讲、Claude Shannon(他被称为“信息理论之父”)的相片和葛饰北斋的画作《神奈川冲浪里》。

名画《神奈川冲浪里》

经检验,这种存储方式的检索准确率为99.9%。平均“写入”速度为每秒8bits,“读取”速度每秒20 bits。虽然目前还比大多数数据存储设备要慢,但随着技术的继续发展,速度肯定还会提升。例如,如果喷墨打印机可以以每秒1,000次的速率产生液滴,就能将更多信息塞入更小的区域,或者再加以改进质谱仪使之可以同时获取更多信息。

未来,还可以通过引入不同类别的分子,提高存储的稳定性和容量,并降低成本。实验中使用寡肽是定制的,因此价格较贵。但未来还可以考虑可以购买更便宜的分子(如烷硫醇),实现花1美分就可以记录1亿比特的信息。

“目前,这种方法还不会取代现有的数据存储方法,”Cafferty说,“我们认为它是对现有技术的补充,非常适合长期存档数据存储。”Cafferty团队提出的分子存储方法是一种稳定的、零能耗、抗腐蚀的存储可选方案。

寡肽等分子具备复原能力,可以在数百年甚至数千年的时间内保持稳定性。在高温和干旱的情况下,这些分子可以在没有光或氧的情况下存活下来。而且,黑客无法像攻破云存储那样窃取分子存储的内容,分子存储只能通过人工访问。即使被发现藏匿的数据,小偷也需要拥有足够的化学知识才能实现代码检索。

所以未来,即使所有的书都付之一炬,所有的计算机都被黑了,所有DVD都被毁坏,这些分子可能还会继续存在,提醒未来的人类,我们曾经是多么喜欢那些萌萌的猫咪视频。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论