加入时间:2024-05-21 17:59 访问量:1457 信息来源: 大自然探索 2024年1期
如果有科学家问你,愿不愿意把自己演唱的歌曲存进玉米粒里,他很可能是认真的。这种能把数据存储进生物DNA并长时间保存的技术,名为“DNA存储”。
近期,天津大学的研究团队成功将10幅珍贵的敦煌壁画存储于DNA中。据称这种存储方式能让这些数据被保存长达两万年。这项突破性的成就让人惊叹,原来生物DNA不仅能传承生命,还可以像硬盘一样储存图像、文字和视频数据。
其实,早在1988年,一名美国艺术家就将名为“小维纳斯”的图像嵌入大肠杆菌的DNA中。2013年,英国科学家成功将莎士比亚的《十四行诗》和一段演讲片段的文本信息嵌入DNA中。2019年,一家美国公司甚至将16GB的百科资料存储于DNA中。
DNA存储:高存储密度和长久稳定性
作为数字信息存储介质, DNA拥有不可思议的存储密度和极佳的稳定性——其存储密度比目前最先进的固态硬盘高1000倍,如果保存在阴凉干燥的地方,DNA可以保存数十万年。
DNA存储数据的原理类似硬盘,但过程稍有不同。DNA双链是由腺嘌呤、胞嘧啶、胸腺嘧啶和鸟嘌呤四种基本核苷酸组成的,我们将它们简称为A、C、T和G,它们就像传统存储介质中的0和1一样。通过简单的对应转化关系(例如A=01 、T=11、C=10 、G=00),我们就得到了核苷酸版本的数字信息序列。例如,要将手机上的一张图片的二进制信息转化为核苷酸序列,假设文件的前八位是 01111000,与之对应的核苷酸序列就是ATCG,后面的信息以此类推。以人工方式合成特定序列的DNA长链条,就能将数据存储进DNA,需要读取的时候,再通过DNA测序,解读出被保存在DNA中的信息。
存在困难 有待攻克
不过,目前人工合成的DNA单链长度不超过100个核苷酸,能够编码并存储的二进制信息满打满算不过50B。
许多计算机文件的大小都在GB和TB级别,大型数据库的存储量则要以PB、EB甚至ZB计算。如何让短小的DNA存储如此大的文件信息?
要解决这个问题并不难,我们可以将需要存储的数据分割成小段,并为每段添加一个序列标记。当需要读取DNA存储的信息时,按照序列标记读取即可。
目前DNA存储的成本还非常高,平均合成1MB 数据需要两万元人民币,读取数据的成本稍低,但1MB也需要数千元。高昂的成本导致DNA存储无法快速普及,同时DNA低效的存储效率也阻碍了它的大规模应用。因此,现阶段DNA存储介质更适合存储一些需要长期存档、不需要频繁更改的“冷数据”。
不过话又说回来,在技术飞快迭代的大背景下,谁能说几年后DNA存储不会替代传统存储方式呢?那些动辄就占好几个足球场大小、每天需要数千吨海水冷却、消耗大量电力的传统数据库,说不定很快就会被几个装着DNA储存介质的手提箱所取代。