具有文件和元数据的基于DNA的存储系统

2021-06-16 04:13:11

基于DNA的数据存储似乎为人类创建的一些问题提供了解决方案'我们不断增长的能力创建我们想要挂断的数据。与大多数其他媒体相比,DNA提供了现象数据密度。如果储存在正确的条件下,它就不需要任何能量来维持几个世纪的数据。由于DNA'对生物学的中心性,我们始终可能会保持阅读它的能力。

但DNA没有没有缺点。目前,没有在DNA链的碱基模式中编码位的标准方法。合成特异性序列仍然昂贵。使用当前方法访问数据速度慢并耗尽用于存储的DNA。尝试太多次访问数据,您必须以某种方式恢复它 - 一个风险引入错误的过程。

基于麻省理工学院和广泛研究所的团队决定解决一些问题。在此过程中,研究人员创建了一种基于DNA的图像存储系统,它是文件系统和基于元数据的数据库之间的某个位置。

最近用于在DNA中存储数据的系统(例如我们' VE覆盖的一个)涉及将特定的序列标签添加到包含数据的DNA的延伸中。要获取所需的数据,只需添加可以与右侧标记基对的DNA的位,并使用它们来放大完整序列。想想它就像用ID的集合中标记每个图像,然后将其设置为,以便只放大一个特定ID。

这种方法是有效的,但它有限于两种方式。对于一种,使用称为PCR的过程进行的扩增步骤具有可以放大的序列的尺寸限制。每个标记都占用了一些有限的空间,因此添加了更多详细的标签(可能需要的复杂文件系统所需的标签)切入数据的空间量。

另一极限是扩增含有特定数据的DNA的PCR反应消耗一些原始DNA文库。换句话说,每次拔出一些数据时,都会销毁堆的无关数据。往往足够访问数据,并且您' ll最终通过整个存储库燃烧。虽然有方法来重新放大所有内容,但每次完成这一切时,它都会增加引入错误的可能性。

新研究已将标签信息分开,从数据存储中分开。此外,研究人员创建了一个系统,它可以只访问DNA数据的系统'重新感兴趣并留下其余的数据,为数据存储提供更大的寿命。

基本技术基于DNA将粘附二氧化硅玻璃珠。这种吸引力与DNA的大小无关,因此您可以使用此系统存储任意大块数据(在这种情况下,碎片超过过去使用的DNA数据存储典型块的尺寸超过10倍)。同样重要的是,DNA中没有存储在数据中的标签,因此数据存储和文件系统之间没有竞争。

一旦DNA在这些珠子的表面上,研究人员就在其顶部聚合了一些额外的二氧化硅。该过程涂覆DNA并保护其免受环境。使用荧光标签,研究人员证实系统有效;本质上,所有颗粒都含有DNA。

只有在进行这个外壳后,研究人员只添加了标签,这些标签与外壳化学连接。标签由单链DNA制成,并且可以具有连接到单个玻璃壳的几个不同的标签。

虽然研究人员单独处理每个数据块的过程,但一切都已到位,标记的玻璃球可以混合到单个数据库中。虽然不如纯DNA的储存那么紧凑,但图书馆仍然具有稳定的优点,并且不需要能量进行维护。

但有趣的部分正在访问数据。研究人员在DNA中存储了关键词相关的图像集合,在连接到玻璃壳的外部的DNA中编码的每个关键字。要使用他们的示例,橙色宠物猫的图像将与关键字&#34相关联;橙色," "猫,"和#34;国内,"虽然老虎的形象只会"橙色"和#34;猫。"

因为这些标签是单股的,所以可以设计与其形成双螺旋的匹配序列。标签与不同颜色的荧光分子相关联,使得与右侧标签连接的任何玻璃壳都将开始发光的特殊颜色。我们已经有机器使用激光器根据它们发光的颜色(通常,机器用于对荧光标记的细胞进行分类)来分离事物。在这台机器中,橙色的猫珠将在不同的波长下焕发,而不是橙色猫珠,所以房子猫可以被拉出图书馆。

图书馆的其余部分将保持不受影响,所以每次发生此过程时都没有显着的数据损失。而且,因为珠子比水更密集,所以通过使用离心机将图书馆的未使用部分旋转到试管的底部来再次将数据存储器更加密集。

一旦分离出,使用玻璃蚀刻溶液释放DNA,然后可以将其插入细菌中。设置用于储存的DNA以允许细菌制作大量的副本来阅读数据。

所有这些的一个整洁方面都是它允许布尔搜索多个术语。通过一个接一个地选择或反对不同的标签,您可以建立相当复杂的条件:真正的猫,驯化的假,为黑色,如此。标记具有相同荧光颜色的两个标签将为您提供相当于逻辑的,或者如果您以这种颜色抓住任何颜色。

因为这些标签中的每一个可以被视为关于由DNA存储的图像的一段元数据,所以珠子的集合最终充当元数据驱动的图像数据库。

虽然所有这些都代表了基于DNA的储存的复杂性的显着飞跃,它仍然存在' s仍然,良好的,基于DNA的储存。这意味着它和#39; s慢的速度,使磁带驱动器似乎很快。研究人员计算出来,即使它们在每个玻璃珠中挤压了多次数据,也会开始通过大约1GB的数据开始突出。这意味着搜索数据的矮子性会在两周内需要一点。

那个' s只是找到右玻璃珠。打开它们打开并将DNA变成细菌,然后进行测序需要实际确定存储在珠子中的'可能会在过程中添加几天。

但当然,没有人建议我们使用DNA存储,因为它' speed;正如我们提到的那样,它的良好属性在能源使用和数据稳定方面。我们'如果我们&#39,只能在DNA中储存一些东西;我们赢得了我们赢得了。鉴于这一点,任何使得进入更具功能和灵活性的方法都可能有价值。