Small Structures:DNA结构条形码的复制和随机存取

剑桥大学卡文迪许实验室的Ulrich F. Keyser课题组构建了利用DNA结构来存储数字信息的DNA结构条形码,并实现了这种数字信息载体的复制和随机存取,利用纳米孔可以方便的读出其中的数字信息。该方法可被用于作为生物分子条形码以及基于DNA结构的DNA数据存储。

DNA是生命的遗传物质,自1953年DNA的双螺旋结构被当时在剑桥大学卡文迪许实验室工作的詹姆斯·沃森和弗朗西斯·克里发现以来,DNA被广泛的研究。近年来,DNA越来越多的被用作纳米材料,可以被用于构建DNA纳米结构、DNA存储和DNA计算等应用。DNA数据存储具有高密度、低能耗、长寿命的优点,且易于复制,但直接利用DNA序列存储数据意味着要合成大量的DNA序列,成本较高,所以目前还没得到广泛的应用。在一条DNA双链上构建DNA纳米结构也可以实现数据(0和1)在纳米结构上的存储,这种方法在Ulrich F. Keyser课题组之前的研究中已作介绍(Nano Lett. 2019, 19, 2, 1210–1215)。这种方法的优点是可以利用已有的DNA短链进行组合和拼接(如乐高积木一样),构建纳米结构,从而不需要合成大量不同序列的DNA。同时,这种DNA结构条形码也可被用于标记不同的生物样品。对于存储数据和作为条形码,很重要的一个功能是其可复制的能力。本研究通过将构成DNA结构条形码的不同短链连接起来,然后利用聚合酶链式反应(PCR),实现了这种结构的复制。

首先,研究者构建了基于DNA纳米结构的条形码。类似于构建DNA折纸(DNA origami)的方法,通过将一条长的DNA单链–DNA scaffold(ss M13mp18 DNA, 7249 nt)与不同的互补的短链(长约30-50 nt)通过杂交形成。如果所有短单链都与DNA scaffold的序列互补并覆盖整个DNA scaffold的长度,那么将会形成一条DNA双链。如果在特定的位置的短链上设计小的DNA结构,那么最后会形成一条载有DNA结构的DNA双链。通过控制这些结构的位置和有无(对应0和1),我们可以将数字信息存在这种DNA双链载体中,也就是我们用到的DNA结构载体(DNA结构条形码)。

为了实现这种结构载体的复制和对于其中特定的条形码的复制及访问,可以利用PCR对其进行扩增。研究组将没有被连接的短链利用DNA连接酶将他们连接起来,这样就形成了连续的DNA链,从而可以对整个DNA载体进行复制。如果我们想对于一个混合有多种DNA条形码的其中一个或几个进行分析,那么我们就只需对这几种进行复制。为了实现这个目的,研究者对于不同的DNA条形码设计了不同的末端,这样的话,利用加入特定的引物,就可以实现对相应的条形码或数据进行复制,从而实现了可随机访问。

这种基于DNA载体的DNA条形码,可被用于标记样品,实现对特定目标物的追踪。同时,利用载体上的DNA结构作为一种DNA存储的方式也具有优点,这样的DNA存储方式不需要合成大量的新的DNA序列,只需对已有的序列进行组合,在同一位置可以选择利用代表0或1 的结构,从而降低了写入新数据的难度。另外,这种带有数字信息的DNA载体,很容易被纳米孔准确的读出数据,实现快速和低成本的读写。

论文第一作者为剑桥大学卡文迪许实验室博士生Filip Bošković,通讯作者为Ulrich F. Keyser教授和陈凯凯博士。研究得到了ERC consolidator grant (DesignerPores No. 647144)的支持。

论文信息:

DNA Structural Barcode Copying and Random Access

Filip Bošković, Alexander Ohmann, Ulrich F. Keyser*, Kaikai Chen*

Small Structures

DOI: 10.1002/sstr.202000144