Nature Biotechnology | 通过合成和长度选择纯化多重寡核苷酸文库的方法—MOPSS
复杂的寡核苷酸(oligo)文库是合成生物学、药物生产和基于DNA的数据存储等多种应用的基本材料。虽然oligo文库可以使用基于微阵列的合成器以低成本化学合成超过100万个寡核苷酸的复杂寡核苷酸库,但容易出错。其中,单碱基插入缺失(indel)是最常见的出错类型,遗传或蛋白质工程中的单碱基indel会改变阅读框,导致空蛋白或敲除蛋白的再翻译。为了最大限度地利用寡核苷酸库,需要进行质控。
无错误寡核苷酸和含indel寡核苷酸之间的迁移率差异,可以通过聚丙烯酰胺凝胶电泳 (PAGE)或高效液相色谱(HPLC)消除含有单个克隆的寡核苷酸制剂中的插入缺失。但这些方法对于由数千个寡核苷酸组成的复杂文库是不够的,因为纯化分辨率随着复杂性的增加而降低。在高度复杂的寡核苷酸库中,单碱基indel很难识别。此外,上述方法不能同时纯化不同长度的寡核苷酸。但在许多情况下,例如合成抗体筛选,需要使用具有多种长度的复杂寡核苷酸文库。
虽然通过引入基于纠错酶的方法可以改善oligo文库构建,但由于酶促纯化方法需要杂交步骤,因此不适用于高度复杂的寡核苷酸文库的纯化。使用高通量焦磷酸测序的纯化方法通过识别每个寡核苷酸的序列,选择无错误寡核苷酸,大大降低了错误率。但这一选择过程是通过珠分离或聚合酶链反应(PCR)与序列已知的条形码来执行的,该选择过程费力和效率低下限制了其广泛应用。
近日,韩国首尔国立大学的Sunghoon Kwon研究团队开发了一种用于纯化高度复杂的不同长度寡核苷酸文库的方法,并在Nature Biotechnology杂志上发表了题为《Purification of multiplex oligonucleotide libraries by synthesis and selection》的研究文章。为正确高效地合成寡核苷酸文库,研究团队开发了一种基于长度的选择方法—MOPSS。这是一种可区分全长寡核苷酸和具有indel寡核苷酸的方法。MOPSS可以逐步手动执行,也可以使用下一代测序仪进行。结果显示,用于含相同长度寡核苷酸数据库的构建时,MOPSS可将全长寡核苷酸的纯度从83%提高到97%。同时,MOPSS的另一大优势在于,编码互补性决定区的三种不同长度的文库可以在一个体系中同时纯化,从而将框架内寡聚物分数从49.6%增加到83.5%。
来源:Nature Biotechnology
寡核苷酸的结构由设计区和两端20 bp的通用引物区组成(图1a)。由于合成错误,文库中相当一部分寡核苷酸包含indel。通过引物杂交开始纯化,然后通过使用具有可逆终止子的核苷酸偶联,并且无错误寡核苷酸到达生物素修饰的核苷酸结合区(图1b)。生物素修饰的核苷酸结合区位于通用引物区,因此纯化不受序列或设计区长度的影响。任何类型的生物素修饰的核苷酸均可用于纯化。在这项最新研究中,研究人员使用了生物素修饰的dATP。虽然偶联核苷酸的数量相同,但如果分子被截断,生物素-dATP结合区将会进行;如果存在indel,则需要额外的循环。最后,将生物素修饰的dATP与全长寡核苷酸偶联,并使用链霉亲和素磁珠进行纯化。最终生物素没有与具有插入缺失的分子偶联,因为偶联周期是不同步的(图1c)。
图 1.MOPSS通过长度改变的寡核苷酸来识别无错误寡核苷酸。来源:Nature Biotechnology
研究团队设计了一个概念验证实验,混合了两种不同的寡核苷酸(图2a),相对较短的寡核苷酸被视为截短寡核苷酸,而较长的寡核苷酸被纯化。带有终止子的核苷酸通过重复偶联与分子偶联45次,然后生物素-dATP与更长的寡核苷酸偶联(图2b)。对纯化后的寡核苷酸进行NGS分析,无错误寡核苷酸占分子总数的95.2%,纯化前为53%(图2c)。
图 2.柱合成的低聚物在玻璃上纯化。来源:Nature Biotechnology
研究团队通过将NGS运行适当数量的循环,偶联预期数量的核苷酸。将MOPSS应用于由具有更高复杂性(4,503个片段,160 bp)的较长寡核苷酸组成的寡核苷酸文库,全长寡核苷酸的比例从56%增加到82.1%(图3c)。通过有意添加具有高GC含量(>70%)、短串联重复序列(STR)或微卫星序列的寡核苷酸,研究人员分析了纯化前后全长寡核苷酸的分数。无论重复长度如何,带有STR或微卫星的寡核苷酸的全长纯度都会增加(图3d)。因此,MOPSS可广泛应用于各种应用的寡核苷酸库。
图 3.使用NGS仪纯化具有高度复杂性的微阵列合成寡核苷酸文库。来源:Nature Biotechnology
研究团队设计了oligo库来编码一个854字节的文本文件。由于在数据编码区中使用简并碱基,文库的理论多样性为1010。结果表明,纯化后全长纯度从83%增加到97%(图4b)。其中,长度纯度最低的数据显示出最高的纯化。因此,该结果验证了MOPSS可以应用于质量较差的文库。全长纯度在基于DNA的数据存储中很重要,带有indel的寡核苷酸在测序后被过滤掉。因此,如果NGS覆盖率相同,纯化后序列多样性以及不同序列的数量将增加。研究人员通过将每个分子的平均NGS覆盖率从100更改为500来分析多样性,发现文库的多样性在纯化后得以保留和增加(图4c)。
图 4.MOPSS应用于数字数据编码寡核苷酸文库。来源:Nature Biotechnology
研究团队设计并纯化了一个具有多种长度的寡核苷酸文库,编码互补决定区(CDR)H3,这是抗体库中最多样化的区域(图5b)。该文库中存在三种不同的长度,长度差异分别为3bp和6bp。如果引入更多生物素修饰的核苷酸结合区,可以纯化具有更高长度多样性的文库。研究数据显示,通过统一体系纯化CDR H3区编码文库,纯化后框内寡核苷酸的比例从49.6%增加到83.5%(图5c)。为了确定具有3-bp indel的寡核苷酸的影响,研究人员分析了与设计匹配的寡核苷酸比例,该比例从40.7%增加到68.1%(图5d)。由于MOPSS的低indel和高通量,所有文库的多样性增加(图5e)。
图5.MOPSS应用于CDR H3组合文库。来源:Nature Biotechnology
总的来说,MOPSS与oligo文库兼容,不需要任何额外的设计或纯化序列。由于MOPSS使用引物区中的碱基,因此可以轻松设计纯化并且不需要额外的序列。使用测序仪对文库进行纯化,可以自定义测序条形码区域,或者可以设计自定义引物。因此,MOPSS可以满足各种生物技术应用对高纯度寡核苷酸文库的需求。
参考资料:
Choi, H., Choi, Y., Choi, J. et al. Purification of multiplex oligonucleotide libraries by synthesis and selection. Nat Biotechnol (2021). https://doi.org/10.1038/s41587-021-00988-3
咨询
我们尊重知识产权,如您认为本平台所载文章、图片、视频等内容侵犯您的合法权益,请您及时联系我们,我们将依据相关法律法规、平台规则予以处理。
关键字
- 139
- 点赞
- 复制链接
- 举报