一種基于分子反向探針的測序文庫構(gòu)建方法和試劑的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及分子生物學(xué)技術(shù)領(lǐng)域,具體設(shè)及一種基于分子反向探針的測序文庫構(gòu) 建方法和試劑。
【背景技術(shù)】
[0002] 隨著DNA測序技術(shù)的發(fā)展,高通量測序技術(shù)已被廣泛地應(yīng)用于生命科學(xué)研究的各 個領(lǐng)域。盡管隨著測序技術(shù)的不斷更新和普及,測序技術(shù)的成本也越來越低,但全基因組測 序技術(shù)本身的花費還是很昂貴。用來調(diào)和運一問題的一個較好的方案是將感興趣的目標(biāo)區(qū) 域富集出來后再進(jìn)行高通量測序。傳統(tǒng)的序列捕獲技術(shù),通常是將高通量測序文庫構(gòu)建好 后,再利用探針進(jìn)行目標(biāo)區(qū)域的文庫富集再測序。
[0003] WCG(Complete Genomics)測序平臺為代表的測序平臺,需要先構(gòu)建單鏈環(huán)狀文 庫,然后W單鏈環(huán)狀文庫為模板,在滾環(huán)擴(kuò)增引物序列的引導(dǎo)下進(jìn)行滾環(huán)擴(kuò)增,形成DNA納 米球(DNA nanoball,DNB),再進(jìn)行測序。構(gòu)建單鏈環(huán)狀文庫本身是一個耗時、耗力、耗成本 的過程,一般需要經(jīng)過核酸的片段化和選擇處理、片段的末端修復(fù)、3'端接頭和5'端接頭連 接、缺口平移、聚合鏈?zhǔn)椒磻?yīng)(PCR)、單鏈分離和環(huán)化等過程,整個過程最快也需要1-2天,并 且很多步驟都需要進(jìn)行磁珠純化。此外,PCR過程可能引入堿基錯誤,導(dǎo)致測序結(jié)果不準(zhǔn)確。 此后為捕獲目標(biāo)區(qū)域,進(jìn)行雜交還需要2-5天時間。
[0004] 分子反向探針(Molecular Inversion Probe,MIP)技術(shù)是一種核酸目標(biāo)區(qū)域捕獲 技術(shù),能夠用于捕獲感興趣的目標(biāo)區(qū)域,用于下游處理或分析。目前MIP的應(yīng)用方法,主要體 現(xiàn)在通過MIP捕獲目標(biāo)區(qū)域,然后WMIP上所帶有的PCR引物序列進(jìn)行擴(kuò)增得到大量線性擴(kuò) 增產(chǎn)物,根據(jù)需要在PCR引物序列上可W引入測序平臺的接頭序列,進(jìn)而將線性擴(kuò)增產(chǎn)物用 于測序。
[000引目前還未見MIP技術(shù)在W單鏈環(huán)狀文庫為測序?qū)ο蟮臏y序平臺中的應(yīng)用,來解決 單鏈環(huán)狀文庫構(gòu)建耗時、耗力、耗成本并且目標(biāo)區(qū)域富集復(fù)雜的問題。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明提供一種基于分子反向探針的測序文庫構(gòu)建方法和試劑,實現(xiàn)將單鏈環(huán)狀 文庫構(gòu)建和目標(biāo)區(qū)域捕獲融為一體,從而大大縮減建庫流程和周期。
[0007] 根據(jù)本發(fā)明的第一方面,本發(fā)明提供一種基于分子反向探針的測序文庫構(gòu)建方 法,包括如下步驟:
[0008] 使用分子反向探針與變性核酸進(jìn)行退火雜交,分子反向探針包括5'端的錯定序列 和3'端的延伸序列W及錯定序列與延伸序列之間的測序接頭序列,錯定序列和延伸序列分 別與變性核酸中的目標(biāo)區(qū)域兩端的序列反向互補;
[0009] 在聚合酶作用下,W目標(biāo)區(qū)域為模板,從3'端的延伸序列開始進(jìn)行聚合反應(yīng),生成 目標(biāo)區(qū)域的互補序列;
[0010] 在連接酶作用下,將5'端的錯定序列與目標(biāo)區(qū)域的互補序列連接形成環(huán)狀核酸分 子;
[0011] 使用核酸外切酶消化未環(huán)化的線性分子,得到含有目標(biāo)區(qū)域的單鏈環(huán)狀分子。
[0012] 作為本發(fā)明的優(yōu)選方案,上述測序接頭序列為W單鏈環(huán)狀文庫為測序?qū)ο蟮臏y序 平臺的測序接頭序列,優(yōu)選為CG測序平臺的測序接頭序列。
[0013] 作為本發(fā)明的優(yōu)選方案,測序接頭序列包括標(biāo)簽序列、滾環(huán)擴(kuò)增引物結(jié)合序列和 測序引物結(jié)合序列。
[0014] 作為本發(fā)明的優(yōu)選方案,5'端的錯定序列和3'端的延伸序列的長度為15-25個堿 基。
[0015] 作為本發(fā)明的優(yōu)選方案,核酸外切酶為外切酶I和外切酶III。
[0016] 根據(jù)本發(fā)明的第二方面,本發(fā)明提供一種基于分子反向探針的測序文庫構(gòu)建試 劑,包括如下組成部分:
[0017] 分子反向探針,用于與變性核酸進(jìn)行退火雜交,分子反向探針包括5'端的錯定序 列和3'端的延伸序列W及錯定序列與延伸序列之間的測序接頭序列,錯定序列和延伸序列 分別與變性核酸中的目標(biāo)區(qū)域兩端的序列反向互補;
[0018] 聚合酶,用于W目標(biāo)區(qū)域為模板,從3'端的延伸序列開始進(jìn)行聚合反應(yīng),生成目標(biāo) 區(qū)域的互補序列;
[0019] 連接酶,用于將5'端的錯定序列與目標(biāo)區(qū)域的互補序列連接形成環(huán)狀核酸分子;
[0020] 核酸外切酶,用于消化未環(huán)化的線性分子,得到含有目標(biāo)區(qū)域的單鏈環(huán)狀分子。
[0021] 作為本發(fā)明的優(yōu)選方案,上述測序接頭序列為W單鏈環(huán)狀文庫為測序?qū)ο蟮臏y序 平臺的測序接頭序列,優(yōu)選為CG測序平臺的測序接頭序列。
[0022] 作為本發(fā)明的優(yōu)選方案,測序接頭序列包括標(biāo)簽序列、滾環(huán)擴(kuò)增引物結(jié)合序列和 測序引物結(jié)合序列。
[0023] 作為本發(fā)明的優(yōu)選方案,5'端的錯定序列和3'端的延伸序列的長度為15-25個堿 基。
[0024] 作為本發(fā)明的優(yōu)選方案,核酸外切酶為外切酶I和外切酶III。
[0025] 本發(fā)明的方法W特別設(shè)計的分子反向探針為基礎(chǔ),將單鏈環(huán)狀文庫構(gòu)建和目標(biāo)區(qū) 域捕獲融為一體,與傳統(tǒng)的先構(gòu)建全基因組文庫再利用目標(biāo)區(qū)域捕獲技術(shù)將目標(biāo)區(qū)域捕獲 出來再進(jìn)行測序的方法相比,在流程和周期上大大縮短,一般只需要一天即可得到最終的 上機(jī)測序文庫。由于流程簡單,因此可實現(xiàn)低起始量(低于IOOng)、高通量、短周期、低成本 的建庫。此外,本發(fā)明的方法不需要PCR擴(kuò)增文庫,可W大大降低在建庫過程中由于PCR所造 成的錯誤。
【附圖說明】
[0026] 圖1為本發(fā)明基于分子反向探針的測序文庫構(gòu)建方法的一個實施方案的技術(shù)原理 示意圖;
[0027] 圖2為本發(fā)明基于分子反向探針的測序文庫構(gòu)建方法的一個實施方案中的分子反 向探針的測序接頭序列部分(包括標(biāo)簽序列、滾環(huán)擴(kuò)增引物結(jié)合序列和測序引物結(jié)合序列) 的序列結(jié)構(gòu)示意圖;
[0028] 圖3為本發(fā)明一種實施方案的環(huán)化DNA分子PCR擴(kuò)增W及再環(huán)化的原理示意圖;
[0029] 圖4為本發(fā)明中的第一種分子反向探針的制備原理示意圖;
[0030] 圖5為本發(fā)明中的第二種分子反向探針的制備原理示意圖;
[0031] 圖6為本發(fā)明中的第S種分子反向探針的制備原理示意圖;
[0032] 圖7為本發(fā)明基于分子反向探針的測序文庫構(gòu)建方法的一個實施例得到的測序文 庫的凝膠電泳檢測結(jié)果圖,其中M表示DNA Marker,泳道1和2表示PCR產(chǎn)物驗證結(jié)果;
[0033] 圖8為本發(fā)明基于分子反向探針的測序文庫構(gòu)建方法的另一個實施例得到的文庫 Agilent Bioanalyzer2100質(zhì)檢結(jié)果;
[0034] 圖9為本發(fā)明基于分子反向探針的測序文庫構(gòu)建方法的另一個實施例得到的各基 因區(qū)域測序深度分布圖;
[0035] 圖10為本發(fā)明基于分子反向探針的測序文庫構(gòu)建方法的另一個實施例得到的目 標(biāo)區(qū)域在不同深度下的測序覆蓋度。
【具體實施方式】
[0036] 本發(fā)明中設(shè)及到的術(shù)語解釋如下:
[0037] index pooling測序:把多個文庫加上標(biāo)簽序列后混合在一起上機(jī)測序的一種測 序方式。
[0038] OligO pools:將多種序列混合在一起合成的一種序列合成方式,一次可實現(xiàn)94K 種序列一起合成。
[0039] Gibson組裝:由J.化aig Vente研究所的化niel Gibson開發(fā),是最常用的序列拼 接方案。
[0040] Agilent Bioanalyzer 2100:Agilent 2100生物忍片分析系統(tǒng),基于微流控忍片 技術(shù)的一種檢測設(shè)備,可在30分鐘內(nèi)給出多達(dá)12個樣品的定性定量數(shù)字化數(shù)據(jù)。
[0041] Ampligase :一種連