本發(fā)明屬于生物信息學(xué),具體地,涉及一種特定細胞特異性啟動子的篩選方法、系統(tǒng)、設(shè)備及計算機可讀存儲介質(zhì)。
背景技術(shù):
1、在分子生物學(xué)和基因工程技術(shù)領(lǐng)域,啟動子是一種重要的調(diào)控元件,它能夠控制基因的轉(zhuǎn)錄起始,從而調(diào)節(jié)基因的表達。在特定的組織和細胞中,存在能特異性驅(qū)動下游基因表達的組織/細胞特異性啟動子。同時,啟動子的組織/細胞特異性,與其驅(qū)動的下游基因的序列無關(guān),能將目的基因置于該啟動子的調(diào)控之下而繼承特異性。在干細胞療法中,細胞特異性啟動子能使目的基因僅在分化過程中的目標階段時間特異性表達;在基因療法中,細胞特異性啟動子能使目的基因僅在靶標細胞空間特異性表達,將極大地提高安全性。
2、目前,現(xiàn)有技術(shù)中有篩選其他類型轉(zhuǎn)錄調(diào)控元件(例如反式調(diào)控元件)的研究報道,但是并沒有如何篩選特定細胞特異性啟動子的研究?,F(xiàn)有技術(shù)中主要是基于crispr的基因敲除、基因敲入和表達抑制(crispri)、表達激活(crispra)技術(shù),來篩選特定細胞的指定基因的反式調(diào)控元件。這種方法通常需要進行長時間的細胞單克隆培養(yǎng),然后通過檢測細胞中的熒光信號來判斷反式調(diào)控元件的活性。此外,還有一些方法是通過生物信息學(xué)方法預(yù)測可能的啟動子,然后通過實驗逐一驗證其活性。上述篩選轉(zhuǎn)錄調(diào)控元件的方法存在操作復(fù)雜、工作量大、耗時長、敏感度和準確度不高、輸出量低的缺陷。
3、由于啟動子序列的復(fù)雜性和多樣性,如何高效地篩選出特定細胞的特異性啟動子,仍然是一個挑戰(zhàn)。因此,本領(lǐng)域亟需開發(fā)一種高效的特定細胞特異性啟動子的篩選方法。
技術(shù)實現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種特定細胞特異性啟動子的篩選方法、系統(tǒng)、設(shè)備及計算機可讀存儲介質(zhì),以克服目前本領(lǐng)域存在的上述技術(shù)問題。
2、本發(fā)明的上述發(fā)明目的通過以下技術(shù)方案得以實現(xiàn):
3、本發(fā)明的第一方面提供了一種基于高通量技術(shù)的計算機輔助篩選特定細胞特異性啟動子的方法,所述方法包括:
4、獲取在特定細胞中特異性表達的m個基因,即為選定基因;
5、基于所述選定基因確定m個待篩選啟動子,所述待篩選啟動子為所述選定基因的轉(zhuǎn)錄起始位點(tss)上游(-2000到-1)bp到下游(+1到+100)bp的正向序列;
6、構(gòu)建含有所述待篩選啟動子的m個報告質(zhì)粒,所述報告質(zhì)粒中還包含報告基因;
7、將所述報告質(zhì)粒轉(zhuǎn)染到特定細胞中得到300×m個經(jīng)轉(zhuǎn)染的特定細胞;
8、當所述經(jīng)轉(zhuǎn)染的特定細胞中報告基因為陽性時,則該經(jīng)轉(zhuǎn)染的特定細胞中含有的待篩選啟動子為特異性啟動子;當所述經(jīng)轉(zhuǎn)染的特定細胞中報告基因為陰性時,則該經(jīng)轉(zhuǎn)染的特定細胞中含有的待篩選啟動子為非特異性啟動子。
9、進一步,所述m為500-5000之間的任意整數(shù)值;
10、可選地,所述m為3000;
11、可選地,所述特定細胞包括間充質(zhì)干細胞、胚胎干細胞、血管內(nèi)皮祖細胞、自然殺傷細胞、視網(wǎng)膜色素細胞、胰島細胞、少突膠質(zhì)細胞祖細胞、成纖維細胞、巨噬細胞、樹突細胞、神經(jīng)干細胞、星形膠質(zhì)細胞、纖維軟骨細胞、成骨細胞、淋巴母細胞瘤細胞、漿細胞、單核細胞、紅細胞或心肌細胞。
12、進一步,所述待篩選啟動子為所述選定基因的tss上游-218bp到下游+30bp的正向序列;
13、可選地,所述報告基因包括egfp、gfp、mrfp、mcherry、myfp、dsred2和/或lacz;
14、可選地,所述報告質(zhì)粒由以下部分的編碼序列按順序連接得到:合成多聚腺苷酸信號、rna聚合酶ii轉(zhuǎn)錄暫停信號、多克隆位點、待篩選啟動子、報告基因、土撥鼠乙型肝炎病毒轉(zhuǎn)錄后調(diào)控元件、sv40多聚腺苷酸信號;
15、可選地,所述報告質(zhì)粒由以下部分的編碼序列按順序連接得到:合成多聚腺苷酸信號、rna聚合酶ii轉(zhuǎn)錄暫停信號、多克隆位點、待篩選啟動子、egfp、土撥鼠乙型肝炎病毒轉(zhuǎn)錄后調(diào)控元件、sv40多聚腺苷酸信號;
16、可選地,通過電穿孔的方式將所述報告質(zhì)粒轉(zhuǎn)染到特定細胞中得到300×m個經(jīng)轉(zhuǎn)染的特定細胞;
17、可選地,對所述經(jīng)轉(zhuǎn)染的特定細胞進行培養(yǎng)后,消化經(jīng)培養(yǎng)后的所述經(jīng)轉(zhuǎn)染的特定細胞,通過流式分選的方式分別收集報告基因為陽性的經(jīng)轉(zhuǎn)染的特定細胞和報告基因為陰性的經(jīng)轉(zhuǎn)染的特定細胞。
18、進一步,篩選得到的間充質(zhì)干細胞的特異性啟動子包括pcav1、pcd44、pehd2、ptspo;
19、可選地,所述間充質(zhì)干細胞的特異性啟動子pcav1的編碼序列如seq?id?no:1所示;
20、可選地,所述間充質(zhì)干細胞的特異性啟動子pcd44的編碼序列如seq?id?no:2所示;
21、可選地,所述間充質(zhì)干細胞的特異性啟動子pehd2的編碼序列如seq?id?no:3所示;
22、可選地,所述間充質(zhì)干細胞的特異性啟動子ptspo的編碼序列如seq?id?no:4所示。
23、進一步,所述方法還包括對篩選得到的特異性啟動子在特定細胞中的驅(qū)動表達活性和特異性進行驗證;
24、可選地,所述驅(qū)動表達活性的驗證包括:將包含篩選得到的特異性啟動子的報告質(zhì)粒轉(zhuǎn)染所述特定細胞,所述報告質(zhì)粒中還包含報告基因,檢測所述特定細胞中報告基因的表達強度;
25、可選地,所述特異性的驗證包括:將包含篩選得到的特異性啟動子的報告質(zhì)粒轉(zhuǎn)染非所述特定細胞的其它細胞,所述報告質(zhì)粒中還包含報告基因,檢測所述非所述特定細胞的其它細胞中報告基因的表達強度。
26、本發(fā)明的第二方面提供了一種基于高通量技術(shù)的計算機輔助篩選特定細胞特異性啟動子的系統(tǒng),所述系統(tǒng)包括:
27、選定基因獲取單元:獲取在特定細胞中特異性表達的m個基因,即為選定基因;
28、待篩選啟動子確定單元:基于所述選定基因確定m個待篩選啟動子,所述待篩選啟動子為所述選定基因的轉(zhuǎn)錄起始位點(tss)上游(-2000到-1)bp到下游(+1到+100)bp的正向序列;
29、報告質(zhì)粒構(gòu)建單元:構(gòu)建含有所述待篩選啟動子的m個報告質(zhì)粒,所述報告質(zhì)粒中還包含報告基因;
30、經(jīng)轉(zhuǎn)染的特定細胞構(gòu)建單元:將所述報告質(zhì)粒轉(zhuǎn)染到特定細胞中得到300×m個經(jīng)轉(zhuǎn)染的特定細胞;
31、特異性啟動子判斷單元:當所述經(jīng)轉(zhuǎn)染的特定細胞中報告基因為陽性時,則該經(jīng)轉(zhuǎn)染的特定細胞中含有的待篩選啟動子為特異性啟動子;當所述經(jīng)轉(zhuǎn)染的特定細胞中報告基因為陰性時,則該經(jīng)轉(zhuǎn)染的特定細胞中含有的待篩選啟動子為非特異性啟動子。
32、進一步,所述m為500-5000之間的任意整數(shù)值;
33、可選地,所述m為3000;
34、可選地,所述特定細胞包括間充質(zhì)干細胞、胚胎干細胞、血管內(nèi)皮祖細胞、自然殺傷細胞、視網(wǎng)膜色素細胞、胰島細胞、少突膠質(zhì)細胞祖細胞、成纖維細胞、巨噬細胞、樹突細胞、神經(jīng)干細胞、星形膠質(zhì)細胞、纖維軟骨細胞、成骨細胞、淋巴母細胞瘤細胞、漿細胞、單核細胞、紅細胞或心肌細胞;
35、可選地,所述待篩選啟動子為所述選定基因的tss上游-218bp到下游+30bp的正向序列;
36、可選地,所述報告基因包括egfp、gfp、mrfp、mcherry、myfp、dsred2和/或lacz;
37、可選地,所述報告質(zhì)粒由以下部分的編碼序列按順序連接得到:合成多聚腺苷酸信號、rna聚合酶ii轉(zhuǎn)錄暫停信號、多克隆位點、待篩選啟動子、報告基因、土撥鼠乙型肝炎病毒轉(zhuǎn)錄后調(diào)控元件、sv40多聚腺苷酸信號;
38、可選地,所述報告質(zhì)粒由以下部分的編碼序列按順序連接得到:合成多聚腺苷酸信號、rna聚合酶ii轉(zhuǎn)錄暫停信號、多克隆位點、待篩選啟動子、egfp、土撥鼠乙型肝炎病毒轉(zhuǎn)錄后調(diào)控元件、sv40多聚腺苷酸信號;
39、可選地,通過電穿孔的方式將所述報告質(zhì)粒轉(zhuǎn)染到特定細胞中得到300×m個經(jīng)轉(zhuǎn)染的特定細胞;
40、可選地,對所述經(jīng)轉(zhuǎn)染的特定細胞進行培養(yǎng)后,消化經(jīng)培養(yǎng)后的所述經(jīng)轉(zhuǎn)染的特定細胞,通過流式分選的方式分別收集報告基因為陽性的經(jīng)轉(zhuǎn)染的特定細胞和報告基因為陰性的經(jīng)轉(zhuǎn)染的特定細胞;
41、可選地,篩選得到的間充質(zhì)干細胞的特異性啟動子包括pcav1、pcd44、pehd2、ptspo;
42、可選地,所述間充質(zhì)干細胞的特異性啟動子pcav1的編碼序列如seq?id?no:1所示;
43、可選地,所述間充質(zhì)干細胞的特異性啟動子pcd44的編碼序列如seq?id?no:2所示;
44、可選地,所述間充質(zhì)干細胞的特異性啟動子pehd2的編碼序列如seq?id?no:3所示;
45、可選地,所述間充質(zhì)干細胞的特異性啟動子ptspo的編碼序列如seq?id?no:4所示;
46、可選地,所述系統(tǒng)還包括驅(qū)動表達活性驗證單元、特異性驗證單元;
47、可選地,驅(qū)動表達活性驗證單元:將包含篩選得到的特異性啟動子的報告質(zhì)粒轉(zhuǎn)染所述特定細胞,所述報告質(zhì)粒中還包含報告基因,檢測所述特定細胞中報告基因的表達強度;
48、可選地,特異性驗證單元:將包含篩選得到的特異性啟動子的報告質(zhì)粒轉(zhuǎn)染非所述特定細胞的其它細胞,所述報告質(zhì)粒中還包含報告基因,檢測所述非所述特定細胞的其它細胞中報告基因的表達強度。
49、本發(fā)明的第三方面提供了一種基于高通量技術(shù)的計算機輔助篩選特定細胞特異性啟動子的設(shè)備,所述設(shè)備包括:
50、存儲器和處理器,所述存儲器用于存儲程序指令;所述處理器用于調(diào)用程序指令,當程序指令被執(zhí)行時實現(xiàn)本發(fā)明第一方面所述的基于高通量技術(shù)的計算機輔助篩選特定細胞特異性啟動子的方法。
51、本發(fā)明的第四方面提供了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)本發(fā)明第一方面所述的基于高通量技術(shù)的計算機輔助篩選特定細胞特異性啟動子的方法。
52、本發(fā)明的第五方面提供了一種計算機程序產(chǎn)品,所述計算機程序產(chǎn)品包含計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)本發(fā)明第一方面所述的基于高通量技術(shù)的計算機輔助篩選特定細胞特異性啟動子的方法。
53、相對于現(xiàn)有技術(shù),本發(fā)明具有的優(yōu)點和有益效果如下:
54、(1)本發(fā)明提供了一種用于篩選特定人源細胞特異性啟動子的新方法,該方法能快速高效地篩選出在各種不同細胞中具有驅(qū)動下游基因表達能力的特異性啟動子dna序列。本發(fā)明能夠為各種細胞治療藥物和基因治療藥物提供更加安全可靠的基因表達元件,同時彌補了現(xiàn)有技術(shù)缺乏特定細胞特異性啟動子的有效篩選方法的這一技術(shù)空白。
55、(2)本發(fā)明提供的全新的用于篩選特定人源細胞特異性啟動子的方法,能通過一遍全流程操作將特定細胞中全部具有驅(qū)動表達活性的特異性啟動子篩選出來,提高了篩選的輸出量,同時極大地縮減了操作量。
56、(3)本發(fā)明提供的全新的用于篩選特定人源細胞特異性啟動子的方法,使用瞬轉(zhuǎn)質(zhì)粒中的熒光報告基因進行信號報告,對于多數(shù)細胞能在48h內(nèi)獲得可用細胞,極大地縮短了操作時長。
57、(4)本發(fā)明提供的全新的用于篩選特定人源細胞特異性啟動子的方法邏輯步驟簡潔明了,篩選目標是啟動子,作為報告信號的細胞熒光信號強度直接取決于啟動子在該細胞中能否激活下游熒光基因表達,簡短的傳導(dǎo)過程保證了高可靠性。