日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

纖維素酶、編碼它們的核酸及其制備和應(yīng)用的方法

文檔序號(hào):432077閱讀:822來源:國知局

專利名稱::纖維素酶、編碼它們的核酸及其制備和應(yīng)用的方法纖維素酶、編碼它們的核酸及其制備和應(yīng)用的方法5政府資助本發(fā)明涉及分子和細(xì)胞生物學(xué)和生物化學(xué)。一方面,本發(fā)明提供具有纖維素酶活性——例如,內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽、編碼這些多肽的多核苷酸,以及制備和使用這些多核苷酸和多肽的方法。一方面,本發(fā)明涉及具有纖維素酶活性例如內(nèi)切葡聚糖酶、纖維二15糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性——包括熱穩(wěn)定的和耐熱的活性——的多肽,和編碼這些酶的多核苷酸,以及制備和使用這些多核苷酸和多肽。本發(fā)明的多肽可用于各種制藥、農(nóng)業(yè)和工業(yè)環(huán)境中。
背景技術(shù)
:20纖維素是地球上最豐富的可再生資源。它由重復(fù)單元是纖維二糖的P-l,4葡萄糖單元的線性鏈組成,纖維二糖是具有如圖5所示結(jié)構(gòu)的葡萄糖二聚體。該高分子通過一組酶進(jìn)行降解,包括隨機(jī)水解纖維素高分子的內(nèi)切葡聚糖酶(EG)以及從纖維素除去末端纖維二糖殘基的纖維二糖水解酶(CBH)。纖維二糖和纖維寡糖被P-葡糖苷酶(BG)水解成葡萄糖。所有這三種酶對(duì)于纖維素完全分解成葡萄糖是25必需的。對(duì)于這三種酶的每一種,存在行使相同功能的不同結(jié)構(gòu)的變體。此外,除了不同結(jié)構(gòu)變體外,已知真菌和細(xì)菌還產(chǎn)生多種形式的相同結(jié)構(gòu)變體。已知一些厭氧細(xì)菌和真菌以多酶復(fù)合物的形式產(chǎn)生這些酶,這一事實(shí)進(jìn)一步使該系統(tǒng)復(fù)雜化,所述多酶復(fù)合物含有都附著于酶支架上的多種酶,分子量在2百萬道爾頓以上。為什么這樣的酶復(fù)合系統(tǒng)對(duì)于這樣的簡單分子是必需的?一些30研究者認(rèn)為該復(fù)雜性原因在于底物的頑拗性質(zhì)。纖維素鏈形成微纖維,其通過相鄰鏈的氫鍵鍵合堆積成晶體基質(zhì)。該結(jié)構(gòu)對(duì)于化學(xué)降解或酶促降解是高度耐受的。由于它們對(duì)纖維素的酶促攻擊性質(zhì),CBH被認(rèn)為是該晶體纖維素降解中的關(guān)鍵酶。與CBH不同,EG具有開放的裂縫,其以垂直角度攻擊纖維素鏈。CBH通過含有活性位點(diǎn)的坑道直接攻擊所述鏈。目前認(rèn)為,纖維素鏈進(jìn)入所述坑道,35同時(shí),相鄰的氫鍵鍵合被破壞。一旦纖維二糖水解酶在該底物上建立起"立足點(diǎn)",然后,EG可以進(jìn)來,并更容易攻擊底物。已知的CBH的一個(gè)主要缺陷是其低的催化活性。一些觀點(diǎn)認(rèn)為,低活性是源于如下事實(shí)來自水解的能量被轉(zhuǎn)化成動(dòng)能,以破壞氫鍵并使酶能夠沿著底物移動(dòng)。CBH是外切作用酶并在90個(gè)糖基水解酶家族中的6個(gè)家族中發(fā)現(xiàn)。它們5包括家族5、6、7、9、10和48。家族5含有許多不同類型的糖基水解酶,包括纖維素酶、甘露聚糖酶和木聚糖酶。盡管在該家族中大部分纖維素酶是內(nèi)切葡聚糖酶,仍存在纖維二糖水解酶的例子,最為人知的是來自熱纖梭菌(C7o^^/"/mAeAvOCe//Mw)的CdO。家族6僅含有內(nèi)切葡聚糖酶或纖維二糖水解酶,其中纖維二糖水解酶成員比內(nèi)切葡聚糖酶更多。該酶具有反向機(jī)制(invertingmechanism),10并且晶體學(xué)研究表明,所述酶具有扭曲的a/l3桶結(jié)構(gòu),其含有七個(gè)而非八個(gè)平行的J3鏈。家族7酶也由內(nèi)切葡聚糖酶和纖維二糖水解酶組成,其中纖維二糖水解酶更多,并且已知的成員僅來自真菌。該酶具有保持機(jī)構(gòu)(retainingmechanism),并且晶體結(jié)構(gòu)示出了P-膠凍巻結(jié)構(gòu)。家族9含有內(nèi)切葡聚糖酶、纖維二糖水解酶和卩-葡糖苷酶,其中內(nèi)切葡聚糖酶占優(yōu)勢。然而,嗜熱放線菌(77jeAvno6i/Wfl/^OJ)產(chǎn)15生內(nèi)切/外切-l,4-葡聚糖酶,其晶體結(jié)構(gòu)顯示出(a/a)6桶狀折疊。該酶具有內(nèi)切和外切葡聚糖酶CBH的特征。家族10僅含有2個(gè)成員,被描述為纖維二糖水解酶,其余主要被描述為木聚糖酶。家族10的纖維二糖水解酶和木聚糖酶具有對(duì)甲基-傘形基纖維二糖苷的活性。家族48主要含有細(xì)菌和厭氧真菌纖維二糖水解酶和內(nèi)切葡聚糖酶。結(jié)構(gòu)是類似于家族9的(a/a)6桶狀折疊。20存在對(duì)用于公路車輛的較不昂貴和可再生的燃料來源的需求。如果新的燃料來源在燃燒之后產(chǎn)生無害的終產(chǎn)物,則它們將更加有吸引力。乙醇提供了石油基燃料的有吸引力的可替代選擇,并且可以通過衍生自淀粉或木質(zhì)纖維素的單體糖發(fā)酵獲得。然而,目前的經(jīng)濟(jì)學(xué)不支持乙醇的廣泛使用,原因在于生產(chǎn)乙醇的高成本。一個(gè)目標(biāo)在于降低成本的研究領(lǐng)域是增加用于從木質(zhì)纖維素產(chǎn)生可發(fā)酵25糖類的酶的技術(shù)效率。更有效地消化原料的酶的開發(fā)將轉(zhuǎn)變成降低的乙醇生產(chǎn)成本。更有效的工藝將降低美國對(duì)進(jìn)口油的依賴以及與該依賴性相關(guān)的價(jià)格波動(dòng)。使用更清潔的運(yùn)輸燃料例如生物乙醇還可以降低凈C02排放,其被認(rèn)為是造成全球變暖的部分原因。30發(fā)明概述本發(fā)明提供了纖維素酶,例如,內(nèi)切葡聚糖酶、纖維二糖水解酶和/或P-葡糖苷酶(多種P-葡糖苷酶),以及制備和使用它們的方法。一方面,本發(fā)明的酶具有增加的催化速率,以改善底物水解過程。在催化速率上這種增加的效率導(dǎo)致在生產(chǎn)糖類上增加的效率,這可用于工業(yè)應(yīng)用中,例如,如此產(chǎn)生的糖可被微生35物用于乙醇生產(chǎn)。一方面,本發(fā)明提供了高活性(例如,具有增加的催化速率)的纖維二糖水解酶、內(nèi)切葡聚糖酶和P-葡糖苷酶。本發(fā)明提供了工業(yè)應(yīng)用(例如,生物物質(zhì)(biomass)轉(zhuǎn)化為乙醇),其利用了本發(fā)明的具有降低的酶成本的酶,例如,在生物物質(zhì)轉(zhuǎn)化為乙醇的過程中降低的成本。因此,本發(fā)明提供了由任何生物質(zhì)生產(chǎn)生物乙醇和含生物乙醇的組合物的有效率的工藝,所述含生物乙醇的組合物包括含有生物乙醇的燃料。5—方面,本發(fā)明的酶具有葡聚糖酶例如內(nèi)切葡聚糖酶活性,例如催化內(nèi)部內(nèi)-(3-l,4-和域P-l,3-葡聚糖鍵的水解。一方面,內(nèi)切葡聚糖酶活性(例如,內(nèi)切1,4-P-D-葡聚糖4-葡聚糖水解酶活性)包括水解纖維素、纖維素衍生物(例如羧甲基纖維素和羥乙基纖維素)地衣聚糖(lichenin)中的1,4-和域P-l,3-P-D-糖苷鍵、混合的P-l,3葡聚糖中的P-l,4鍵,例如谷類P-D-葡聚糖或木葡聚糖以及含有纖維10質(zhì)部分的其它植物材料?!矫妫景l(fā)明的酶具有內(nèi)切葡聚糖酶(例如,內(nèi)切-(3-l,4-葡聚糖酶,EC3.2丄4;內(nèi)切-p-l,3(l)-葡聚糖酶,EC3.2丄6;內(nèi)切-p-l,3-葡聚糖酶,EC3.2丄39)活性并且可以水解纖維素和葡聚糖中的內(nèi)部p-l,4-和/或P-l,3-糖苷鍵,以產(chǎn)生較小分子量的葡萄糖和葡萄糖寡聚體。本發(fā)明提供了使用本發(fā)明的這些酶產(chǎn)生更小分子量15的葡萄糖和葡萄糖寡聚體的方法?!矫?,本發(fā)明的酶用于產(chǎn)生葡聚糖,例如,由1,4-p-和/或1,3-糖苷鍵接的D-吡喃葡糖形成的多糖。一方面,本發(fā)明的內(nèi)切葡聚糖酶被用在食品工業(yè)中如烘焙及水果和蔬菜加工、農(nóng)業(yè)廢物的分解、動(dòng)物飼料的生產(chǎn)、紙漿和紙的生產(chǎn)、紡織物生產(chǎn)以及家用和工業(yè)清潔劑。一方面,通過微生物如真菌和/或細(xì)菌,生產(chǎn)20本發(fā)明的酶,例如內(nèi)切葡聚糖酶?!矫?,本發(fā)明的酶如內(nèi)切葡聚糖酶被用于水解|3-葡聚糖,p-葡聚糖是谷物主要的非淀粉多糖。根據(jù)品種和生長條件,多糖的葡聚糖含量可顯著變化。該多糖的物理化學(xué)性質(zhì)是在氧化條件下產(chǎn)生粘性溶液或者甚至是凝膠。此外,葡聚糖具有高的水結(jié)合能力。所有這些特征給幾個(gè)行業(yè)帶來了問題,包括釀造、烘焙、25動(dòng)物營養(yǎng)。在釀造應(yīng)用中,葡聚糖的存在導(dǎo)致麥芽汁過濾性和形成渾濁的問題。在烘焙應(yīng)用中(尤其對(duì)于曲奇和脆餅),葡聚糖可產(chǎn)生發(fā)粘面團(tuán),其難以進(jìn)行機(jī)械加工和減小餅干尺寸。因此,本發(fā)明的酶如內(nèi)切葡聚糖酶被用于降低含P-葡聚糖的組合物中P-葡聚糖的量,例如,本發(fā)明的酶被用在降低溶液或凝膠的粘度的工藝中;用于降低組合物例如含P-葡聚糖的組合物的水結(jié)合能力;在釀造工藝中(例30如,用于增加麥芽汁過濾性和降低混濁),用于降低面團(tuán)的粘性,例如,用于制作曲奇、面包、餅干等等的面團(tuán)。此外,碳水化合物(例如,P-葡聚糖)參與烘焙產(chǎn)品的快速再水化,導(dǎo)致松脆性損失和縮短的貨架期。因此,本發(fā)明的酶,例如內(nèi)切葡聚糖酶,被用于保持松脆性、增加松脆性或降低松脆性的損失速率,以及增加任何含碳水化合物食35品、飼料或飲料的貨架期,例如含p-葡聚糖的食品、飼料或飲料。本發(fā)明的酶,例如內(nèi)切葡聚糖酶,被用于降低消化道內(nèi)容物(例如,在動(dòng)物中,如反芻動(dòng)物或人中)的粘性,例如,含有谷物膳食的那些。因此,在可選的方面,本發(fā)明的酶,例如內(nèi)切葡聚糖酶,被用于正面影響食品或飼料的可消化性以及動(dòng)物(例如,人或家畜)生長速率,以及在一方面,被用于產(chǎn)生更高的飼料轉(zhuǎn)化效率。對(duì)于谷物食物的單胃動(dòng)物飼料應(yīng)用,p-葡聚糖是消化道內(nèi)容物的粘性5的促成因素,并且從而負(fù)面影響飼料的可消化性和動(dòng)物生長速率。對(duì)于反芻動(dòng)物,這些P-葡聚糖代表纖維攝入的基本成分,而葡聚糖的更完全的消化將促進(jìn)更高的飼料轉(zhuǎn)化效率。因此,本發(fā)明提供了含有本發(fā)明的內(nèi)切葡聚糖酶的動(dòng)物飼料和食品,并且在一方面,這些酶在動(dòng)物消化道中是有活性的,例如在胃和/或腸中是有活性的。10本發(fā)明的酶,例如內(nèi)切葡聚糖酶,被用于消化纖維素或任何含P-l,4-連接葡聚糖的合成或天然的材料,包括在任何植物材料中發(fā)現(xiàn)的那些。本發(fā)明的酶,例如內(nèi)切葡聚糖酶,被用作例如在木材加工、紙槳和/或紙工業(yè)中、在紡織品制造中以及在家用和工業(yè)清潔劑中和/或在生物物質(zhì)廢物處理中消化纖維素的商業(yè)酶。—方面,本發(fā)明提供了含有本發(fā)明的酶、多肽或多核苷酸的組合物(例如,15藥物組合物、食物、飼料、藥物、飲食補(bǔ)充物)。這些組合物可以以各種形式加以配制,例如片劑、凝膠、丸劑、植入物、液體、噴劑、粉末、食物、飼料小丸或任何類型的膠囊化形式。本發(fā)明提供了分離的或重組的核酸,包括在至少大約10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、20600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多殘基的區(qū)域內(nèi),與本發(fā)明的示例性核酸具有至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、2567%、68°/。、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的核酸序列,本發(fā)明的示例性核酸包括SEQIDNO:l,SEQIDNO:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQIDNO:ll,SEQIDNO:13,SEQIDNO:15,30SEQIDNO:17,SEQIDNO:19,SEQIDNO:21,SEQIDNO:23,SEQIDNO:25,SEQIDNO:27,SEQIDNO:29,SEQIDNO:31,SEQIDNO:33,SEQIDNO:35,SEQIDNO:37,SEQIDNO:39,SEQIDNO:41,SEQIDNO:43,SEQIDNO:45,SEQIDNO:47,SEQIDNO:49,SEQIDNO:51,SEQIDNO:53,SEQIDNO:55,SEQIDNO:57,SEQIDNO:59,SEQEDNO:61,SEQIDNO:63,SEQIDNO:65,35SEQIDNO:67,SEQIDNO:69,SEQIDNO:71,SEQEDNO:73,SEQIDNO:75,SEQIDNO:77,SEQIDNO:79,SEQIDNO:81,SEQIDNO:83,SEQIDNO:85,SEQIDNO:87,SEQIDNO:89,SEQIDNO:91,SEQIDNO:93,SEQIDNO:95,SEQIDNO:97,SEQIDNO:99,SEQIDNO:101,SEQIDNO:103,SEQIDNO:105,SEQIDNO:107,SEQIDNO:109,SEQIDNO:lll,SEQIDNO:113,SEQIDNO:115,SEQIDNO:117,SEQIDNO:119,SEQIDNO:121,SEQIDNO:123,SEQ5IDNO:125,SEQIDNO:127,SEQIDNO:129,SEQIDNO:131,SEQIDNO:133,SEQIDNO:135,SEQIDNO:137,SEQIDNO:139,SEQIDNO:141,SEQIDNO:143,SEQIDNO:145,SEQIDNO:147,SEQIDNO:149,SEQIDNO:151,SEQIDNO:153,SEQIDNO:155,SEQIDNO:157,SEQIDNO:159,SEQIDNO:161,SEQIDNO:163和SEQIDNO:165;也參見下面的表l、2和3、實(shí)施例101和4,以及序列表;以及在可選的方面,這些核酸編碼至少一個(gè)具有纖維素酶活性例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,或者編碼能夠產(chǎn)生可特異性結(jié)合本發(fā)明多肽的抗體的多肽,或者,這些核酸可用作鑒別或分離編碼纖維素酶的核酸的探針,或用于抑制表達(dá)纖維素酶的核酸的表達(dá)(所有這些方面都稱為"本發(fā)明的核酸")。一方面,所述序列同一性通過運(yùn)用15了序列比較算法的分析或通過視覺觀察來確定。本發(fā)明的核酸也包括,編碼本發(fā)明的示例性酶的分離的或重組的核酸,本發(fā)明的示例性酶包括具有如下所示序列的多肽SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,SEQIDNO:22,SEQIDNO:24,SEQID20NO:26,SEQIDNO:28,SEQIDNO:30,SEQIDNO:32,SEQIDNO:34,SEQIDNO:36,SEQIDNO:38,SEQIDNO:40,SEQIDNO:42,SEQIDNO:44,SEQIDNO:46,SEQIDNO:48,SEQIDNO:50,SEQIDNO:52,SEQIDNO:54,SEQIDNO:56,SEQIDNO:58,SEQIDNO:60,SEQIDNO:62,SEQIDNO:64,SEQIDNO:66,SEQIDNO:68,SEQIDNO:70,SEQIDNO:72,SEQIDNO:74,SEQID25NO:76,SEQIDNO:78,SEQIDNO:80,SEQIDNO:82,SEQIDNO:84,SEQIDNO:86,SEQIDNO:88,SEQIDNO:90,SEQIDNO:92,SEQIDNO:94,SEQIDNO:96,SEQIDNO:98,SEQIDNO:100,SEQIDNO:102,SEQIDNO:104,SEQIDNO:106,SEQIDNO:108,SEQIDNO:110,SEQIDNO:112,SEQIDNO:114,SEQIDNO:116,SEQIDNO:118,SEQIDNO:120,SEQIDNO:122,SEQID30NO:124,SEQIDNO:126,SEQIDNO:128,SEQIDNO:130,SEQIDNO:132,SEQIDNO:134,SEQIDNO:136,SEQIDNO:138,SEQIDNO:140,SEQIDNO:142,SEQIDNO:144,SEQIDNO:146,SEQIDNO:148,SEQIDNO:150,SEQIDNO:152,SEQIDNO:154,SEQIDNO:156,SEQIDNO:158,SEQIDNO:160,SEQIDNO:162,SEQIDNO:164和SEQIDNO:166,也參見下面的表1、352和3、實(shí)施例1和4,和序列表,及其子序列和其變體。一方面,該多肽具有纖維素酶活性,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性?!矫?,本發(fā)明提供了編碼纖維素酶的核酸,例如編碼內(nèi)切葡聚糖酶、纖維二糖水解酶和/或P-葡糖苷酶的核酸,其共同的新穎性在于它們來源于混合培養(yǎng)物。本發(fā)明提供了從混合培養(yǎng)物分離的編碼纖維素降解酶的核酸,其包括本發(fā)明5的多核苷酸,例如在至少大約50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、卯0、950、1000、1050、1100、1150或更多殘基的區(qū)域內(nèi),與本發(fā)明的示例性核酸具有至少大約10%、15%、20%、25%、30%、35%、40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、1072%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的序列,本發(fā)明的示例性核酸例如SEQIDNO:l,SEQIDN0:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQIDNO:ll,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,15SEOIDNO:21,SEOIDNO:23,SEQIDNO:25,SEQIDNO:27,SEQIDNO:29,SEQIDNO:35,SEQIDNO:37,SEQIDNO:39,SEQIDNO:45,SEQIDNO:47,SEQIDNO:49,SEQIDNO:55,SEQIDNO:57,SEQIDNO:59,SEQIDNO:65,SEQIDNO:67,SEQIDNO:69,SEQIDNO:75,SEQIDNO:77,SEQIDNO:79,SEQIDNO:85,SEQIDNO:87,SEQIDNO:89,SEQIDNO:95,SEQIDNO:97,SEQIDNO:99,SEQIDNO:101,SEQIDNO:103,SEQIDNO:105,SEQIDNO:107,SEQIDNO:109,SEQIDNO:lll,SEQIDNO:113,SEQIDNO:115,SEQIDNO:117,SEQ25IDNO:119,SEQIDNO:121,SEQIDNO:123,SEQIDNO:125,SEQIDNO:127,SEQIDNO:129,SEQIDNO:131,SEQIDNO:133,SEQIDNO:135,SEQIDNO:137,SEQIDNO:139,SEQIDNO:141,SEQIDNO:143,SEQIDNO:145,SEQIDNO:147,SEQIDNO:149,SEQIDNO:151,SEQIDNO:153,SEQIDNO:155,SEQIDNO:157,SEQIDNO:159,SEQIDNO:161,SEQIDNO:163和30SEQIDNO:165;也參見下面的表1、2和3、實(shí)施例1和4,以及序列表?!矫妫景l(fā)明提供了編碼纖維素酶的核酸,例如編碼內(nèi)切葡聚糖酶、纖維二糖水解酶和/或P-葡糖苷酶的核酸,包括本發(fā)明的示例性多核苷酸序列,也參見下面的表l、2和3、實(shí)施例1和4,和序列表,以及由它們編碼的多肽,包括本發(fā)明的酶,諸如本發(fā)明的示例性多肽,如SEQIDNO:2,SEQIDNO:4,SEQID35NO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,SEQIDNO:22,SEQIDNO:24,SEQID20SEQIDNO:21,SEC)IDNO:31'SEQIDNO:41,SEQIDNO:51,SEQIDNO:61,SEQIDNO:71,SEQIDNO:81,SEQIDNO:91:SEQIDNO:23,SEQIDNO:33,SEQIDNO:43,SEQIDNO:53,SEQIDNO:63,SEQIDNO:73,SEQIDNO:83,SEQIDNO:93,NO:26,SEQIDNO:28,SEQIDNO:30,SEQIDNO:32,SEQIDNO:34,SEQIDNO:36,SEQIDNO:38,SEQIDNO:40,SEQIDNO:42,SEQIDNO:44,SEQIDNO:46,SEQIDNO:48,SEQIDNO:50,SEQIDNO:52,SEQIDNO:54,SEQIDNO:56,SEQIDNO:58,SEQIDNO:60,SEQIDNO:62,SEQIDNO:64,SEQID5NO:66,SEQIDNO:68,SEQIDNO:70,SEQIDNO:72,SEQIDNO:74,SEQIDNO:76,SEQIDNO:78,SEQIDNO:80,SEQIDNO:82,SEQIDNO:84,SEQIDNO:86,SEQIDNO:88,SEQIDNO:90,SEQIDNO:92,SEQIDNO:94,SEQIDNO:96,SEQIDNO:98,SEQIDNO:100,SEQIDNO:102,SEQIDNO:104,SEQIDNO:106,SEQIDNO:108,SEQIDNO:llO,SEQIDNO:112,SEQIDNO:114,10SEQIDNO:116,SEQIDNO:118,SEQIDNO:120,SEQIDNO:122,SEQIDNO:124,SEQIDNO:126,SEQIDNO:128,SEQIDNO:130,SEQIDNO:132,SEQIDNO:134,SEQIDNO:136,SEQIDNO:138,SEQIDNO:140,SEQIDNO:142,SEQIDNO:144,SEQIDNO:146,SEQIDNO:148,SEQIDNO:150,SEQIDNO:152,SEQIDNO:154,SEQIDNO:156,SEQIDNO:158,SEQID15NO:160,SEQIDNO:162,SEQIDNO:164和SEQIDNO:166,也參見表1和序列表,其共同的新穎性在于它們來源于共同的來源,例如環(huán)境來源。一方面,本發(fā)明也提供了編碼纖維素酶的核酸,例如編碼內(nèi)切葡聚糖酶、纖維二糖水解酶和/或卩-葡糖苷酶的核酸,其共同的新穎性在于它們來源于環(huán)境來源,例如混合的環(huán)境來源。20—方面,序列比較算法是BLAST2.2.2版本算法,其中過濾設(shè)置(filteringsetting)被設(shè)置為blastall-pblastp~d"nrpataa"-FF,所有其它選項(xiàng)被設(shè)置為缺省。本發(fā)明的另一方面是分離的或重組的核酸,包括本發(fā)明的核酸序列的至少10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、251100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多個(gè)連續(xù)堿基、與其基本相同的序列、以及與其互補(bǔ)的序列?!矫?,所述分離的或重組的核酸編碼具有纖維素酶活性的多肽,例如,30具有內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,其是熱穩(wěn)定的。該多肽在包括如下溫度范圍的條件下可以保持纖維素酶活性大約37。C到大約95'C之間;大約55'C到大約85'C之間;大約70'C到大約95'C之間;或大約9(TC到大約95'C之間。該多肽在如下范圍內(nèi)的溫度下可以保持纖維素酶活性在大約rC到大約5'C之間,大約5'C到大約15'C之間,大約15'C到大約2535。C之間,大約25'C到大約37'C之間,大約37'C到大約95'C、96'C、97'C、98'C或99。C之間,大約55'C到大約85'C之間,大約70'C到大約75'C之間,或大約90。C到大約99。C,或95'C、96°C、97°C、98'C或99。C,或更高溫度。另一方面,所述分離的或重組的核酸編碼具有纖維素酶活性的多肽,例如,具有內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,其是耐熱的。該多肽在暴露于如下范圍內(nèi)的溫度后可以保持纖維素酶活性37'C5以上到大約95'C,或55'C以上到大約85'C的范圍之內(nèi)的任何溫度。該多肽在暴露于如下范圍內(nèi)的溫度后可以保持纖維素酶活性在大約1'C到大約5'C之間,大約5'C到大約15'C之間,大約15'C到大約25'C之間,大約25'C到大約37t:之間,大約37'C到大約95°C、96°C、97'C、98'C或99'C之間,大約55。C到大約85'C之間,大約70'C到大約75'C之間,或大約90'C到大約95'C之間,或更高溫度。一方面,10該多肽在暴露于如下范圍內(nèi)的溫度后保持纖維素酶活性9(TC以上到大約99°C,或95。C、96°C、97°C、98'C或99'C,在大約pH4.5,或更高。本發(fā)明提供了分離的或重組的核酸,包括在嚴(yán)緊條件下與本發(fā)明的核酸雜交的序列,所述本發(fā)明的核酸包括本發(fā)明的示例性序列,例如如下所示的序列SEQIDNO:l,SEQIDNO:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQID15NO:ll,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,SEQIDSEQIDNO:25,SEQIDNO:27,SEQIDNO:29,SEQIDSEQIDNO:35,SEQIDNO:37,SEQIDNO:39,SEQIDSEQIDNO:45,SEQIDNO:47,SEQIDNO:49,SEQIDSEQIDNO:55,SEQIDNO:57,SEQIDNO:59,SEQIDSEQIDNO:65,SEQIDNO:67,SEQIDNO:69,SEQIDSEQIDNO:75,SEQIDNO:77,SEQIDNO:79,SEQIDSEQIDNO:85,SEQIDNO:87,SEQIDNO:89,SEQIDSEQIDNO:95,SEQIDNO:97,SEQIDNO:99'SEQIDNO:101,SEQIDNO:103,SEQIDNO:105,SEQIDNO:107,SEQIDNO:109,25SEQIDNO:lll,SEQIDNO:113,SEQIDNO:115'SEQIDNO:117,SEQIDNO:119,SEQIDNO:121,SEQIDNO:123,SEQIDNO:125,SEQIDNO:127,SEQIDNO:129,SEQIDNO:131,SEQIDNO:133,SEQIDNO:135,SEQIDNO:137,SEQIDNO:139,SEQIDNO:141,SEQIDNO:143,SEQIDNO:145,SEQIDNO:147,SEQIDNO:149,SEQIDNO:151,SEQIDNO:153'SEQIDNO:155'30SEQIDNO:157,SEQIDNO:159,SEQIDNO:161,SEQIDNO:163或SEQIDNO:165(也參見下面的表l、2和3、實(shí)施例1和4),或其片段或其子序列。一方面,該核酸編碼具有纖維素酶活性的多肽,例如,具有內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。該核酸的長度可以是至少大約10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、35500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200或更多殘基,或基因的全長或轉(zhuǎn)錄物的全長。一方面,嚴(yán)緊條件包括洗滌步20NO:21NO:31NO:41NO:51NO:61NO:71NO:81NO:91SEQIDNO:23'SEQIDNO:33,SEQIDNO:43,SEQIDNO:53,SEQIDNO:63,SEQIDNO:73,SEQIDNO:83,SEQIDNO:93,驟,包括在0.2XSSC中在大約65'C的溫度洗滌大約15分鐘。本發(fā)明提供了核酸探針,其用于鑒定或分離編碼具有纖維素酶活性——例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽的核酸,其中所述探針含有核酸序列的至少大約10、15、20、25、30、35、40、545、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多個(gè)連續(xù)堿基,所述核酸序列包括本發(fā)明的序列或其片段或其子序列,其中所述探針通過結(jié)合或雜交來鑒定核酸。該探針可以包括寡核苷酸,該寡核苷酸含有核酸序列的至少大約10到50、大約20到60、大約30到70、大約40到80或大約6010至ljl00個(gè)連續(xù)堿基,所述核酸序列包括本發(fā)明的序列或其片段或其子序列。本發(fā)明提供了核酸探針,其用于鑒定或分離編碼具有纖維素酶活性——例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性——的多肽的核酸,其中所述探針包括含有本發(fā)明核酸的至少大約10、15、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、15650、700、750、800、850、900、950、1000或更多殘基所示的序列的核酸,所述本發(fā)明核酸例如與本發(fā)明的示例性核酸具有至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、2094%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的多核苷酸。一方面,序列同一性通過運(yùn)用序列比較算法的分析或通過視覺觀察來確定。在可選的方面中,該探針可以包括寡核苷酸,該寡核苷酸含有本發(fā)明的核酸序列或其子序列的至少大約10到50、大約20到60、大約30到70、大約40到80或大約60到IOO個(gè)連續(xù)堿基。25本發(fā)明提供了擴(kuò)增引物序列對(duì),其用于擴(kuò)增(例如,通過PCR)編碼具有纖維素酶活性——例如,內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽的核酸,其中該引物對(duì)能夠擴(kuò)增含有本發(fā)明的序列或其片段或子序列的核酸。擴(kuò)增引物序列對(duì)的一個(gè)或每一個(gè)成員可以包括寡核苷酸,該寡核苷酸包括該序列的至少大約10到50個(gè)或更多個(gè)連續(xù)堿基,或者包括該序列30的大約10、U、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多個(gè)連續(xù)堿基。本發(fā)明提供了擴(kuò)增引物對(duì),其中所述引物對(duì)包括第一成員和第二成員,第一成員具有本發(fā)明核酸的大約前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多個(gè)殘基所示的序列,第二35成員含有第一成員的互補(bǔ)鏈的大約前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多個(gè)殘基所示的序列。本發(fā)明提供了通過擴(kuò)增產(chǎn)生的編碼纖維素酶的核酸,例如編碼內(nèi)切葡聚糖酶、纖維二糖水解酶和/或p-葡糖苷酶的核酸,所述擴(kuò)增例如聚合酶鏈反應(yīng)(PCR),其中使用本發(fā)明的擴(kuò)增引物對(duì)。本發(fā)明提供了通過擴(kuò)增產(chǎn)生的編碼纖維素酶的核5酸,例如編碼內(nèi)切葡聚糖酶、纖維二糖水解酶和/或P-葡糖苷酶的核酸,所述擴(kuò)增例如聚合酶鏈反應(yīng)(PCR),其中使用本發(fā)明的擴(kuò)增引物對(duì)。本發(fā)明提供了通過擴(kuò)增制備纖維素酶——例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶一一的方法,所述擴(kuò)增例如聚合酶鏈反應(yīng)(PCR),其中使用本發(fā)明的擴(kuò)增引物對(duì)。一方面,所述擴(kuò)增引物對(duì)從文庫例如基因文庫諸如環(huán)境文庫擴(kuò)增核酸。10本發(fā)明提供了擴(kuò)增核酸的方法,所述核酸編碼具有纖維素酶活性的多肽,例如具有內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,所述方法包括用能擴(kuò)增本發(fā)明的核酸序列或其片段或子序列的擴(kuò)增引物序列對(duì)擴(kuò)增模板核酸。本發(fā)明提供了包含本發(fā)明的核酸或其子序列的表達(dá)序列盒。一方面,表達(dá)15序列盒可以包含可操作地連接到啟動(dòng)子上的核酸。啟動(dòng)子可以是病毒、細(xì)菌、哺乳動(dòng)物或植物啟動(dòng)子。一方面,植物啟動(dòng)子可以是馬鈴薯、稻、玉米、小麥、煙草或大麥啟動(dòng)子。啟動(dòng)子可以是組成型啟動(dòng)子。組成型啟動(dòng)子可以包括CaMV35S。另一方面,啟動(dòng)子可以是誘導(dǎo)型啟動(dòng)子。一方面,啟動(dòng)子可以是組織特異性啟動(dòng)子或環(huán)境調(diào)節(jié)型或發(fā)育調(diào)節(jié)型啟動(dòng)于。因此,啟動(dòng)子可以是,例如種子特異性、20葉特異性、根特異性、莖特異性或脫落誘導(dǎo)啟動(dòng)子。一方面,表達(dá)序列盒可以進(jìn)一步包括植物或植物病毒表達(dá)載體。本發(fā)明提供了克隆載體,包括本發(fā)明的表達(dá)序列盒(例如載體)或本發(fā)明的核酸??寺≥d體可以是病毒載體、質(zhì)粒、噬菌體(phage)、噬粒、粘粒(cosmid)、fos-質(zhì)粒(fosmid)、細(xì)菌噬菌體(bacteriophage)或人工染色體。病毒載體可以包25括腺病毒載體、逆轉(zhuǎn)錄病毒載體或腺相關(guān)病毒載體??寺≥d體可以包括細(xì)菌人工染色體(BAC)、質(zhì)粒、細(xì)菌噬菌體P1衍生載體(PAC)、酵母人工染色體(YAC)或哺乳動(dòng)物人工染色體(MAC)。本發(fā)明提供了包含本發(fā)明的核酸或本發(fā)明的表達(dá)序列盒(例如載體)或本發(fā)明的克隆載體的轉(zhuǎn)化細(xì)胞。一方面,轉(zhuǎn)化細(xì)胞可以是細(xì)菌細(xì)胞、哺乳動(dòng)物細(xì)胞、30真菌細(xì)胞、酵母細(xì)胞、昆蟲細(xì)胞或植物細(xì)胞。一方面,植物細(xì)胞可以是大豆、油菜籽、含油種子、番茄、甘蔗、谷類、馬鈴薯、小麥、稻、玉米、煙草或大麥細(xì)胞。本發(fā)明提供了包含本發(fā)明核酸或本發(fā)明表達(dá)序列盒(例如載體)的轉(zhuǎn)基因非人動(dòng)物。一方面,該動(dòng)物是小鼠、大鼠、豬、山羊或綿羊。35本發(fā)明提供了包含本發(fā)明核酸或本發(fā)明表達(dá)序列盒(例如載體)的轉(zhuǎn)基因植物。轉(zhuǎn)基因植物可以是谷類植物、玉米植物、馬鈴薯植物、番茄植物、小麥植物、含油種子植物、油菜籽植物、大豆植物、水稻植物、大麥植物或煙草植物。本發(fā)明提供了包含本發(fā)明核酸或本發(fā)明表達(dá)序列盒(例如載體)的轉(zhuǎn)基因種子。轉(zhuǎn)基因種子可以是谷類種子、玉米種子、小麥粒、含油種子、油菜籽、大豆種子、棕櫚核、向日葵種子、芝麻種子、花生或煙草植物種子。5本發(fā)明提供了包含與本發(fā)明的核酸互補(bǔ)的核酸序列或能與本發(fā)明的核酸在嚴(yán)緊條件下雜交的核酸序列的反義寡核苷酸。本發(fā)明提供了抑制纖維素酶例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶信息在細(xì)胞中翻譯的方法,該方法包括給細(xì)胞施用反義寡核苷酸或在細(xì)胞中表達(dá)反義寡核苷酸,所述反義寡核苷酸包括與本發(fā)明的核酸互補(bǔ)的核酸序列或能與本發(fā)明的核酸在嚴(yán)緊10條件下雜交的核酸序列。一方面,所述反義寡核苷酸的長度在大約10到50、大約20到60、大約30到70、大約40到80或大約60到100個(gè)堿基之間,例如長度為10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、IOO或更多個(gè)堿基。本發(fā)明提供了抑制纖維素酶例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶信息在細(xì)胞中翻譯的方法,該方法包括給細(xì)胞施15用反義寡核苷酸或在細(xì)胞中表達(dá)反義寡核苷酸,所述反義寡核苷酸包括與本發(fā)明的核酸互補(bǔ)的核酸序列或能與本發(fā)明的核酸在嚴(yán)緊條件下雜交的核酸序列。本發(fā)明提供了含有本發(fā)明的序列的子序列的雙鏈抑制RNA(RNAi或RNA干擾)分子(包括小干擾性RNA,或siRNA,用于抑制轉(zhuǎn)錄,以及微RNA或miRNA,用于抑制翻譯)。在一個(gè)方面,siRNA的長度為大約21至24個(gè)殘基之間,或大約20至少15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多個(gè)雙鏈核苷酸。本發(fā)明提供了抑制纖維素酶例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶在細(xì)胞中的表達(dá),所述方法包括向所述細(xì)胞施用雙鏈抑制RNA(siRNA或miRNA)或在所述細(xì)胞中表達(dá)雙鏈抑制RNA(siRNA25或miRNA),其中所述RNA含有本發(fā)明的序列的子序列。本發(fā)明提供了分離的或重組的多肽,包括在至少大約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350或更多個(gè)殘基的區(qū)域內(nèi)或者在多肽的全長區(qū)域內(nèi),與本發(fā)明的示例性多肽或肽具有至少大約50%、51%、52%、53%、54%、3055%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的氨基酸序列。一方面,序列同一性通過運(yùn)用序列比較算法的分析或通過視覺觀察來確35定。本發(fā)明的示例性多肽或肽序列包括SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQDDNO:8,SEQIDNO:IO,SEQIDNO:12,SEQIDNO:14,SEQIDN0:16,SEQIDNO:I8,SEQIDNO:20,SEQIDNO:22,SEQIDNO:24,SEQIDNO:26,SEQIDNO:28,SEQIDNO:30,SEQIDNO:32,SEQIDNO:34,SEQIDNO:36,SEQIDNO:38,SEQIDNO:40,SEQIDNO:42,SEQIDNO:44,SEQIDNO:46,SEQIDNO:48,SEQIDNO:50,SEQIDNO:52,SEQIDNO:54,SEQIDNO:56,5SEQIDNO:58,SEQIDNO:60,SEQIDNO:62,SEQIDNO:64,SEQIDNO:66,SEQIDNO:68,SEQIDNO:70,SEQIDNO:72,SEQIDNO:74,SEQIDNO:76,SEQIDNO:78,SEQIDNO:80,SEQIDNO:82,SEQIDNO:84,SEQIDNO:86,SEQIDNO:88,SEQIDNO:90,SEQIDNO:92,SEQIDNO:94,SEQIDNO:96,SEQIDNO:98,SEQIDNO:100,SEQIDNO:102,SEQIDNO:104'SEQIDNO:106'10SEQIDNO:108'SEQIDNO:llO,SEQIDNO:112,SEQIDNO:114,SEQIDNO:116,SEQIDNO:m,SEQIDNO:120,SEQIDNO:122,SEQIDNO:124,SEQIDNO:126'SEQIDNO:128,SEQIDNO:130,SEQIDNO:132,SEQIDNO:134,SEQIDNO:136,SEQIDNO:138,SEQIDNO:140,SEQIDNO:142,SEQIDNO:144,SEQIDNO:146,SEQIDNO:148,SEQIDNO:150,SEQIDNO:152,15SEQIDNO:154,SEQIDNO:156,SEQIDNO:158,SEQIDNO:160,SEQIDNO:162,SEQIDNO:164和SEQIDNO:166(也參見下面的表1、2禾Q3、實(shí)施例l和4,和序列表)及其子序列和其變體。示例性多肽還包括長度為至少大約10、15、20、25、30、35、40、45、50、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600或更多個(gè)殘基的片段,或者為酶的全長區(qū)域20內(nèi)的片段。本發(fā)明的多肽或肽序列包括由本發(fā)明的核酸編碼的序列。本發(fā)明的多肽或肽序列包括由本發(fā)明的抗體特異性結(jié)合的多肽或肽(例如,表位),或可產(chǎn)生本發(fā)明的抗體的多肽或肽(例如,免疫原)?!矫?,本發(fā)明的多肽具有至少一種纖維素酶活性,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。在可選的方面,本發(fā)明的多25核苷酸編碼具有至少一種纖維素酶活性的多肽,例如具有內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽。—方面,纖維素酶活性,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,是熱穩(wěn)定的。多肽在包括如下溫度范圍的條件下可以保持纖維素酶活性,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖30苷酶活性大約rC到大約5'C之間,大約5'C到大約15'C之間,大約15'C到大約25'C之間,大約25。C到大約37。C之間,大約37X:到大約95。C之間,大約55'C到大約85。C之間,大約7(TC到大約75。C之間,或大約90'C到大約95'C之間,或更高溫度。在另一方面,纖維素酶活性,例如,內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性,可以是耐熱的。該多肽在暴露于如下范圍內(nèi)的35溫度后可以保持纖維素酶活性,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性37'C以上到大約95'C,或55'C以上到大約85'C的范圍內(nèi)。一方面,該多肽在pH4.5時(shí)暴露于90'C以上到大約95'C的溫度后可以保持纖維素酶活性,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。本發(fā)明的另一方面提供了分離的或重組的多肽或肽,包括本發(fā)明的多肽或5肽序列、與其基本上相同的序列、與其互補(bǔ)的序列的至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150或更多個(gè)連續(xù)堿基。該肽可以是例如免疫原性片段、基序(例如結(jié)合位點(diǎn))、信號(hào)序列、前原序歹'J(preprosequence)或活性位點(diǎn)。本發(fā)明提供了分離的或重組的核酸,包括編碼具有纖維素酶活性例如,內(nèi)]0切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的多肽和信號(hào)序列的序列,其中所述核酸包括本發(fā)明的序列。信號(hào)序列可以來源于另一種纖維素酶,例如,內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,或者非纖維素酶,例如非內(nèi)切葡聚糖酶、非纖維二糖水解酶和/或非p-葡糖苷酶(異源)。本發(fā)明提供了分離的或重組的核酸,包括編碼具有纖維素酶活性,例如內(nèi)切葡聚15糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶活性的多肽的序列,其中所述序列不含有信號(hào)序列,所述核酸包括本發(fā)明的序列。一方面,本發(fā)明提供了分離的或重組的多肽,包括本發(fā)明的多肽,其缺少信號(hào)序列的全部或部分。一方面,所述分離的或重組的多肽可以包括本發(fā)明的多肽,其含有異源信號(hào)序列,例如異源纖維素酶信號(hào)序列如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖20苷酶信號(hào)序列,或非纖維素酶信號(hào)序列如非內(nèi)切葡聚糖酶、非纖維二糖水解酶和/或非P-葡糖苷酶信號(hào)序列。—方面,本發(fā)明提供了嵌合蛋白,其包括含有本發(fā)明的信號(hào)序列的第一結(jié)構(gòu)域和至少第二結(jié)構(gòu)域。該蛋白可以是融合蛋白。第二結(jié)構(gòu)域可以包括酶。該酶可以是非酶(non-enzym(S)。25本發(fā)明提供了嵌合多肽,包括含有本發(fā)明的信號(hào)肽(SP)、前原序列和/或催化結(jié)構(gòu)域(CD)的至少第一結(jié)構(gòu)域以及含有異源多肽或肽的第二結(jié)構(gòu)域,其中所述異源多肽或肽不與所述信號(hào)肽(SP)、前原序列和/或催化結(jié)構(gòu)域(CD)天然相關(guān)。一方面,所述異源多肽或肽不是纖維素酶,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶。所述異源多肽或肽可以在所述信號(hào)肽(SP)、30前原序列和/或催化結(jié)構(gòu)域(CD)的氨基端、羧基端或兩端。本發(fā)明提供了編碼嵌合多肽的分離的或重組的核酸,其中所述嵌合多肽包括含有本發(fā)明的信號(hào)肽(SP)、前原結(jié)構(gòu)域和/或催化結(jié)構(gòu)域(CD)的至少第一結(jié)構(gòu)域以及含有異源多肽或肽的第二結(jié)構(gòu)域,其中所述異源多肽或肽不與所述信號(hào)肽(SP)、前原結(jié)構(gòu)域和/或催化結(jié)構(gòu)域(CD)天然相關(guān)。35本發(fā)明提供了分離的或重組的信號(hào)序列(例如,信號(hào)肽),其包括本發(fā)明的多肽的殘基1至14、1至15、1至16、1至17、1至18、1至19、1至20、115NO:26NO:36NO:46NO:56NO:66NO:76NO:86NO:96SEQIDNO:28,SEQIDNO:38,SEQIDNO:48,SEQIDNO:58,SEQIDNO:68,SEQIDNO:78'SEQIDNO:88,SEQIDNO:98,SEQIDNO:24,SEQIDSEQIDNO:34,SEQIDSEQIDNO:44,SEQIDSEQIDNO:54,SEQIDSEQIDNO:64,SEQIDSEQIDNO:74,SEQIDSEQIDNO:84,SEQIDSEQIDNO:94,SEQID至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1至28、1至30、1至31、1至32、1至33、1至34、1至35、1至36、1至37、1至38、1至40、1至41、1至42、1至43、1至44、1至45、1至46或1至47所示的序列或由本發(fā)明的多肽的殘基1至14、1至15、1至16、1至17、1至18、1至19、51至20、1至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1至28、1至30、1至31、1至32、1至33、1至34、1至35、1至36、1至37、1至38、1至40、1至41、1至42、1至43、1至44、1至45、1至46或1至47所示的序列組成,本發(fā)明的多肽例如示例性的SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12'SEQIDNO:14,SEQID10NO:16,SEQIDNO:18,SEQIDNO:20,SEQIDNO:22,SEQIDNO:30,SEQIDNO:32,SEQIDNO:40,SEQIDNO:42,SEQIDNO:50,SEQIDNO:52,SEQIDNO:60,SEQIDNO:62,SEQIDNO:70,SEQIDNO:72,SEQIDNO:80,SEQIDNO:82,SEQIDNO:90,SEQIDNO:92,SEQIDNO:100,SEQIDNO:102,SEQIDNO:104,SEQIDNO:106,SEQIDNO:108,SEQIDNO:110,SEQIDNO:112,SEQIDNO:114,20SEQIDNO:116,SEQIDNO:118,SEQIDNO:120,SEQIDNO:122,SEQIDNO:124,SEQIDNO:I26,SEQIDNO:128,SEQIDNO:130,SEQIDNO:132,SEQIDNO:134,SEQIDNO:136,SEQIDNO:138,SEQIDNO:140,SEQIDNO:142,SEQIDNO:144,SEQIDNO:146,SEQIDNO:148,SEQIDNO:150,SEQIDNO:152,SEQIDNO:154,SEQIDNO:156,SEQIDNO:158,SEQID25NO:160,SEQIDNO:162,SEQIDNO:164或SEQIDNO:166(也參見下面的表1、2和3、實(shí)施例1和4,以及序列表)。一方面,本發(fā)明提供了信號(hào)序列,其包括本發(fā)明的多肽的前14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、3064、65、66、67、68、69、70或更多個(gè)氨基端殘基。—方面,纖維素酶活性,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性,包括在大約37i:每毫克蛋白大約1到大約1200單位,或每毫克蛋白大約100到大約1000單位的范圍內(nèi)的比活性。另一方面,纖維素酶活性,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶活性,35包括每毫克蛋白從大約100到大約1000單位,或從大約500到大約750單位的比活性。可以選擇地,纖維素酶活性,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,包括在37'C每毫克蛋白從大約1到大約750單位,或每毫克蛋白大約500到大約1200單位的范圍內(nèi)的比活性。一方面,纖維素酶活性,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,包括在37'C每毫克蛋白從大約1到大約500單位,或每毫克蛋白大約750到大約10005單位的范圍內(nèi)的比活性。另一方面,纖維素酶活性,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,包括在37。C每毫克蛋白從大約1到大約250單位的范圍內(nèi)的比活性??蛇x地,纖維素酶活性,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶活性,包括在37'C每毫克蛋白從大約1到大約100單位的范圍內(nèi)的比活性。10另一方面,耐熱性包括在被加熱到高溫后,保持在37'C時(shí)纖維素酶例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的比活性的至少一半??梢赃x擇地,耐熱性可以包括在被加熱到高溫后,保持在37'C每毫克蛋白從大約1到大約1200單位,或每毫克蛋白大約500到大約1000單位的范圍內(nèi)的比活性。另一方面,耐熱性可以包括在被加熱到高溫后,保持在37'C每毫克蛋白從大約115到大約500單位的范圍內(nèi)的比活性。本發(fā)明提供了本發(fā)明的分離的或重組的多肽,其中所述多肽包括至少一個(gè)糖基化位點(diǎn)。一方面,糖基化可以是N-連接糖基化。一方面,多肽可以在畢赤酵母(i^mton'"或裂變酵母(S./w&)中被表達(dá)后被糖基化。—方面,多肽可以在包括大約pH6.5、pH6、pH5.5、pH5、pH4.5或pH204的更酸性的條件下保持纖維素酶活性,例如,內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。另一方面,多肽可以在包括大約pH7、pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10、pH10.5或pH11或更堿性的條件下保持纖維素酶活性,例如,內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶活性。一方面,多肽可以在暴露于包括大約pH6.5、pH6、pH5.5、pH5、pH254.5或pH4的更酸性pH的條件下保持纖維素酶活性,例如,內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶活性。另一方面,多肽可以在暴露于包括大約pH7、pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10、pH10.5或pH11或更堿性pH的條件下保持纖維素酶活性,例如,內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。30—方面,本發(fā)明的纖維素酶,例如,內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,在堿性條件下,例如在腸道如小腸的堿性條件下,具有活性。一方面,多肽在暴露于胃的酸性pH后保持活性。本發(fā)明提供了含有本發(fā)明的多肽(包括肽)的蛋白制劑,其中該蛋白制劑包括液體、固體或凝膠。本發(fā)明提供了包含本發(fā)明的多肽和第二蛋白或結(jié)構(gòu)域的35異二聚體。該異二聚體的第二成員可以是不同的纖為素酶,例如,內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,不同的酶或另一種蛋白。一方面,第二域結(jié)構(gòu)可以是多肽,異源二聚體可以是融合蛋白。一方面,第二結(jié)構(gòu)域可以是表位(epitope)或標(biāo)記物(tag)。一方面,本發(fā)明提供了包含本發(fā)明的多肽的同型二聚體。本發(fā)明提供了具有纖維素酶活性例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘5露聚糖酶和/或P-葡糖苷酶活性的固定化多肽(包括肽),其中所述固定化多肽包括本發(fā)明的多肽、由本發(fā)明的核酸編碼的多肽、或含有本發(fā)明的多肽和第二結(jié)構(gòu)域的多肽。一方面,多肽可以被固定在細(xì)胞、金屬、樹脂、聚合物、陶瓷、玻璃、微電極、石墨顆粒、珠子、凝膠、平板、陣列或毛細(xì)管上。本發(fā)明還提供了包含本發(fā)明的固定化核酸的陣列,包括,例如本發(fā)明的探10針。本發(fā)明還提供了包含本發(fā)明的抗體的陣列。本發(fā)明提供了分離的或重組的抗體,其與本發(fā)明的多肽或與由本發(fā)明的核酸編碼的多肽特異性結(jié)合。本發(fā)明的這些抗體可以是單克隆或多克隆抗體。本發(fā)明提供了包含本發(fā)明的抗體的雜交瘤,所述抗體例如,與本發(fā)明的多肽或與由本發(fā)明的核酸編碼的多肽特異性結(jié)合的抗體。本發(fā)明提供了編碼這些抗體的核酸。15本發(fā)明提供了分離或鑒定具有纖維素酶活性如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽的方法,該方法包括如下步驟(a)提供本發(fā)明的抗體;(b)提供包含多肽的樣品;和(c)將步驟(b)的樣品與步驟(a)的抗體在所述抗體能與所述多肽特異性結(jié)合的條件下接觸,從而分離或鑒定具有纖維素酶活性如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖20苷酶活性的多肽。本發(fā)明提供了制備抗纖維素酶抗體——例如抗內(nèi)切葡聚糖酶抗體、抗纖維二糖水解酶抗體和/或抗P-葡糖苷酶抗體——的方法,該方法包括以足夠的量向非人動(dòng)物施用本發(fā)明的核酸或本發(fā)明的多肽或其子序列,所述的量足以產(chǎn)生體液免疫應(yīng)答,由此制備抗纖維素酶抗體,例如,—抗內(nèi)切葡聚糖酶抗體V杭纖餘二糖水25解酶抗體和/或抗P-葡糖苷酶抗體。本發(fā)明提供了產(chǎn)生抗纖維素酶免疫應(yīng)答(細(xì)胞應(yīng)答或體液應(yīng)答)——例如抗內(nèi)切葡聚糖酶免疫應(yīng)答、抗纖維二糖水解酶免疫應(yīng)答和/或抗P-葡糖苷酶免疫應(yīng)答——的方法,該方法包括以足以產(chǎn)生免疫應(yīng)答(細(xì)胞應(yīng)答或體液應(yīng)答)的量向非人動(dòng)物施用本發(fā)明的核酸或本發(fā)明的多肽或其子序列。30本發(fā)明提供了產(chǎn)生重組多肽的方法,包括如下步驟(a)提供與啟動(dòng)子可操作地連接的本發(fā)明的核酸;和(b)在允許多肽表達(dá)的條件下表達(dá)步驟(a)的核酸,從而產(chǎn)生重組多肽。一方面,該方法可進(jìn)一步包括用步驟(a)的核酸轉(zhuǎn)化宿主細(xì)胞,隨后表達(dá)步驟(a)的核酸,從而在轉(zhuǎn)化細(xì)胞中產(chǎn)生重組多肽。本發(fā)明提供了用于鑒定具有纖維素酶活性如內(nèi)切葡聚糖酶、纖維二糖水解35酶、甘露聚糖酶和/或p-葡糖苷酶活性的多肽的方法,該方法包括如下步驟(a)提供本發(fā)明的多肽;或由本發(fā)明的核酸編碼的多肽;(b)提供纖維素酶底物,例如內(nèi)切葡聚糖酶底物、纖維二糖水解酶底物、甘露聚糖酶底物和/或p-葡糖苷酶底物;和(c)用步驟(b)的底物接觸步驟(a)的多肽或其片段或其變體,并且檢測底物量的降低或反應(yīng)產(chǎn)物量的增加,其中底物量的降低或反應(yīng)產(chǎn)物量的增加檢測出具有纖維素酶活性如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡5糖苷酶活性的多肽。一方面,底物可以是含纖維素的化合物。本發(fā)明提供了用于鑒定纖維素酶底物的方法,如內(nèi)切葡聚糖酶底物、纖維二糖水解酶底物、甘露聚糖酶底物和/或p-葡糖苷酶底物,包括如下步驟(a)提供本發(fā)明的多肽;或由本發(fā)明的核酸編碼的多肽;(b)提供測試底物;和(C)用步驟(b)的測試底物接觸步驟(a)的多肽,并且檢測底物量的降低或反應(yīng)產(chǎn)物10量的增加,其中底物量的降低或反應(yīng)產(chǎn)物量的增加檢測出作為纖維素酶底物如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的測試底物。本發(fā)明提供了確定測試化合物是否與多肽特異性結(jié)合的方法,包括如下步驟(a)在允許核酸翻譯為多肽的條件下表達(dá)核酸或包含核酸的載體,其中所述核酸包括本發(fā)明的核酸,或提供本發(fā)明的多肽;(b)提供測試化合物;(c)用測15試化合物接觸多肽;和(d)確定步驟(b)的測試化合物是否與多肽特異性結(jié)合。本發(fā)明提供了用于鑒定纖維素酶活性如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的調(diào)節(jié)劑的方法,包括如下步驟(a)提供本發(fā)明的多肽,或由本發(fā)明的核酸編碼的多肽;(b)提供測試化合物;和(C)用步驟(b)的測試化合物接觸步驟(a)的多肽,并測定纖維素酶如內(nèi)切葡聚糖酶、纖20維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的活性,其中在存在測試化合物的情況下測定的纖維素酶活性——如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性——與不存在測試化合物的情況下測定的活性相比的變化,確定了該測試化合物調(diào)節(jié)纖維素酶活性,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶莉或p-葡糖苷酶活性。一方面T纖維素酶活性,例扭內(nèi)切葡聚糖酶、纖雒25二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,可以通過提供纖維素酶底物,例如內(nèi)切葡聚糖酶底物、纖維二糖水解酶底物、甘露聚糖酶底物和/或p-葡糖苷酶底物,并檢測底物量的降低或反應(yīng)產(chǎn)物量的增加,或底物量的增加或反應(yīng)產(chǎn)物量的降低來測量。與沒有測試化合物時(shí)底物或反應(yīng)產(chǎn)物的量相比,有測試化合物時(shí)底物量的降低或反應(yīng)產(chǎn)物量的增加鑒定出作為纖維素酶如內(nèi)切葡聚糖酶、纖維二糖30水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的激活劑的測試化合物。與沒有測試化合物時(shí)底物或反應(yīng)產(chǎn)物量相比,有測試化合物時(shí)底物量的增加或反應(yīng)產(chǎn)物量的降低鑒定出作為纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的活性的抑制劑的測試化合物。本發(fā)明提供了計(jì)算機(jī)系統(tǒng),該系統(tǒng)包括處理器和數(shù)據(jù)存儲(chǔ)設(shè)備,其中所述35數(shù)據(jù)存儲(chǔ)設(shè)備上已經(jīng)存儲(chǔ)了本發(fā)明的多肽序列或核酸序列(例如由本發(fā)明的核酸編碼的多肽或肽)。一方面,計(jì)算機(jī)系統(tǒng)可以進(jìn)一步包括序列比較算法和數(shù)據(jù)存儲(chǔ)設(shè)備,其中數(shù)據(jù)存儲(chǔ)設(shè)備上已經(jīng)存儲(chǔ)了至少一個(gè)參考序列。另一方面,序列比較算法包括可指出多態(tài)現(xiàn)象(多態(tài)性)的計(jì)算機(jī)程序。一方面,計(jì)算機(jī)系統(tǒng)可以進(jìn)一步包括在所述序列中鑒定一個(gè)或多個(gè)特征的鑒定器(標(biāo)識(shí)符,identifiers本發(fā)明提供了計(jì)算機(jī)可讀介質(zhì),其上已經(jīng)存儲(chǔ)了本發(fā)明的多肽序列或核酸序列。本發(fā)5明提供了用于鑒定序列中的特征的方法,包括如下步驟(a)使用可鑒定序列中的一個(gè)或多個(gè)特征的計(jì)算機(jī)程序讀取序列,其中所述序列包括本發(fā)明的多肽序列或核酸序列;和(b)用所述計(jì)算機(jī)程序鑒定序列中的一個(gè)或多個(gè)特征。本發(fā)明提供了將第一序列與第二序列進(jìn)行比較的方法,包括如下步驟(a)通過使用可比較序列的計(jì)算機(jī)程序讀取第一序列和第二序列,其中第一序列包括本發(fā)明的多肽10序列或核酸序列;和(b)用所述計(jì)算機(jī)程序確定第一序列和第二序列之間的差異。確定第一序列和第二序列之間差異的步驟可以進(jìn)一步包括鑒定多態(tài)性的步驟。一方面,該方法可以進(jìn)一步包括可鑒定序列中的一個(gè)或多個(gè)特征的鑒定器。另一方面,該方法可以包括使用計(jì)算機(jī)程序讀取第一序列,并鑒定該序列中的一個(gè)或多個(gè)特征。15本發(fā)明提供了從環(huán)境樣品中分離或回收核酸的方法,所述核酸編碼具有纖維素酶活性如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,該方法包括如下步驟(a)提供用于擴(kuò)增編碼具有纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的多肽的核酸的擴(kuò)增引物序列對(duì),其中所述引物對(duì)能擴(kuò)增本發(fā)明的核酸;(b)從環(huán)境樣品中分離核酸,20或處理環(huán)境樣品,以便樣品中的核酸可實(shí)現(xiàn)與擴(kuò)增引物對(duì)雜交;和(c)將步驟(a)的擴(kuò)增引物對(duì)與步驟(b)的核酸結(jié)合,并從環(huán)境樣品中擴(kuò)增核酸,從而從環(huán)境樣品中分離或回收編碼具有纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的多肽的核酸。擴(kuò)增引物序列對(duì)的一個(gè)或每一成員可以包括寡核苷酸,該寡核苷酸包括本發(fā)明的擴(kuò)增引物序列對(duì),例如,具有本發(fā)朋的序25列的至少大約10到50個(gè)連續(xù)堿基。本發(fā)明提供了從環(huán)境樣品中分離或回收核酸的方法,所述核酸編碼具有纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,該方法包括如下步驟(a)提供包含本發(fā)明的核酸或其子序列的多核苷酸探針;(b)從環(huán)境樣品分離核酸,或處理環(huán)境樣品,以便樣品中的核酸可實(shí)現(xiàn)與步30驟(a)的多核苷酸探針雜交;(c)將步驟(a)的多核苷酸探針與步驟(b)的分離的核酸或處理的環(huán)境樣品結(jié)合;和(d)分離與步驟(a)的多核苷酸探針特異性雜交的核酸,從而從環(huán)境樣品中分離或回收編碼具有纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽的核酸。環(huán)境樣品可以包括水樣品、液體樣品、土壤樣品、空氣樣品或生物樣品。一方面,生物樣品可35以來源于細(xì)菌細(xì)胞、原生動(dòng)物細(xì)胞、昆蟲細(xì)胞、酵母細(xì)胞、植物細(xì)胞、真菌細(xì)胞或哺乳動(dòng)物細(xì)胞。本發(fā)明提供了產(chǎn)生編碼具有纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或)3-葡糖苷酶活性的多肽的核酸變體的方法,該方法包括如下步驟(a)提供包括本發(fā)明的核酸的模板核酸;和(b)在模板序列中修飾、刪除或添加一個(gè)或多個(gè)核苷酸,或進(jìn)行修飾、刪除和添加的組合,以產(chǎn)生模板核酸的變體。5—方面,該方法可以進(jìn)一步包括表達(dá)變體核酸,以產(chǎn)生變體纖維素酶多肽,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶多肽。修飾、添加或刪除通過包括如下方法中的方法來引入,包括易錯(cuò)PCR、改組(重排,shuffling)、寡核苷酸誘導(dǎo)的定向突變、裝配PCR、有性PCR誘變、體內(nèi)誘變、盒式誘變、遞歸整體誘變(recursiveensemblemutagenesis)、指數(shù)整體誘變、位點(diǎn)特異性誘變、10基因再裝配、基因位點(diǎn)飽和誘變(GSSM)、合成連接重裝配(SLR)、染色體飽和誘變(CSM)或其組合。另一方面,修飾、添加或刪除通過如下方法的方法引入包括重組、遞歸序列重組、硫代磷酸酯修飾的DNA誘變、含尿嘧啶模板誘變、缺口雙重誘變(gappedduplexmutagenesis)、點(diǎn)錯(cuò)配修復(fù)誘變、修復(fù)缺陷型宿主株誘變、化學(xué)誘變、放射誘變、缺失誘變、限制選擇誘變、限制純化誘變、人工基因15合成、整體誘變、嵌合核酸多聚體生成及其組合?!矫?,該方法可以被反復(fù)重復(fù),直到產(chǎn)生與模板核酸編碼的多肽相比具有改變的或不同的活性或者改變的或不同的穩(wěn)定性的纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶。一方面,變體纖維素酶多肽,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶多肽,是耐熱的,20在暴露于升高的溫度之后可以保持一些活性。另一方面,與模板核酸編碼的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶相比,變體纖維素酶多肽,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶多肽,具有增加的糖基化??梢赃x擇地,變體纖維素酶多肽,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶多肽,在高溫下具有纖維素酶話性,25例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,其中由模板核酸編碼的纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶,在高溫下沒有活性。一方面,該方法可以被反復(fù)重復(fù),直到產(chǎn)生具有與模板核酸的密碼子使用有所不同的密碼子使用的纖維素酶編碼序列,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或l3-葡糖苷酶編碼序列。另一方面,該30方法可以被反復(fù)重復(fù),直到產(chǎn)生具有比模板核酸的信息表達(dá)或穩(wěn)定性更高或更低水平的信息表達(dá)或穩(wěn)定性的纖維素酶基因,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶基因。本發(fā)明提供了在編碼具有纖維素酶活性——如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性——的多肽的核酸中修飾密碼子以增加其35在宿主細(xì)胞中的表達(dá)的方法,該方法包括如下步驟(a)提供編碼具有纖維素酶活性——如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性一一的多肽的本發(fā)明的核酸;和(b)鑒定步驟(a)的核酸中非優(yōu)選或較不優(yōu)選的密碼子,用優(yōu)選的或中度使用(neutrallyused)的密碼子來代替,所述優(yōu)選或中度使用的密碼子編碼與被取代的密碼子相同的氨基酸,其中優(yōu)選密碼子是在宿主細(xì)胞的基因的編碼序列中過度表現(xiàn)的密碼子,非優(yōu)選或較不優(yōu)選密碼子是在宿主細(xì)5胞的基因的編碼序列中表現(xiàn)不足的密碼子,從而修飾核酸以增加其在宿主細(xì)胞中的表達(dá)。本發(fā)明提供了在編碼具有纖維素酶活性——如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽的核酸中修飾密碼子的方法,該方法包括如下步驟(a)提供本發(fā)明的核酸;和(b)鑒定歩驟(a)的核酸中的10密碼子,并用不同的密碼子來代替,所述不同的密碼子編碼與被取代的密碼子相同的氨基酸,從而修飾在編碼纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的核酸中的密碼子。本發(fā)明提供了在編碼具有纖維素酶活性——如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽的核酸中修飾密碼子以增加其15在宿主細(xì)胞中的表達(dá)的方法,該方法包括如下步驟(a)提供編碼纖維素酶多肽如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶多肽的本發(fā)明核酸;和(b)鑒定步驟(a)的核酸中的非優(yōu)選或較不優(yōu)選密碼子,并用優(yōu)選的或中度使用的密碼子來代替,所述優(yōu)選或中度使用的密碼子編碼與被取代的密碼子相同的氨基酸,其中優(yōu)選密碼子是在宿主細(xì)胞的基因的編碼序列中過度表現(xiàn)的密20碼子,非優(yōu)選或較不優(yōu)選密碼子是在宿主細(xì)胞的基因的編碼序列中表現(xiàn)不足的密碼子,從而修飾核酸以增加其在宿主細(xì)胞中的表達(dá)。本發(fā)明提供了在編碼具有纖維素酶活性——如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽的核酸中修飾密碼子以降低其在宿主細(xì)胞中的表達(dá)的方法,該方法包括如下步驟(a)提供本發(fā)明的核酸;和25(b)鑒定步驟(a)的核酸中的至少一個(gè)優(yōu)選密碼子,并用非優(yōu)選的或較不優(yōu)選的密碼子來代替,所述非優(yōu)選或較不優(yōu)選的密碼子編碼與被取代的密碼子相同的氨基酸,其中優(yōu)選密碼子是在宿主細(xì)胞的基因的編碼序列中過度表現(xiàn)的密碼子,非優(yōu)選或較不優(yōu)選的密碼子是在宿主細(xì)胞的基因的編碼序列中表現(xiàn)不足的密碼子,從而修飾核酸以降低其在宿主細(xì)胞中的表達(dá)。一方面,宿主細(xì)胞可以是細(xì)菌30細(xì)胞、真菌細(xì)胞、昆蟲細(xì)胞、酵母細(xì)胞、植物細(xì)胞或哺乳動(dòng)物細(xì)胞。本發(fā)明提供了用于產(chǎn)生核酸文庫的方法,所述核酸編碼一系列的被修飾的纖維素酶——例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶——活性位點(diǎn)或底物結(jié)合位點(diǎn),其中被修飾的活性位點(diǎn)或底物結(jié)合位點(diǎn)來源于第一核酸,所述第一核酸包含編碼第一活性位點(diǎn)或第一底物結(jié)合位點(diǎn)的序列,該方35法包括如下步驟(a)提供第一核酸,其編碼第一活性位點(diǎn)或第一底物結(jié)合位點(diǎn),其中所述第一核酸序列包括在嚴(yán)緊條件下與本發(fā)明的核酸雜交的序列,所述核酸編碼纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性位點(diǎn)或纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶底物結(jié)合位點(diǎn);(b)提供一組誘變寡核苷酸,其在第一核酸的多個(gè)目標(biāo)密碼子處編碼天然發(fā)生的氨基酸變體;和(C)使用該組誘變寡核苷酸,產(chǎn)生一組編碼活5性位點(diǎn)或編碼底物結(jié)合位點(diǎn)的變體核酸,其在被誘變的每一氨基酸密碼子處編碼一定范圍的氨基酸變化,從而產(chǎn)生編碼多個(gè)被修飾的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性位點(diǎn)或底物結(jié)合位點(diǎn)的核酸文庫。一方面,該方法包括通過包括如下方法中的方法誘變步驟(a)的第一核酸優(yōu)化的定向進(jìn)化系統(tǒng)、基因位點(diǎn)飽和誘變(GSSM)、合成連接重裝配(SLR)、易10錯(cuò)PCR、改組、寡核苷酸誘導(dǎo)的定向突變、裝配PCR、有性PCR誘變、體內(nèi)誘變、盒式誘變、遞歸整體誘變、指數(shù)整體誘變、位點(diǎn)特異性誘變、基因再裝配及其組合。另一方面,該方法包括通過包括如下方法中的方法誘變步驟(a)的第一核酸或變體重組、遞歸序列重組、硫代磷酸酯修飾的DNA誘變、含尿嘧啶模板誘變、缺口雙重誘變、點(diǎn)錯(cuò)配修復(fù)誘變、修復(fù)缺陷型宿主株誘變、化學(xué)誘變、放射誘變、15缺失誘變、限制選擇誘變、限制純化誘變、人工基因合成、整體誘變、嵌合核酸多聚體生成及其組合。本發(fā)明提供了產(chǎn)生小分子的方法,包括如下步驟(a)提供多個(gè)能合成或修飾小分子的生物合成酶,其中這些酶中的一種酶包括由本發(fā)明的核酸編碼的纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶;(b)20為步驟(a)的至少一種酶提供底物;和(c)將步驟(b)的底物與這些酶在能促進(jìn)多個(gè)生物催化反應(yīng)的條件下通過一系列生物催化反應(yīng)進(jìn)行反應(yīng),以產(chǎn)生小分子。本發(fā)明提供了修飾小分子的方法,包括如下步驟(a)提供纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶,其中該酶包括本發(fā)明的多肽,或由本發(fā)明的核酸編碼的多肽,或其子序列;(b)提供小分子;和(c)將25步驟(b)的小分子與步驟(a)的酶在能促進(jìn)由纖維素酶如內(nèi)切葡聚糖酶、纖維一.糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶催化的酶促反應(yīng)的條件下進(jìn)行反應(yīng),從而通過纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶酶促反應(yīng)修飾小分子。一方面,該方法可以包括為步驟(a)的酶提供多個(gè)小分子底物,從而產(chǎn)生通過由纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶30和/或卩-葡糖苷酶催化的至少一種酶促反應(yīng)產(chǎn)生的被修飾小分子的文庫。一方面,該方法可以包括多個(gè)其它的酶,在有助于這些酶介導(dǎo)的多個(gè)生物催化反應(yīng)的條件下使用這些酶,以形成由多個(gè)酶促反應(yīng)產(chǎn)生的被修飾小分子的文庫。另一方面,該方法可以進(jìn)一步包括測試該文庫以確定該文庫中是否存在表現(xiàn)出期望活性的特定被修飾小分子的步驟。測試該文庫的步驟可以進(jìn)一步包括系統(tǒng)地去除所有但保35留一個(gè)用于產(chǎn)生文庫中多個(gè)被修飾小分子中的一部分的生物催化反應(yīng),方法是通過測試被修飾小分子的所述部分中存在或不存在具有期望活性的特定被修飾小分子,鑒定出產(chǎn)生具有期望活性的特定修飾小分子的至少一個(gè)特定生物催化反應(yīng)。本發(fā)明提供了確定纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的功能片段的方法,包括如下步驟(a)提供纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,其中該酶包括本發(fā)明5的多肽或由本發(fā)明的核酸編碼的多肽、或其子序列;和(b)從步驟(a)的序列刪除多個(gè)氨基酸殘基,并測試剩余的子序列的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性,從而確定纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的功能片段。一方面,纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性通過提供纖維10素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶底物并檢測底物量的減少或反應(yīng)產(chǎn)物量的增加來測量。本發(fā)明提供了通過使用實(shí)時(shí)代謝流(real-timemetabolicflux)分析進(jìn)行新的或修飾的表型的全細(xì)胞工程改造的方法,該方法包括如下步驟(a)通過修飾細(xì)胞的遺傳組成產(chǎn)生修飾的細(xì)胞,其中所述遺傳組成通過將本發(fā)明的核酸加入到15細(xì)胞來修飾(b)培養(yǎng)修飾的細(xì)胞以產(chǎn)生多個(gè)修飾的細(xì)胞;(c)通過實(shí)時(shí)監(jiān)控步驟(b)的細(xì)胞培養(yǎng)物來測量該細(xì)胞的至少一個(gè)代謝參數(shù);和(d)分析步驟(c)的數(shù)據(jù),以確定被測量的參數(shù)是否與在類似條件下未修飾細(xì)胞中的參照測量值不同,從而使用實(shí)時(shí)代謝流量分析鑒定細(xì)胞中的工程表型。一方面,細(xì)胞的遺傳組成可以通過包括在細(xì)胞中序列的刪除或序列的修飾,或敲除基因的表達(dá)的方法來20修飾。一方面,該方法可以進(jìn)一步包括選擇含有新的工程表現(xiàn)型的細(xì)胞。另一方面,該方法可以包括培養(yǎng)被選擇的細(xì)胞,從而產(chǎn)生包含新的工程表型的新細(xì)胞株。本發(fā)明提供了增加纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的多肽的耐熱性或熱穩(wěn)定性的方法,該方法包括糖基化纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的多肽,其中25該多肽包括本發(fā)明的多肽或由本發(fā)明的核酸序列編碼的多肽的至少三十個(gè)連續(xù)氨基酸,從而增加纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶的多肽的耐熱性或熱穩(wěn)定性。一方面,纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的比活性可以在大于大約37'C到大約95'C的溫度范圍內(nèi)是熱穩(wěn)定的或耐熱的。30本發(fā)明提供了在細(xì)胞中過量表達(dá)重組纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的多肽的方法,該方法包括表達(dá)含有核酸的載體,該核酸包括本發(fā)明的核酸或本發(fā)明的核酸序列,其中序列同一性通過使用序列比較算法的分析或通過視覺觀察來確定,其中過量表達(dá)通過使用高活性啟動(dòng)子、雙順反子(dicistronic)載體或通過該載體的基因擴(kuò)增來實(shí)現(xiàn)。35本發(fā)明提供了產(chǎn)生轉(zhuǎn)基因植物的方法,該方法包括如下步驟(a)將異源核酸序列引入細(xì)胞中,其中異源核酸序列包括本發(fā)明的核酸序列,從而產(chǎn)生轉(zhuǎn)化的植物細(xì)胞;和(b)從轉(zhuǎn)化的細(xì)胞產(chǎn)生轉(zhuǎn)基因植物。一方面,歩驟(a)可以進(jìn)一步包括通過植物細(xì)胞原生質(zhì)體的電穿孔或顯微注射引入異源核酸序列。另一方面,歩驟(a)可以進(jìn)一歩包括通過DNA微粒轟擊(DNAparticlebombardment)將異源核酸序列直接引入植物組織中??梢赃x擇地,歩驟(a)可以進(jìn)一歩包括使5用根瘤農(nóng)桿菌(Jgra6ac/m'ww/M膨/adms)宿主將異源核酸序列引入植物細(xì)胞DNA中。一方面,植物細(xì)胞可以是甘蔗、甜菜、大豆、番茄、馬鈴薯、玉米、稻、小麥、煙草或大麥細(xì)胞。本發(fā)明提供了在植物細(xì)胞中表達(dá)異源核酸序列的方法,該方法包括如下步驟(a)用與啟動(dòng)子可操作地連接的的異源核酸序列轉(zhuǎn)化植物細(xì)胞,其中異源核10酸序列包括本發(fā)明的核酸;(b)在異源核酸序列可在植物細(xì)胞中表達(dá)的條件下培養(yǎng)所述植物。本發(fā)明提供了在植物細(xì)胞中表達(dá)異源核酸序列的方法,該方法包括如下步驟(a)用與啟動(dòng)子可操作地連接的的異源核酸序列轉(zhuǎn)化植物細(xì)胞,其中異源核酸序列包括本發(fā)明的序列;(b)在異源核酸序列可在植物細(xì)胞中表達(dá)的條件下培養(yǎng)所述植物。15本發(fā)明提供了飼料或食物,其含有本發(fā)明的多肽或本發(fā)明的核酸編碼的多肽。一方面,本發(fā)明提供了食品、飼料、液體如飲料(如果汁或啤酒)、面包或面團(tuán)或面包產(chǎn)品、或飲料前體(例如,麥芽汁),其含有本發(fā)明的多肽。本發(fā)明提供了動(dòng)物的食物或營養(yǎng)補(bǔ)充劑,其含有本發(fā)明的多肽,例如,由本發(fā)明的核酸編碼的多肽。20—方面,食物或營養(yǎng)補(bǔ)充劑中的多肽可以被糖基化。本發(fā)明提供了可食用的酶輸送基質(zhì),其含有本發(fā)明的多肽,例如,由本發(fā)明的核酸編碼的多肽。一方面,該輸送基質(zhì)包括丸劑。一方面,多肽可被糖基化。一方面,纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的活性是耐熱的。另一方面,纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶25的活性是熱穩(wěn)定的。本發(fā)明提供了含有本發(fā)明的多肽的食物、飼料或營養(yǎng)補(bǔ)充劑。本發(fā)明提供了將纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶用作動(dòng)物飲食中的營養(yǎng)補(bǔ)充劑的方法,所述方法包括制備含有纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的營養(yǎng)添加物,所述纖維30素酶包含本發(fā)明的多肽的至少三十個(gè)連續(xù)氨基酸;以及向動(dòng)物施用所述營養(yǎng)添加物。動(dòng)物可以是人、反芻動(dòng)物或單胃動(dòng)物。通過在選自細(xì)菌、酵母、植物、昆蟲、真菌和動(dòng)物的生物體中表達(dá)編碼纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的多核苷酸,可以制備纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶。所述生物體可選自裂變酵母(Spow6e)、35釀酒酵母(S.cem^/ae)、畢赤酵母(尸/cWa,網(wǎng)加^)、大腸桿菌(£.co//.)、鏈霉菌屬某種(&re^o/^cwsp.)、桿菌屬某種(£flc///Wlysp.)和乳酸桿菌屬某種"ac/o6ac///2^sp.)。本發(fā)明提供了可食用的酶輸送基質(zhì),其含有熱穩(wěn)定的重組纖維素酶,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶,如本發(fā)明的多肽。本發(fā)明提供了向動(dòng)物輸送纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖5酶和/或(3-葡糖苷酶補(bǔ)充劑的方法,所述方法包括制備丸劑形式的可食用的酶輸送基質(zhì),其含有粒狀可食用載體以及熱穩(wěn)定的重組纖維素酶,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶,其中所述丸劑容易將包含在其中的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶分散入含水介質(zhì)中,以及向所述動(dòng)物施用該可食用酶輸送基質(zhì)。重組纖維素酶,例如10內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶,可以包括本發(fā)明的多肽。纖維素酶,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,可被糖基化,以在壓丸條件下提供熱穩(wěn)定性。該輸送基質(zhì)可以通過對(duì)含有谷物胚芽和纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的混合物進(jìn)行壓丸而形成。壓丸條件可包括蒸汽的應(yīng)用。壓丸條件可包括15應(yīng)用超過約8(TC的溫度約5分鐘,而該酶保持每毫克蛋白至少大約350到大約900單位的比活性。—方面,本發(fā)明提供了藥物組合物,其含有本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,或者本發(fā)明的核酸編碼的多肽。一方面,藥物組合物作為助消化劑。20在某些方面,含纖維素化合物與具有纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的本發(fā)明多肽在約pH3.0至9.0、10.0、ll.O或更高的范圍的pH下接觸。在其它方面,含纖維素化合物與纖維素酶例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶在約55'C、60°C、65°C、70°C、75°C、80°C、85°C、90。C或更高的溫度下接觸。25本發(fā)明的一個(gè)或多個(gè)方面的細(xì)節(jié)如附圖和下面的描述所示。本發(fā)明的其它特征、目標(biāo)和優(yōu)點(diǎn)將通過說明書和附圖以及權(quán)利要求而更加清楚。此處引述的所有出版物、專利、專利申請(qǐng)、GenBank序列和ATCC保藏物均被特意地引入,以作為參考,用于所有目的。30下面的附圖是本發(fā)明的方面的例證性說明,而不意圖限制權(quán)利要求書所包括的本發(fā)明的范圍。圖l是一個(gè)計(jì)算機(jī)系統(tǒng)的框圖。圖2是一個(gè)流程圖,該圖示意性說明了用于將新核苷酸或蛋白序列與序列35數(shù)據(jù)庫進(jìn)行比較以確定該新序列與數(shù)據(jù)庫中序列之間的同源性水平的過程的一個(gè)方面。圖3是一個(gè)流程圖,該圖示意性說明了在計(jì)算機(jī)中確定兩個(gè)序列是否同源的過程的一個(gè)方面。圖4是一個(gè)流程圖,該圖示意性說明了檢測序列中特征的存在的鑒定過程300的一個(gè)方面。5圖5是纖維二搪結(jié)構(gòu)的示意圖。圖6和7示意性說明了來自纖維己糖的反應(yīng)產(chǎn)物的TLC分析結(jié)果,如在下面的實(shí)施例1中所詳細(xì)討論的。圖8以圖形數(shù)據(jù)進(jìn)行例證性說明,顯示了通過本發(fā)明的示例性酶22/22a(CBH)從PASC釋放纖維二糖,如在下面的實(shí)施例2所詳細(xì)討論的。10圖9以圖形數(shù)據(jù)進(jìn)行例證性說明,顯示了通過本發(fā)明的示例性酶22/22a(CBH)從AVICELMCC釋放纖維二糖,如在下面的實(shí)施例2所詳細(xì)討論的。圖10以圖表數(shù)據(jù)進(jìn)行了例證性說明,顯示了典型的GIGAMATRIXbreakout,其中表達(dá)能夠水解甲基傘形基纖維二糖苷的活性克隆被鑒定,如下面的實(shí)施例4所詳細(xì)討論的。15圖11以圖表數(shù)據(jù)進(jìn)行了例證性說明,通過毛細(xì)管電泳(CE)分析顯示了所選擇的酶對(duì)磷酸溶脹纖維素(phosphoricacid-swollencellulose,PASC)的活性,如下面的實(shí)施例4所詳細(xì)討論的。圖12以圖表數(shù)據(jù)進(jìn)行了例證性說明,數(shù)據(jù)來自本發(fā)明的示例性酶和亞克隆變體在AVICELMicrocrystallineCellulose(MCC)中的分析,其中通過BCA還原20糖測定來分析反應(yīng)產(chǎn)物,如下面的實(shí)施例4所詳細(xì)討論的。圖13以圖表數(shù)據(jù)進(jìn)行了例證性說明,數(shù)據(jù)來自一級(jí)GSSM篩選分析,如下面的實(shí)施例4所詳細(xì)討論的。圖14以圖表數(shù)據(jù)進(jìn)行了例證性說明,數(shù)據(jù)來自二級(jí)GSSM篩選分析,如下面的實(shí)施例4所詳細(xì)討論的。25圖15以圖表數(shù)據(jù)進(jìn)行了例證性說明,數(shù)據(jù)來自混合的或"摻合的"GSSM篩選分析,如下面的實(shí)施例4所詳細(xì)討論的。在不同的附圖中同樣的標(biāo)記符號(hào)表示同樣的要素。發(fā)明詳述30本發(fā)明提供了具有纖維素酶活性例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽、編碼它們的多核苷酸、以及制備和使用這些多核苷酸和多肽的方法。本發(fā)明還提供了纖維素酶,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,編碼這些酶的多核苷酸、這類多核苷酸和多肽的應(yīng)用。35—方面,本發(fā)明提供了纖維素酶,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,其具有增強(qiáng)的催化速率,改善了底物水解過程。在催化速率上的這種增加的效率導(dǎo)致在生產(chǎn)糖類上增加的效率,所述糖類隨后可被微生物用于乙醇生產(chǎn)。一方面,產(chǎn)生本發(fā)明的酶的微生物與產(chǎn)乙醇微生物一起使用。因此,本發(fā)明提供了生產(chǎn)乙醇和制備基于乙醇的"清潔燃料"的方法,例如,用于利用生物乙醇進(jìn)行的運(yùn)輸。5—方面,本發(fā)明提供了組合物(例如,酶制劑、飼料、藥物、飲食補(bǔ)充物),其包括本發(fā)明的酶、多肽或多核苷酸。這些組合物可以以各種形式加以配制,例如液體、凝膠、丸劑、片劑、噴劑、粉末、食物、飼料小丸或包括納米膠囊劑型在內(nèi)的膠囊劑型。測量纖維素酶活性如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-10葡糖苷酶活性的分析試驗(yàn),例如用于確定多肽是否具有纖維素酶活性,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶活性的分析試驗(yàn),在本領(lǐng)域中是熟知的,并且在本發(fā)明的范圍內(nèi);參見,例如BakerWL,PanowA,Estimationofcellulaseactivityusingaglucose-oxidase-Cu(II)reducingassayforglucose,JBiochemBiophysMethods.1991Dec,23(4):265-73jSharrockKR,Cellulaseassay15methods:areview,JBiochemBiophysMethods.1988Oct,17(2):81-105;CarderJH,DetectionandquantitationofcellulasebyCongoredstainingofsubstratesinacup-platediffusionassay,AnalBiochem.1986Feb15,153(l):75-9;CanevasciniG.,Acellulaseassaycoupledtocellobiosedehydrogenase,AnalBiochem.1985Jun,147(2):419-27;HuangJS,TangJ,Sensitiveassayforcellulaseanddextranase.Anal20Biochem.1976Jun,73(2):369隱77。本發(fā)明使用的反應(yīng)條件的pH是本發(fā)明提供的另一個(gè)可變參數(shù)。在某些方面,反應(yīng)的pH在約3.0至約9.0的范圍內(nèi)。在其它方面,pH為約4.5,或pH為約7.5或pH為約9。在堿性條件下進(jìn)行的反應(yīng)條件也可能是有利的,例如,在本發(fā)明的酶的一些工業(yè)應(yīng)用或制藥應(yīng)用中。25本發(fā)明提供了各種形式和配方的本發(fā)明的纖維素酶,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶多肽。在本發(fā)明的方法中,本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶多肽以各種形式和配方使用。例如,純化的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶多肽可以用在酶制劑中,該酶制劑在生物乙醇的30生產(chǎn)中或制藥或飲食助劑應(yīng)用中使用??蛇x地,本發(fā)明的酶可直接用在生產(chǎn)生物乙醇、制備清潔燃料、處理生物廢物、加工食物、液體或詞料等等的各種工藝中。可選地,本發(fā)明的纖維素酶,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶多肽,可使用本領(lǐng)域已知的方法在微生物中表達(dá)。在其它方面,本發(fā)明的纖維素酶,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/35或P-葡糖苷酶多肽,可在用于本發(fā)明的方法之前固定在固體支持物上。將酶固定在固體支持物上的方法在本領(lǐng)域中廣為人知,例如J.Mol.Cat.B:Enzymatic6(1999)29-39;Chivataetal.Biocatalysis:Immobilizedcellsandenzymes,JMol-Cat.37(1986)1-24:Sharmaetal.,ImmobilizedBiomaterialsTechniquesandApplications,Angew.Chem.Int.Ed.Engl.21(1982)837-54:Laskin(Ed.),EnzymesandImmobilizedCellsinBiotechnolog。5核酸、探針和抑制分子(InhibitorvMolecules)本發(fā)明提供了分離的和重組的核酸,例如參見下面的表l、2和3,實(shí)施例l和4,以及序列表;編碼多肽的核酸,包括本發(fā)明的示例性多核苷酸序列,例如,參見表1和序列表;包括表達(dá)序列盒,例如含有本發(fā)明的核酸的表達(dá)載體和各種克隆載體。本發(fā)明還包括使用本發(fā)明的核酸發(fā)現(xiàn)、鑒定或分離新的纖維素酶如內(nèi)10切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶多肽序列的方法。本發(fā)明還包括使用本發(fā)明的核酸抑制編碼纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的基因和轉(zhuǎn)錄物的表達(dá)的方法。還提供了修飾本發(fā)明的核酸的方法,包括通過例如合成連接重裝配、優(yōu)化的定向進(jìn)化系統(tǒng)和/或飽和誘變例如基因位點(diǎn)飽和誘變(GSSM)產(chǎn)生本發(fā)明的核15酸變體的方法。術(shù)語"飽和誘變"、基因位點(diǎn)飽和誘變或"GSSM"包括使用簡并寡核苷酸引物將點(diǎn)突變引入多核苷酸的方法,如在下面所詳細(xì)描述的。術(shù)語"優(yōu)化的定向進(jìn)化系統(tǒng)"或"優(yōu)化的定向進(jìn)化"包括用于重新裝配相關(guān)的核酸序列的片段的方法,所述的相關(guān)核酸序列例如相關(guān)的基因,下面對(duì)其進(jìn)行了詳細(xì)解釋。術(shù)語"合成連接重裝配"或"SLR"包括以非隨機(jī)方式連接寡核苷酸片段的方法,20下面進(jìn)行了詳細(xì)解釋。術(shù)語"變體"是指在一個(gè)或多個(gè)堿基對(duì)、密碼子、內(nèi)含子、外顯子或氨基酸殘基處被(分別地)修飾的本發(fā)明的多核苷酸或多肽,然而它們?nèi)匀槐3直景l(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶生物學(xué)活性。變體可以通過許多種方法產(chǎn)生,包括的方法諸如,例如易錯(cuò)PCR、改組、寡核苷酸誘導(dǎo)的定向突變、裝配PCR、有性PCR誘變、體內(nèi)誘變、25盒式誘變、遞歸整體誘變、指數(shù)整體誘變、位點(diǎn)特異性誘變、基因再裝配、GSSM及其任意組合。本發(fā)明的核酸可以通過,例如cDNA文庫的克隆和表達(dá)、通過PCR進(jìn)行的信息或基因組DNA擴(kuò)增以及類似的技術(shù)來制造、分離和/或操縱。例如,本發(fā)明的示例性核酸最初來源于環(huán)境來源。因此,一方面,本發(fā)明提供了編碼纖維素30酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸,以及由它們編碼的多肽,其共同的新穎性在于它們來源于共同的來源,例如環(huán)境來源、混合的培養(yǎng)物或細(xì)菌來源。在本發(fā)明方法的實(shí)踐中,同源基因可以通過操縱模板核酸加以修飾,如同在文中所描述的。本發(fā)明可以與本
技術(shù)領(lǐng)域
已知的任何方法或程序或設(shè)備一起實(shí)35踐,這些方法、程序或設(shè)備在科學(xué)和專利文獻(xiàn)中有很好的描述。如本文所使用,短語"核酸"或"核酸序列"是指寡核苷酸、核苷酸、多核苷酸,或者寡核苷酸、核苷酸、多核苷酸中任意一種的片段,或者基因組的或合成來源的DNA或RNA,它們可以是單鏈或雙鏈,并且可以代表正義鏈或反義(互補(bǔ))鏈,或者是指肽核酸(PNA)或者天然或合成來源的任何DNA樣或RNA樣的物質(zhì)。短語"核酸"或"核酸序列"包括寡核苷酸、核苷酸、多核苷酸,或5者寡核苷酸、核苷酸、多核苷酸中任意一種的片段,或者基因組的或合成來源的DNA或RNA(例如mRNA、rRNA、tRNA、iRNA),它們可以是單鏈或雙鏈,并且可以代表正義鏈或反義鏈,還包括肽核酸(PNA)或者天然或合成來源的任何DNA樣或RNA樣的物質(zhì),例如包括iRNA、核糖核蛋白(例如雙鏈iRNA,例如iRNPs)。該術(shù)語包括含有天然核苷酸的己知類似物的核酸,例如寡核苷酸。該術(shù)10語也包括具有合成骨架的核酸樣結(jié)構(gòu),例如參見Mata(1997)Toxicol.Appl.Pharmacol.144:189-197;Strauss-Soukup(1997)Biochemistry36:8692-8698;Samstag(1996)AntisenseNucleicAcidDrugDev6:153-156。"寡核苷酸"或者包括單鏈的多脫氧核苷酸,或者包括兩個(gè)互補(bǔ)的多脫氧核苷酸鏈,它們可以是化學(xué)合成的。這樣的合成的寡核苷酸沒有5'磷酸,因此如果不在存在激酶的情況下采用15ATP添加磷酸,該合成寡核苷酸便不會(huì)連接到另一個(gè)寡核苷酸上。合成的寡核苷酸可以連接到?jīng)]有被去磷酸化的片段上。特定多肽或蛋白的"編碼序列"或編碼特定多肽或蛋白的"核苷酸序列"是這樣的核酸序列,其當(dāng)置于合適的調(diào)節(jié)序列的調(diào)控下時(shí)被轉(zhuǎn)錄和翻譯成多肽或蛋白質(zhì)。術(shù)語"基因"意指在產(chǎn)生多肽鏈中所涉及的DNA片段;其包括編碼區(qū)之20前的區(qū)域和之后的區(qū)域(前導(dǎo)區(qū)(leader)和尾區(qū)(trailer)),以及在適用的情況下,可以包括各個(gè)編碼片段(外顯子)之間的間插序列(內(nèi)含子)。啟動(dòng)子序列"可操作地連接到"編碼序列上,此時(shí)RNA聚合酶可以在啟動(dòng)子處起始轉(zhuǎn)錄,將編碼序列轉(zhuǎn)錄成mRNA。正如此處所用,"可操作地連接(operablylinked)"是指兩個(gè)或更多個(gè)核酸(例如DNA)片段之間的功能關(guān)系。"可操作地連接"可以指轉(zhuǎn)錄調(diào)控25序列與被轉(zhuǎn)錄序列的功能關(guān)系。例如,如果啟動(dòng)子刺激或調(diào)節(jié)編碼序列例如本發(fā)明的核酸在適當(dāng)?shù)乃拗骷?xì)胞或其它表達(dá)系統(tǒng)中的轉(zhuǎn)錄,那么該啟動(dòng)子便是可操作地連接到編碼序列。通常,可操作地連接到被轉(zhuǎn)錄序列的啟動(dòng)子轉(zhuǎn)錄調(diào)控序列與被轉(zhuǎn)錄序列是物理上相鄰的,即它們是順式作用。然而,一些轉(zhuǎn)錄調(diào)控序列,如增強(qiáng)子,不需要與編碼序列物理相鄰或者位于與編碼序列接近的位置,但這些轉(zhuǎn)30錄調(diào)控序列仍能增強(qiáng)編碼序列的轉(zhuǎn)錄。正如本文所用,術(shù)語"表達(dá)序列盒(expressioncassette)"指能影響結(jié)構(gòu)基因(即蛋白編碼序列,例如,編碼本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶的序列)在與這樣的序列相容的宿主中的表達(dá)的核苷酸序列。表達(dá)序列盒包括至少一個(gè)與多肽編碼序列可操作地連接的啟動(dòng)35子;并且任選地,可以與其它序列例如轉(zhuǎn)錄終止信號(hào)序列可操作地連接。也可以使用其它的在實(shí)現(xiàn)表達(dá)的方面必需的或有用的因子,例如增強(qiáng)子、a-因子。因此,表達(dá)序列盒也包括質(zhì)粒、表達(dá)載體、重組病毒、任何形式的重組"裸DNA"載體,以及類似物。"載體"包括可以感染、轉(zhuǎn)染、短暫或永久地轉(zhuǎn)導(dǎo)細(xì)胞的核酸。應(yīng)該認(rèn)識(shí)到,載體可以是裸核酸、或與蛋白或脂質(zhì)復(fù)合的核酸。該載體任選地包含病毒或細(xì)菌核酸和/或蛋白,和/或膜(例如細(xì)胞膜、病毒脂質(zhì)包被等等)。載體包括5但不限于復(fù)制子(例如RNA復(fù)制子、細(xì)菌噬菌體),DNA片段可以連接到這些復(fù)制子上從而可被復(fù)制。因此,載體包括但不限于RNA、自主復(fù)制環(huán)狀或線狀DNA或RNA(例如質(zhì)粒、病毒以及類似物,例如參見美國專利5,217,879),并且包括表達(dá)質(zhì)粒和非表達(dá)質(zhì)粒。在重組微生物或細(xì)胞培養(yǎng)物被描述為"表達(dá)載體"的宿主的情況下,該載體包括染色體外環(huán)狀和線狀DNA,它們可以已經(jīng)被整合到宿主10染色體中。在載體通過宿主細(xì)胞來維持的情況下,該載體或者可以作為自主結(jié)構(gòu)在有絲分裂過程中被細(xì)胞穩(wěn)定地復(fù)制,或者被整合進(jìn)宿主的基因組中。正如此處所用,術(shù)語"重組的"包括與"骨架"核酸相鄰的核酸,這些核酸在其天然環(huán)境中與該"骨架"核酸是不相鄰的。一方面,為了被富集,核酸表現(xiàn)為在核酸骨架分子群體中有大約5%或更多數(shù)量的核酸插入物。本發(fā)明的"骨架15分子"包括核酸,如表達(dá)載體、自主復(fù)制核酸、病毒、整合核酸,以及用于維持或操縱感興趣的核酸插入物的其它載體或核酸。一方面,富集的核酸表現(xiàn)為在重組的骨架分子群體中有大約15%或更多數(shù)量的核酸插入物。一方面,富集的核酸表現(xiàn)為在重組的骨架分子群體中有大約50%或更多數(shù)量的核酸插入物。一方面,富集的核酸表現(xiàn)為在重組的骨架分子群體中有大約90%或更多數(shù)量的核酸插入20物o本發(fā)明的一方面是分離的或重組的核酸,包括本發(fā)明的序列之一,或者含有本發(fā)明的核酸的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500或更多個(gè)連續(xù)堿基的片段。該分離的或重組的核酸可以包含DNA,包括cDNA、基因組DNA和合成DNA。DNA可以是雙鏈或單鏈,并且如果是單25鏈,可以是編碼鏈或非編碼(反義)鏈??蛇x地,該分離的或重組的核酸包含RNA。本發(fā)明的分離的或重組的核酸可用于制備本發(fā)明的多肽之一,或者含有本發(fā)明的多肽之一的至少5、10、15、20、25、30、35、40、50、75、100或150或更多個(gè)連續(xù)氨基酸的片段。因此,本發(fā)明的另一方面是分離的或重組的核酸,其編碼本發(fā)明的多肽的一種,或者含有本發(fā)明的多肽之一的至少5、10、15、20、25、3030、35、40、50、75、100或150或更多個(gè)連續(xù)氨基酸的片段。這些核酸的編碼序列可以與本發(fā)明的核酸之一的編碼序列之一相同或者可以是不同的編碼本發(fā)明的多肽之一的編碼序列,所述的多肽具有本發(fā)明的多肽之一的至少5、10、15、20、25、30、35、40、50、75、100或150或更多個(gè)連續(xù)氨基酸,這是遺傳密碼子的冗余性或簡并性的結(jié)果。遺傳密碼子對(duì)于本領(lǐng)域技術(shù)人員是熟知的,并可以例如在35B.Lewin,GenesVI,OxfordUniversityPress,1997的第214頁上得到?!矫?,使用常規(guī)技術(shù),例如定點(diǎn)誘變或本領(lǐng)域技術(shù)人員熟悉的其它技術(shù),本發(fā)明的核酸序列被誘變,以將沉默改變引入本發(fā)明的多核苷酸。如本文所使用,"沉默改變(silentchanges)"包括,例如不改變由所述多核苷酸編碼的氨基酸序列的改變。這樣的改變可能是期望的,以通過引入在宿主微生物中頻繁發(fā)生的密碼子或密碼子對(duì)而增加由宿主產(chǎn)生多肽的水平,該宿主含有編碼所述多肽的10載體。本發(fā)明還涉及具有核苷酸改變的多核苷酸,所述核苷酸改變?cè)诒景l(fā)明的多肽中導(dǎo)致氨基酸取代、添加、缺失、融合和截短。使用技術(shù)例如定點(diǎn)誘變、隨機(jī)化學(xué)誘變、外切核酸酶III刪除和其它重組DNA技術(shù),可以導(dǎo)入這樣的核苷酸改變??蛇x地,這樣的核苷酸改變可以是天然存在的等位基因變體,其通過鑒定在15本文所提供的高嚴(yán)緊條件、中度嚴(yán)緊條件或低嚴(yán)緊條件下特異性雜交到探針的核酸而分離出,所述探針含有本發(fā)明的序列(或其互補(bǔ)序列)之一的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500或更多個(gè)連續(xù)堿基。用于實(shí)踐本發(fā)明的核酸,不管是RNA、siRNA、miRNA、反義核酸、cDNA、基因組DNA、載體、病毒或其雜合體,都可以從多種來源分離、進(jìn)行遺傳工程改造、擴(kuò)增和/或表達(dá)/重組產(chǎn)生。從這些核酸產(chǎn)生的重組多肽(例如纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶)可以被單獨(dú)地分離25或克隆,并且可測試其期望活性??梢允褂萌魏沃亟M表達(dá)系統(tǒng),包括細(xì)菌、哺乳動(dòng)物、酵母、昆蟲或植物細(xì)胞表達(dá)系統(tǒng)??梢赃x擇地,這些核酸可以通過熟知的化學(xué)合成技術(shù)體外合成,正如例如Adams(1983)J.Am.Chem.Soc.105:661;Belousov(1997)NucleicAcidsRes.25:3440-3444;Frenkel(1995)FreeRadic.Biol.Med.19:373-380;Blommers(1994)30Biochemistry33:7886-7896;Narang(1979)Meth.Enzymol.68:90;Brown(1979)Meth.Enzymol.68:109;Beaucage(1981)Tetra.Lett.22:1859;美國專利4,458,066中所描述的。用于操縱核酸的技術(shù),例如亞克隆、標(biāo)記探針(例如使用Klenow聚合酶的隨機(jī)引物標(biāo)記、切口平移、擴(kuò)增)、測序、雜交以及類似的技術(shù)在科學(xué)和專利文35獻(xiàn)中有很好的描述,例如參見Sambrook編著,MOLECULARCLONING:ALABORATORYMANUAL(2NDED.),1-3巻,ColdSpringHarborLaboratory,(1989);CURRENTPROTOCOLSINMOLECULARBIOLOGY,Ausubel,ed.JohnWiley&Sons,Inc.,NewYork(1997);LABORATORYTECHNIQUESINBIOCHEMISTRYANDMOLECULARBIOLOGY:HYBRIDIZATIONWITHNUCLEICACIDPROBES,PartI.TheoryandNucleicAcidPreparation,Tijssen,ed.Elsevier,N.Y.(1993)。5獲得和操縱用于實(shí)踐本發(fā)明的方法的核酸的另一個(gè)有用方法是從基因組樣品中克隆,并且如果期望的話,篩選和再克隆插入物,插入物可以分離或擴(kuò)增自例如基因組克隆或cDNA克隆。用于本發(fā)明的方法中的核酸的來源包括基因組或cDNA文庫,所述文庫可以包含在例如哺乳動(dòng)物人工染色體(MACs),例如參見美國專利5,721,118;6,025,155;人類人工染色體,例如參見Rosenfeld(1997)10Nat.Genet.15:333-335:酵母人工染色體(YAC);細(xì)菌人工染色體(BAC);PI人工染色體,例如參見Woon(1998)Genomics50:306-316;PI來源的載體(PACs),例如參見Kern(1997)Biotechniques23:120-124;粘粒、重組病毒、噬菌體或質(zhì)粒中。—方面,編碼本發(fā)明的多肽的核酸與能指導(dǎo)翻譯出的多肽或其片段的分泌15的前導(dǎo)序列以適當(dāng)?shù)奈恢藐P(guān)系進(jìn)行裝配。本發(fā)明提供了融合蛋白和編碼這些融合蛋白的核酸。本發(fā)明的多肽可以被融合到異源肽或多肽上,如N-末端鑒定肽,其給予了期望的特性,如增加的穩(wěn)定性或簡化的純化特性。本發(fā)明的肽和多肽也可以作為融合蛋白被合成和表達(dá),其中所述融合蛋白中連接有一個(gè)或多個(gè)額外的結(jié)構(gòu)域,例如用于產(chǎn)生免疫原性更強(qiáng)20的肽、以便更易于分離重組合成的肽、以便鑒定和分離抗體和表達(dá)抗體的B細(xì)胞,等等。有利于檢測和純化的結(jié)構(gòu)域包括,例如金屬螯合肽,如多組氨酸標(biāo)記和組氨酸-色氨酸模塊,其允許在固定的金屬上純化,還包括蛋白A結(jié)構(gòu)域,其允許在固定的免疫球蛋白上純化,還包括在FLAGS延伸/親和純化系統(tǒng)中所使用的結(jié)構(gòu)域(ImmunexCorp,SeattleWA)。在純化結(jié)構(gòu)域和含有基序的肽或多肽之間包含25可切裂的連接子序列有助于純化,這樣的連接子序列例如Xa因子或腸激酶(Iiwitrogen,SanDiegoCA)。例如,表達(dá)載體可以包括編碼表位的核酸序列,其連接到六組氨酸殘基上,還連接有硫氧還蛋白和腸激酶切割位點(diǎn)(例如參見Williams(1995)Biochemistry34:1787-1797;Dobeli(1998)ProteinExpr.Purif.12:404-414)。組氨酸殘基有助于檢測和純化,而腸激酶切割位點(diǎn)提供了將表位與融合30蛋白的剩余部分純化分離開的手段。關(guān)于編碼融合蛋白的載體的技術(shù)以及融合蛋白的應(yīng)用在科學(xué)和專利文獻(xiàn)中進(jìn)行了很好的描述,例如參見Kroll(1993)DNACd1.Biol.,12:441-53。存錄湖體虔,35本發(fā)明提供了可操作地連接到一個(gè)或多個(gè)表達(dá)(例如轉(zhuǎn)錄或翻譯)控制序列上的本發(fā)明的核酸(例如DNA)序列,所述控制序列例如啟動(dòng)子或增強(qiáng)子,它們可以指導(dǎo)或調(diào)節(jié)RNA合成/表達(dá)。表達(dá)控制序列可以在表達(dá)載體中。示例性的細(xì)菌啟動(dòng)子包括lacl、lacZ、T3、T7、gpt、XPR、PL和trp。示例性的真核啟動(dòng)子包括CMV即時(shí)早期啟動(dòng)子、HSV胸苷激酶啟動(dòng)子、早期和晚期SV40啟動(dòng)子、來自逆轉(zhuǎn)錄病毒的LTR啟動(dòng)子以及鼠金屬硫蛋白I啟動(dòng)子。如本文所使用,術(shù)語"啟動(dòng)子"包括能夠驅(qū)動(dòng)編碼序列在細(xì)胞中如植物或5動(dòng)物細(xì)胞中轉(zhuǎn)錄的所有序列。因此,在本發(fā)明的構(gòu)建物中所用的啟動(dòng)子包括順式作用轉(zhuǎn)錄控制元件和調(diào)節(jié)序列,它們涉及調(diào)節(jié)或調(diào)控基因轉(zhuǎn)錄的時(shí)間和/或速率。例如,啟動(dòng)子可以是順式作用轉(zhuǎn)錄控制元件,包括增強(qiáng)子、啟動(dòng)子、轉(zhuǎn)錄終止子、復(fù)制起點(diǎn)、染色體整合序列、5'和3'非翻譯區(qū)或內(nèi)含子序列,它們均涉及轉(zhuǎn)錄的調(diào)節(jié)。這些順式作用序列通常與蛋白或其它生物分子互相作用來執(zhí)行(打開/關(guān)閉、10調(diào)節(jié)、調(diào)控等等)轉(zhuǎn)錄。"組成型"啟動(dòng)子是那些在大部分環(huán)境條件和發(fā)育狀態(tài)或細(xì)胞分化狀態(tài)下持續(xù)地驅(qū)動(dòng)表達(dá)的啟動(dòng)子。"誘導(dǎo)型"或"可調(diào)控型"啟動(dòng)子在環(huán)境條件或發(fā)育條件的影響下指導(dǎo)本發(fā)明的核酸的表達(dá)??梢酝ㄟ^誘導(dǎo)型啟動(dòng)子影響轉(zhuǎn)錄的環(huán)境條件的實(shí)例包括無氧條件、增高的溫度、干旱或光的存在。"組織特異性"啟動(dòng)子是僅僅在特定細(xì)胞或組織或器官中有活性的轉(zhuǎn)錄控15制元件,例如在植物或動(dòng)物的特定細(xì)胞或組織或器官中有活性。組織特異性調(diào)節(jié)可以通過某些內(nèi)在因子來實(shí)現(xiàn),這些內(nèi)在因子確保對(duì)給定組織特異的蛋白編碼基因被表達(dá)。這樣的因子己知存在于哺乳動(dòng)物和植物中,以便允許特異性組織的發(fā)育。適合于在細(xì)菌中表達(dá)多肽的啟動(dòng)子包括大腸桿菌lac或trp啟動(dòng)子、lacl啟20動(dòng)子、lacZ啟動(dòng)子、T3啟動(dòng)子、T7啟動(dòng)子、gpt啟動(dòng)子、XPR啟動(dòng)子和XPL啟動(dòng)子、來自編碼糖酵解酶如3-磷酸甘油酯激酶(PGK)的操縱子的啟動(dòng)子、以及酸性磷酸酶啟動(dòng)子。真核啟動(dòng)子包括CMV即時(shí)早期啟動(dòng)子、HSV胸苷激酶啟動(dòng)子、熱激啟動(dòng)子、早期和晚期SV40啟動(dòng)子、來自逆轉(zhuǎn)錄病毒的LTRs、以及小鼠金屬硫蛋白-I啟動(dòng)子。也可以使用已知在原核或真核細(xì)胞或它們的病毒中控制基因表達(dá)25的其它啟動(dòng)子。適合于在細(xì)菌中表達(dá)多肽或其片段的啟動(dòng)子包括大腸桿菌/ac或&p啟動(dòng)子、/ac/啟動(dòng)子、/acZ啟動(dòng)子、n啟動(dòng)子、T7啟動(dòng)子、g內(nèi)啟動(dòng)子、義尸R啟動(dòng)子和/LPi啟動(dòng)子、來自編碼糖酵解酶如3-磷酸甘油酯激酶(PGK)的操縱子的啟動(dòng)子、以及酸性磷酸酶啟動(dòng)子。真菌啟動(dòng)子包括a-因子啟動(dòng)子。真核啟動(dòng)子包括CMV即時(shí)早期啟動(dòng)子、HSV胸苷激酶啟動(dòng)子、熱激啟動(dòng)子、早期和晚期SV40啟動(dòng)子、30來自逆轉(zhuǎn)錄病毒的LTRs以及小鼠金屬硫蛋白-I啟動(dòng)子。也可以使用已知在原核或真核細(xì)胞或它們的病毒中控制基因表達(dá)的其它啟動(dòng)子。^織待,性擅欽啟動(dòng)子本發(fā)明提供了可以以組織特異性方式表達(dá)的表達(dá)序列盒,例如可以以組織35特異性方式表達(dá)本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的表達(dá)序列盒。本發(fā)明也提供了以組織特異性方式表達(dá)本發(fā)明纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的植物或種子。組織特異性可以是種子特異性、莖特異性、葉特異性、根特異性、果實(shí)特異性以及類似的方式。術(shù)語"植物"包括全植物、植物部分(例如葉、莖、花、根等等)、植物5原生質(zhì)體、種子和植物細(xì)胞以及它們的后代??梢杂糜诒景l(fā)明的方法中的植物的種類很廣泛,廣泛至能用轉(zhuǎn)化技術(shù)進(jìn)行處理的高等植物,包括被子植物(單子葉植物和雙子葉植物),以及裸子植物。它們包括各種倍數(shù)性水平的植物,包括多倍體、二倍體、單倍體和半合子植物。正如此處所用,術(shù)語"轉(zhuǎn)基因植物"包括異源核酸序列已經(jīng)被插入到其中的植物或植物細(xì)胞,所述異源核酸序列例如本發(fā)明10的核酸和各種重組構(gòu)建物(例如表達(dá)序列盒)。—方面,組成型啟動(dòng)子如CaMV35S啟動(dòng)子可以被用于在植物或種子的特定部分或在整個(gè)植物中的表達(dá)。例如,為了過度表達(dá),可以使用植物啟動(dòng)子片段,其將指導(dǎo)核酸在植物例如再生植物的一些或所有組織中表達(dá)。此處,這樣的啟動(dòng)子被稱作"組成型"啟動(dòng)子,它們?cè)诖蟛糠汁h(huán)境條件和發(fā)育或細(xì)胞分化狀態(tài)下是15有活性的。組成型啟動(dòng)子的實(shí)例包括花椰菜花葉病毒(CaMV)35S轉(zhuǎn)錄起始區(qū)、來自根瘤農(nóng)桿菌的T-DNA的l'或2'啟動(dòng)子、以及來自本
技術(shù)領(lǐng)域
已知的多種植物基因的其它轉(zhuǎn)錄起始區(qū)。這樣的基因包括,例如來自擬南芥"ra6Wo/w/s)的ZC77/(Huang(19%)PlantMol.Biol.33:125-139);來自擬南芥的Ca"(GenbankNo.U43147,Zhong(1996)Mol.Gen.Genet.251:196-203);來自甘藍(lán)型油菜(&owi'o720"a/7M)的編碼硬酯?;??;d體蛋白去飽和酶的基因(GenbankNo.X74782,Solocombe(1994)PlantPhysiol.104:1167-1176);來自玉米的G尸c/(GenbankNo.X15596;Martinez(1989)J.Mol.Biol.208:551-565);來自玉米的G/c2(GenbankNo.U45855;Manjunath(1997)Plant.Mol.Biol.33:97-112);在美國專利4,962,028;5,633,440中描述的植物啟動(dòng)子。25本發(fā)明使用來自病毒的組織特異性或組成型啟動(dòng)子,這些啟動(dòng)子可以包括,例如煙草花葉病毒亞基因組啟動(dòng)子(Kumagai(1995)Proc.Natl.Acad.Sci.USA92:1679-1683;稻米東格魯桿狀病毒(RTBV),該病毒僅在受感染稻米植物中的韌皮細(xì)胞中復(fù)制,它的啟動(dòng)子驅(qū)動(dòng)強(qiáng)的韌皮特異性報(bào)道基因的表達(dá);木薯脈帶花葉病毒(CVMV)啟動(dòng)子,其在導(dǎo)管、葉中軸細(xì)胞、根尖中具有最高活性(Verdaguer30(1996)PlantMol.Biol.31:1129-1139)?!矫?,植物啟動(dòng)子指導(dǎo)表達(dá)纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的核酸表達(dá)于特定組織、器官或細(xì)胞類型中(即,組織特異啟動(dòng)子),或者可以在更加精確的環(huán)境或發(fā)育控制下或在誘導(dǎo)型啟動(dòng)子的控制下指導(dǎo)表達(dá)纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡35糖苷酶的核酸的表達(dá)??梢杂绊戅D(zhuǎn)錄的環(huán)境條件的例子包括厭氧條件、提高溫度、有光或噴撒化學(xué)品/激素。例如,本發(fā)明包括玉米的干旱誘導(dǎo)型啟動(dòng)子(Busk(1997)如上),馬鈴薯的寒冷、干旱、高鹽誘導(dǎo)型啟動(dòng)子(Kirch(1997)PlantMol.Biol.33:897909)?!矫?,組織特異性啟動(dòng)子只在該組織的發(fā)育階段的某個(gè)時(shí)間段內(nèi)促進(jìn)轉(zhuǎn)錄。參見,例如描述擬南芥LEAFY基因啟動(dòng)子的Blazquez(1998)PlantCell510:79卜800。也見,描述轉(zhuǎn)錄因子SPL3的Cardon(1997)PlantJ12:367-77,SPL3識(shí)別擬南芥(A//w//a"a)的調(diào)節(jié)植物分生組織形成的基因(meristemidentitygene)API的啟動(dòng)子區(qū)域的保守序列基序;和描述分生組織啟動(dòng)子elF4的Mandel(1995)PlantMolecularBiology,29巻,995-1004頁。可以使用在特定組織的整個(gè)生命周期都具有活性的組織特異性啟動(dòng)子。一方面,本發(fā)明的核酸與主要在棉花纖維細(xì)胞10中有活性的啟動(dòng)子可操作地連接。一方面,本發(fā)明的核酸與主要在棉花纖維細(xì)胞伸長的階段具有活性的啟動(dòng)子可操作地連接,例如,Rinehart(1996)supra所描述的。核酸可以與Fbl2A基因啟動(dòng)子可操作地連接,這樣它將偏好在棉花纖維細(xì)胞(Ibid)中表達(dá)。也見John(1997)Proc.Natl.Acad.Sci.USA89:5769-5773;John等,美國專利5,608,148和5,602,321,描述了用于構(gòu)建轉(zhuǎn)基因棉花植物的棉花纖維15特異性啟動(dòng)子和方法。也可以使用根特異性啟動(dòng)子來表達(dá)本發(fā)明的核酸。根特異性啟動(dòng)子的例子包括乙醇脫氫酶基因中的啟動(dòng)子(DeLisle(19%)Int.Rey.Cytol.123:39-60)。也可以使用別的啟動(dòng)子來表達(dá)本發(fā)明的核酸,包括,例如,胚珠特異的、胚芽特異的、胚乳特異的、珠柄特異的、種皮特異的啟動(dòng)子或它們的組合;葉特異的啟動(dòng)子(見,例如,Busk(1997)PlantJ.11:12851295,描述玉米的葉特20異的啟動(dòng)子);發(fā)根農(nóng)桿菌C4gra/jfl"eWMW^'zoge"M)的ORF13啟動(dòng)子(ORF13啟動(dòng)子在根部表現(xiàn)出高活性,見,例如Hansen(1997)如上);玉米花粉特異性啟動(dòng)子(見,例如Guerrero(1990)Mol.Gen.Genet.224:161168);番茄啟動(dòng)子,其在果實(shí)成熟、變老、從葉上脫落的過程中有活性,在花中具有低一些的活性(見,例如,Blume(1997)PlantJ.12:731746);馬鈴薯SK2基因的雌蕊特異性啟動(dòng)子25(見,例如Ficker(1997)PlantMol.Biol.35:425431);豌豆的Blec4基因,Blec4基因在蔬菜的表皮組織和轉(zhuǎn)基因苜蓿的花梗頂中具有活性,這使它成為使外源基因靶向表達(dá)于活躍地生長的芽或纖維的表皮層的有用工具;胚珠特異的BEL1基因(見,例如,Reiser(1995)Cell83:735-742,GenBank號(hào)U39944);和/或Klee,美國專利5,589,583中的啟動(dòng)子,描述了一種植物啟動(dòng)子區(qū)域,其可導(dǎo)致在分生組30織和/或快速分裂細(xì)胞中的高水平轉(zhuǎn)錄?!矫妫?jīng)由對(duì)植物激素例如植物生長素的暴露便能被誘導(dǎo)的植物啟動(dòng)子可用于表達(dá)本發(fā)明的核酸。例如,本發(fā)明可以使用大豆(G(ydne/muL.)的植物生長素響應(yīng)元件E1啟動(dòng)子片段(AuxREs)(Liu(1997)PlantPhysiol.115:397-407);植物生長素響應(yīng)的擬南芥GST6啟動(dòng)子(也對(duì)水楊酸和過氧化氫產(chǎn)生響應(yīng))(Chen35(1996)PlantJ.10:955-966);煙草的植物生長素誘導(dǎo)的parC啟動(dòng)子(Sakai(1996)37:906-913);植物生物素響應(yīng)元件(Streit(1997)Mol.PlantMicrobeInteract.10:933-937);和對(duì)應(yīng)激激素脫落酸產(chǎn)生響應(yīng)的啟動(dòng)子(Sheen(1996)Science274:1900-1902)。本發(fā)明的核酸也可以與植物啟動(dòng)子可操作地連接,所述植物啟動(dòng)子暴露于施用于植物的化學(xué)試劑例如除草劑或抗生素,便能夠被誘導(dǎo)。例如,可以使用由5苯磺酰胺除草劑安全劑活化的玉米In2-2啟動(dòng)子(DeVeylder(1997)PlantCellPhysiol.38:568-577);不同的除草劑安全劑的應(yīng)用誘導(dǎo)不同的基因表達(dá)模式,包括在根中、排水器中和芽尖分生組織中的表達(dá)。編碼序列可以處于例如四環(huán)素誘導(dǎo)的啟動(dòng)子的控制下,例如,針對(duì)含有燕麥Uve"flsa"wL.)(oat)精氨酸脫羧酶基因的轉(zhuǎn)基因煙草植物所描述的(Masgrau(1997)PlantJ.11:465-473);或者處于水10楊酸響應(yīng)元件的控制之下(Stange(1997)PlantJ.11:1315-1324)。使用化學(xué)(例如,激素或殺蟲劑)誘導(dǎo)的啟動(dòng)子,即,對(duì)施用于田間的轉(zhuǎn)基因植物的化學(xué)劑發(fā)生響應(yīng)的啟動(dòng)子,本發(fā)明的多肽的表達(dá)可以在植物發(fā)育的特定階段被誘導(dǎo)。所以,本發(fā)明也提供含有可誘導(dǎo)基因的轉(zhuǎn)基因植物,所述可誘導(dǎo)基因編碼本發(fā)明的多肽,其宿主范圍局限于靶向植物種類,例如玉米、稻、大麥、大豆、番茄、小麥、馬15鈴薯或別的作物,并且所述可誘導(dǎo)基因在作物發(fā)育的任何階段都可被誘導(dǎo)。本領(lǐng)域技術(shù)人員會(huì)認(rèn)識(shí)到,組織特異性的植物啟動(dòng)子可能驅(qū)動(dòng)可操作地連接的序列在不是耙組織的組織中表達(dá)。因此,一方面,組織特異性啟動(dòng)子是驅(qū)動(dòng)在耙組織或細(xì)胞類型中產(chǎn)生優(yōu)勢表達(dá)的啟動(dòng)子,但是也可以導(dǎo)致在別的組織中的一些表達(dá)。20本發(fā)明的核酸也可以與在暴露于化學(xué)試劑時(shí)被誘導(dǎo)的植物啟動(dòng)子可操作地連接。這些試劑包括例如,除草劑、合成的植物生長激素或抗生素,它們可以通過例如噴霧施用于轉(zhuǎn)基因植物。本發(fā)明的產(chǎn)生纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的核酸的誘導(dǎo)型表達(dá)將允許栽培者對(duì)具有最佳的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷25酶表達(dá)和/或活性的植物進(jìn)行選擇。植物部分的發(fā)育也可以因此被控制。這樣,本發(fā)明提供了促進(jìn)植物和植物部分的收獲的方法。例如,在許多實(shí)施方式中,玉米的由苯磺酰胺除草劑安全劑活化的玉米In2-2啟動(dòng)子被使用(DeVeylder(1997)PlantCellPhysiol.38:568-577);應(yīng)用不同的除草劑安全劑誘導(dǎo)出不同的基因表達(dá)模式,包括在根中、排水器中、芽尖分生組織中的表達(dá)。本發(fā)明的編碼序列也可30以處于四環(huán)素誘導(dǎo)的啟動(dòng)子的控制之下,例如,對(duì)含有燕麥Uvem^fl"vaL.)(oat)精氨酸脫羧酶基因的轉(zhuǎn)基因煙草植物的描述(Masgrau(1997)PlantJ.11:465-473);或者,可以由水楊酸響應(yīng)元件控制(Stange(1997)PlantJ.11:1315-1324)。在一些方面,適當(dāng)?shù)亩嚯谋磉_(dá)可能要求在該編碼區(qū)域的3'端具有多聚腺苷酸化區(qū)域。多聚腺苷酸化區(qū)域可以源自天然基因、各種類別的其它植物(或者動(dòng)35物或其它)基因或者農(nóng)桿菌T-DNA中的基因。表這載,克虔載體本發(fā)明提供包括本發(fā)明的核酸例如編碼本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的序列的表達(dá)載體和克隆載體。本發(fā)明的表達(dá)載體和克隆載體可以包括病毒顆粒、桿狀病毒、噬菌體、質(zhì)粒、噬5菌粒(phagemids)、粘粒、fos-質(zhì)粒(fosmids)、細(xì)菌人工染色體、病毒DNA(例如疫苗、腺病毒、禽痘病毒、偽狂犬病病毒和SV40的衍生物)、Pl衍生的人工染色體、酵母質(zhì)粒、酵母人工染色體和任何別的對(duì)感興趣的特定宿主(例如,桿狀菌、曲霉和酵母)有特異性的載體。本發(fā)明的載體可以包括染色體、非染色體和合成的DNA序列。大量的合適的載體對(duì)于本領(lǐng)域技術(shù)人員都是已知的,并且可以10商業(yè)獲得。典型的載體包括細(xì)菌pQE載體(Qiagen)、pBLUESCRIPTTM質(zhì)粒、pNH載體、入-ZAP載體(Stratagene);ptrc99a、PKK223-3、pDR540、pRIT2T(Pharmacia);真核細(xì)胞的PXT1、pSG5(S驗(yàn)gene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而,也可以使用任何別的質(zhì)粒或別的載體,只要它們可以在宿主中復(fù)制和維持下去??梢栽诒景l(fā)明中使用低拷貝數(shù)或高拷貝數(shù)的載體。15"質(zhì)粒"可以商購得到,在不受限制的基礎(chǔ)上可以公開獲得,或可以根據(jù)已公開的程序用可獲得的質(zhì)粒來構(gòu)建。與本文描述的那些質(zhì)粒等價(jià)的質(zhì)粒在本
技術(shù)領(lǐng)域
是已知的,并且對(duì)于普通技術(shù)人員是顯而易見的。表達(dá)載體可以包括啟動(dòng)子、用于起始翻譯的核糖體結(jié)合位點(diǎn)和轉(zhuǎn)錄終止子。載體也可以包括用于擴(kuò)增表達(dá)的合適序列。哺乳動(dòng)物表達(dá)載體可以包括復(fù)制20原點(diǎn)、任何必需的核糖體結(jié)合位點(diǎn)、聚腺苷酸化位點(diǎn)、剪接供體和受體位點(diǎn)、轉(zhuǎn)錄終止序列、5,側(cè)翼非轉(zhuǎn)錄序列。在一些方面,衍生于SV40剪接子和聚腺苷酸化位點(diǎn)的DNA序列可以用于提供所需要的非轉(zhuǎn)錄基因元件。在一個(gè)方面,表達(dá)載體含有一個(gè)或多個(gè)選擇性標(biāo)記基因,使得可以對(duì)含有該載體的宿主細(xì)胞進(jìn)行選擇。這樣的選擇性標(biāo)記包括編碼二氫葉酸還原酶的基因25和使得真核細(xì)胞培養(yǎng)物具有新霉素抗性的基因、使得大腸桿菌(£.co//)具有四環(huán)素或氨芐青霉素抗性的基因和釀酒酵母(S.TRP1基因。啟動(dòng)子區(qū)域可以從任何期望的基因中選擇出來,使用氯霉素轉(zhuǎn)移酶(CAT)載體或具有選擇標(biāo)記的別的載體。在一個(gè)發(fā)明,用于在真核細(xì)胞中表達(dá)多肽或其片段的載體含有增強(qiáng)子,以30增加表達(dá)水平。增強(qiáng)子是DNA的順式作用元件,一般長度為大約10到大約300bp。它們作用于啟動(dòng)子,增強(qiáng)其轉(zhuǎn)錄。示例性增強(qiáng)子包括在復(fù)制原點(diǎn)下游側(cè)100bp到270bp的SV40增強(qiáng)子、巨細(xì)胞病毒早期啟動(dòng)子增強(qiáng)子、在復(fù)制原點(diǎn)下游側(cè)的多瘤增強(qiáng)子,和腺病毒增強(qiáng)子。核酸序列可以通過各種程序插入載體中。一般而言,將插入物和載體用合35適的限制性內(nèi)切酶消化后,序列可以連接到載體中的所希望的位置??蛇x擇地,插入物和載體的平末端可以被連接。在本領(lǐng)域己知多種克隆技術(shù),例如在Ausubel和Sambrook中描述的。這樣的程序和別的程序被認(rèn)為在本領(lǐng)域技術(shù)人員的范圍內(nèi)。載體可以是質(zhì)粒、病毒顆粒或噬菌體的形式。別的載體包括染色體的、非染色體的和合成的DNA序列,SV40的衍生物;細(xì)菌質(zhì)粒、噬菌體DNA、桿狀病毒、酵母質(zhì)粒、衍生于質(zhì)粒和噬菌體DNA的組合的載體、病毒DNA例如牛痘、5腺病毒、禽痘病毒和偽狂犬病病毒DNA。在原核和真核宿主中使用的各種克隆和表達(dá)載體被例如Sambrook描述??梢允褂玫奶囟ǖ募?xì)菌載體包括商業(yè)上可獲得的質(zhì)粒,其包括以下已知的克隆載體的遺傳元件pBR322(ATCC37017)、pKK223-3(PharmaciaFineChemicals,Uppsala,Sweden)、GEM1(PromegaBiotec,Madison,WI,USA)、pQE70、pQE60、10pQE-9(Qiagen)、pD10、psiX174pBluescriptIIKS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、ptrc99a、pKK223-3、pKK233隱3、DR540、pRIT5(Pharmacia)、pKK232-8禾QpCM7。特定的真核載體包括pSV2CAT、pOG44、pXTl、pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而,可以使用任何別的載體,只要它可以在宿主細(xì)胞中復(fù)制和維持。15本發(fā)明的核酸可以在表達(dá)序列盒、載體或病毒中表達(dá),在植物細(xì)胞和種子中短暫地或穩(wěn)定地表達(dá)。一個(gè)示例性的短暫表達(dá)系統(tǒng)應(yīng)用了附加體(episomal)表達(dá)系統(tǒng),例如,通過含有超螺旋DNA的附加小染色體的轉(zhuǎn)錄而在核中產(chǎn)生的花椰菜花葉病毒(CaMV)病毒RNA,見,例如,Covey(1990)Proc.Natl.Acad.Sci.USA87:1633-1637。作為選擇,編碼序列,即本發(fā)明的序列的全部或子片段,可以插入20到植物宿主細(xì)胞基因組中,而成為該宿主染色體DNA的整合部分。正義和反義轉(zhuǎn)錄子可以以這種方式被表達(dá)。包含本發(fā)明的核酸的序列(例如,啟動(dòng)子或編碼區(qū)域)的載體可以包含賦予植物細(xì)胞或種子選擇性表型的標(biāo)記基因。例如,所述標(biāo)記可以編碼生物殺滅劑抗性,特別是抗生素抗性,例如對(duì)卡那霉素、G418、博來霉素、潮霉素或除草劑的抗性,例如對(duì)氯磺隆或Basta的抗性。25可以在植物中表達(dá)核酸和蛋白的表達(dá)載體在本領(lǐng)域中是熟知的,可以包括,例如,根瘤農(nóng)桿菌的載體、馬鈴薯病毒X(見,例如,Angell(1997)EMBOJ.16:3675-3684)、煙草花葉病病毒(見,例如,Casper(1996)Gene173:69-73)、番茄叢矮病毒(見,例如,Hillman(1989)Virology169:42-50)、煙草蝕紋病毒(見,例如,Dolja(1997)Virology234:243-252)、菜豆金色花葉病毒(見,例如,Morinaga30(1993)Microbiolinhnunol.37:471-476)、花椰菜花葉病毒(見,例如,Cecchini(1997)Mol.PlantMicrobeInteract.10:1094-1101)、玉米Ac/Ds轉(zhuǎn)座元件(見,例如,Rubin(1997)Mol.Cell.Biol.17:6294-6302;Kunze(1996)Curr.Top.Microbiol.Inimunol.204:161-194),和玉米抑制基因-突變基因(Spm)轉(zhuǎn)座元件(見,例如Schlappi(1996)PlantMol.Biol.32:717-725);和它們的衍生物。35在一個(gè)方面,表達(dá)載體可以有兩套復(fù)制系統(tǒng),使其可以在兩種生物中保持,例如在哺乳動(dòng)物或昆蟲細(xì)胞中表達(dá),在原核宿主中克隆和擴(kuò)增。進(jìn)一步,對(duì)于整合表達(dá)載體,該表達(dá)載體可以包括至少一個(gè)與宿主細(xì)胞基因組同源的序列。它可以在該表達(dá)構(gòu)建物的兩側(cè)包含兩個(gè)同源序列。通過選擇包含入載體的合適的同源序列,可以將該整合載體定位到宿主細(xì)胞的特定位置。整合載體的構(gòu)建在本領(lǐng)域是已知的。5本發(fā)明的表達(dá)載體也可以包括選擇性的標(biāo)記基因,以便對(duì)已經(jīng)轉(zhuǎn)化的細(xì)菌株進(jìn)行選擇,例如,使細(xì)菌對(duì)藥物,例如氨芐青霉素、氯霉素、紅霉素、卡那霉素、新霉素和四環(huán)素產(chǎn)生抗性的基因。選擇性的標(biāo)記也可以包括生物合成基因,例如在組氨酸、色氨酸和亮氨酸生物合成途徑中的基因。表達(dá)載體中的DNA序列被可操縱連接到合適的表達(dá)控制序列(一種或多10禾中)(啟動(dòng)子),以指導(dǎo)RNA合成。具體命名的細(xì)菌啟動(dòng)子包括/flc/、/acZ、r3、T7、砂f、義/V義&和印。真核啟動(dòng)子包括CMV即時(shí)早期啟動(dòng)子、HSV胸苷激酶啟動(dòng)子、早期和晚期SV40啟動(dòng)子、來自逆轉(zhuǎn)錄病毒的LTRs以及小鼠金屬硫蛋白-I啟動(dòng)子。選擇合適的載體和啟動(dòng)子在本領(lǐng)域技術(shù)人員的水平之內(nèi)。表達(dá)載體還可以包括用于起始翻譯的核糖體結(jié)合位點(diǎn)和轉(zhuǎn)錄終止子。載體也可以包括用于擴(kuò)增15表達(dá)的合適序列。啟動(dòng)子區(qū)域可以從任何期望的基因中選擇出來,使用氯霉素轉(zhuǎn)移酶(CAT)載體或具有選擇標(biāo)記的別的載體。此外,在一個(gè)方面,表達(dá)載體含有一個(gè)或多個(gè)選擇性標(biāo)記基因,以提供用于選擇被轉(zhuǎn)化的宿主細(xì)胞的表型特征,例如用于真核細(xì)胞培養(yǎng)的二氫葉酸還原酶或新霉素抗性,或例如大腸桿菌中的四環(huán)素或氨芐青霉素抗性。20哺乳動(dòng)物表達(dá)載體還可以包括復(fù)制原點(diǎn)、任何必需的核糖體結(jié)合位點(diǎn)、聚腺苷酸化位點(diǎn)、剪接供體和受體位點(diǎn)、轉(zhuǎn)錄終止序列和5'側(cè)翼非轉(zhuǎn)錄序列。在一些方面,衍生于SV40剪接子的DNA序列和聚腺苷酸化位點(diǎn)可以用于提供所需要的非轉(zhuǎn)錄基因元件。用于在真核細(xì)胞中表達(dá)多肽或其片段的載體也可以含有增強(qiáng)子,以增加表25達(dá)水平。增強(qiáng)子是DNA的順式作用元件,一般長度為大約10到大約300bp,其作用于啟動(dòng)子,增強(qiáng)其轉(zhuǎn)錄。示例性增強(qiáng)子包括在復(fù)制起點(diǎn)下游側(cè)100bp到270bp的SV40增強(qiáng)子、巨細(xì)胞病毒早期啟動(dòng)子增強(qiáng)子、在復(fù)制起點(diǎn)下游側(cè)的多瘤增強(qiáng)子,和腺病毒增強(qiáng)子。此外,表達(dá)載體含有一個(gè)或多個(gè)選擇性標(biāo)記基因,使得可以對(duì)含有該載體30的宿主細(xì)胞進(jìn)行選擇。這樣的選擇性標(biāo)記包括編碼二氫葉酸還原酶的基因和使得真核細(xì)胞培養(yǎng)物具有新霉素抗性的基因、使得大腸桿菌具有四環(huán)素或氨芐青霉素抗性的基因和釀酒酵母(S,c^e他^)7TP;基因。在一些方面中,編碼本發(fā)明的多肽之一或含有其至少大約5、10、15、20、25、30、35、40、50、75、100或150或更多個(gè)連續(xù)氨基酸的片段的核酸與能指導(dǎo)35翻譯出的多肽或其片段的分泌的前導(dǎo)序列以適當(dāng)?shù)奈恢藐P(guān)系進(jìn)行裝配。一方面,該核酸可以編碼融合蛋白,其中本發(fā)明的多肽之一或含有其至少大約5、10、15、20、25、30、35、40、50、75、100或150或更多個(gè)連續(xù)氨基酸的片段被融合到異源肽或多肽,例如N-末端鑒定肽,其給予了期望的特性,如增加的穩(wěn)定性或簡化的純化特性。合適的DNA序列可以通過各種程序插入載體中。一般而言,將插入物和5載體用合適的限制性內(nèi)切酶消化后,DNA序列可以連接到載體中的所希望的位置。可選擇地,插入物和載體的平末端可以被連接。多種克隆技術(shù)被公開于Ausubeetal.CurrentProtocolsinMolecularBiology,JohnWiley503Sons,Inc.1997禾卩Sambrooketal,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)。這樣的程序和別的程序被認(rèn)為在本領(lǐng)域技術(shù)人員的范圍10內(nèi)。載體可以是例如質(zhì)粒、病毒顆粒或噬菌體的形式。別的載體包括染色體的、非染色體的和合成的DNA序列,SV40的衍生物;細(xì)菌質(zhì)粒、噬菌體DNA、桿狀病毒、酵母質(zhì)粒、衍生于質(zhì)粒和噬菌體DNA的組合的載體、病毒DNA例如牛痘、腺病毒、禽痘病毒和偽狂犬病病毒DNA。在原核和真核宿主中使用的各種克隆和15表達(dá)載體在Sambrook,etal,MolecularCloning:ALaboratoryManual,2ndEd.,ColdSpringHarbor,N.Y.,(1989)中描述。涼主雄辦飾應(yīng)本發(fā)明也提供了包含本發(fā)明的核酸序列的轉(zhuǎn)化細(xì)胞,所述核酸序列例如編20碼本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶的序列,或本發(fā)明的載體。宿主細(xì)胞可以是本領(lǐng)域技術(shù)人員熟悉的任何宿主細(xì)胞,包括原核細(xì)胞,真核細(xì)胞,例如,細(xì)菌細(xì)胞、真菌細(xì)胞、酵母細(xì)胞、哺乳動(dòng)物細(xì)胞、昆蟲細(xì)胞或植物細(xì)胞。示例性的細(xì)菌細(xì)胞包括鏈霉菌屬、葡萄球菌屬或桿菌屬的任何種,或者示例性種大腸桿菌、枯草芽孢桿菌(Bac,7/Mss"6"to)、蠟25狀芽孢桿菌(5a"7/wcewiw)、鼠傷寒沙門氏菌(Sa/mow//a0^Wwwn'wm)。示例性的昆蟲細(xì)胞包括草地夜蛾屬(S/wcfo/^ra)或果蠅屬(Z>0TO//7a)的任何種,包括果蠅和草地夜蛾(S;x/o;^ra)S/9。示例性的動(dòng)物細(xì)胞包括CHO、COS或黑色素瘤細(xì)胞或任何鼠或人的細(xì)胞系。合適的宿主的選擇在本領(lǐng)域技術(shù)人員的能力范圍內(nèi)。轉(zhuǎn)化各種高等植物種類的技術(shù)是已知的,在技術(shù)和科學(xué)文獻(xiàn)中有描30述,見,例如,Weising(1988)Ann.Rey.Genet.22:42卜477;美國專利5,750,870。載體可以使用各種技術(shù)導(dǎo)入宿主細(xì)胞中,包括轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)、病毒感染、基因槍或者Ti介導(dǎo)的基因轉(zhuǎn)移。具體的方法包括磷酸鈣轉(zhuǎn)染、DEAE-Dextran介導(dǎo)的轉(zhuǎn)染、脂轉(zhuǎn)染法(lipofection)或電穿孔(Davis,L.,Dibner,M.,Battey,I.,BasicMethodsinMolecularBiology,(1986))。35—方面,本發(fā)明的核酸或載體導(dǎo)入細(xì)胞是為了篩選,所以,所述核酸是以合適于該核酸的后續(xù)表達(dá)的方式進(jìn)入細(xì)胞。導(dǎo)入的方法大體上由靶細(xì)胞類型決定。示例性的方法包括CaPCV沉淀法、脂質(zhì)體融合、脂轉(zhuǎn)染法(例如,LIPOFECTINTM)、電穿孔法、病毒感染法,等等。候選的核酸可以穩(wěn)定,整合到宿主細(xì)胞基因組中(例如,用反轉(zhuǎn)錄病毒導(dǎo)入)或者可以短暫的或穩(wěn)定的存在于細(xì)胞質(zhì)中(即,通過使用傳統(tǒng)的質(zhì)粒,利用標(biāo)準(zhǔn)的調(diào)控序列、選擇標(biāo)記,等等)。因?yàn)樵S多藥學(xué)上重5要的篩選要求人或模型哺乳動(dòng)物靶細(xì)胞,所以可以使用能夠轉(zhuǎn)染這些靶的反轉(zhuǎn)錄病毒載體。在適當(dāng)?shù)那闆r下,工程宿主細(xì)胞可以在傳統(tǒng)的營養(yǎng)培養(yǎng)基中培養(yǎng),所述營養(yǎng)培養(yǎng)基經(jīng)改良而適于激活啟動(dòng)子、選擇轉(zhuǎn)化子或擴(kuò)增本發(fā)明的基因。在合適的宿主株被轉(zhuǎn)化和宿主株生長到合適的細(xì)胞密度之后,用合適的方法(例如,溫度10變化或化學(xué)誘導(dǎo))誘導(dǎo)被選擇的啟動(dòng)子,細(xì)胞再培養(yǎng)一段時(shí)期,使得它們產(chǎn)生所需的多肽或其片段。細(xì)胞可以通過離心收獲,通過物理或化學(xué)方法破碎,保留得到的粗提物以用于進(jìn)一步的純化。被用來表達(dá)蛋白質(zhì)的微生物細(xì)胞可以用任何常規(guī)方法破碎,包括冷凍-融解循環(huán)、超聲波裂解法、機(jī)械破碎法或使用細(xì)胞裂解試劑。這些方法15為本領(lǐng)域技術(shù)人員所熟知。表達(dá)的多肽或其片段可以從重組細(xì)胞培養(yǎng)物中通過包括硫酸銨或乙醇沉淀、酸提取、陰離子或陽離子交換色譜、磷酸纖維素色譜、疏水作用色譜、親和色譜、羥基磷灰石色譜和凝集素色譜在內(nèi)的方法回收和純化。假如必要的話,可以應(yīng)用蛋白質(zhì)重折疊來完成多肽的構(gòu)象。假如需要的話,在最終的純化步驟中可以采用高效液相色譜(HPLC)。20宿主細(xì)胞中的構(gòu)建物可以以傳統(tǒng)方式用于產(chǎn)生由重組序列編碼的基因產(chǎn)物。取決于重組生產(chǎn)方法中所用的宿主,由含有載體的宿主細(xì)胞產(chǎn)生的多肽可以糖基化或者非糖基化。本發(fā)明的多肽也可以包括或不包括起始甲硫氨酸殘基。也可以采用無細(xì)胞的翻譯系統(tǒng)來產(chǎn)生本發(fā)明的多肽。無細(xì)胞翻譯系統(tǒng)可以應(yīng)用由DNA構(gòu)建物轉(zhuǎn)錄得到的mRNA,所述DNA構(gòu)建物包括與編碼所述多肽或25其片段的核酸可操作地連接的啟動(dòng)子。在一些方面,該DNA構(gòu)建物在進(jìn)行體外轉(zhuǎn)錄反應(yīng)之前可以被線性化。轉(zhuǎn)錄得到的mRNA然后與合適的無細(xì)胞翻譯提取物例如兔網(wǎng)狀細(xì)胞提取物溫育,產(chǎn)生所需的多肽或其片段。表達(dá)載體可以含有一個(gè)或多個(gè)選擇性標(biāo)記基因,為選擇轉(zhuǎn)化宿主細(xì)胞提供表型特征,例如真核細(xì)胞培養(yǎng)物的二氫葉酸還原酶或新霉素抗性,或者例如大腸30桿菌的四環(huán)素或氨芐青霉素抗性。含有感興趣多核苷酸如本發(fā)明的核酸的宿主細(xì)胞可以在傳統(tǒng)的營養(yǎng)培養(yǎng)基中培養(yǎng),所述營養(yǎng)培養(yǎng)基經(jīng)改良而適于激活啟動(dòng)子、選擇轉(zhuǎn)化子或擴(kuò)增基因。培養(yǎng)條件例如溫度、pH和類似條件是先前選擇宿主細(xì)胞用于表達(dá)所使用的培養(yǎng)條件,對(duì)于普通技術(shù)人員是明顯的。然后,被鑒定為具有指定的酶活性的克隆被測35序,以鑒定編碼具有增強(qiáng)活性的酶的多核苷酸序列。本發(fā)明提供了在細(xì)胞中過度表達(dá)重組纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的方法,該方法包括表達(dá)含有本發(fā)明的核酸的載體,本發(fā)明的核酸例如包含在至少約100個(gè)殘基的區(qū)域內(nèi)與本發(fā)明的示例性序列具有至少約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、573%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的核酸序列的核酸,其中序列同一性通過使用序列比較算法的分析或通過視覺觀察來確定;或者在嚴(yán)緊條件下與本發(fā)明的核酸序列雜交的核酸。過度表達(dá)通過任何方式例如使用高活性啟動(dòng)子、雙順反子(dicistronic)載10體或通過該載體的基因擴(kuò)增來實(shí)現(xiàn)。本發(fā)明的核酸可以在任何體外或體內(nèi)表達(dá)系統(tǒng)中被表達(dá)或過度表達(dá)。任何細(xì)胞培養(yǎng)系統(tǒng)可被用于表達(dá)或過度表達(dá)重組蛋白,包括細(xì)菌、昆蟲、酵母、真菌或哺乳動(dòng)物培養(yǎng)物。通過啟動(dòng)子、增強(qiáng)子、載體(例如,復(fù)制子載體、雙順反子載體的使用(見,例如Gurtu(19%)Biochem.Biophys.Res.Commun.229:295-8))、15培養(yǎng)基、培養(yǎng)系統(tǒng)等等的合適選擇,可以實(shí)現(xiàn)過度表達(dá)。一方面,使用選擇標(biāo)記如谷氨酰胺合酶(見,例如Sanders(1987)Dev.Bio1.Stand.66:55-63)在細(xì)胞系統(tǒng)中進(jìn)行的基因擴(kuò)增被用于過度表達(dá)本發(fā)明的多肽。宿主細(xì)胞可以是本領(lǐng)域技術(shù)人員熟悉的任何宿主細(xì)胞,包括原核細(xì)胞,真核細(xì)胞,例如,細(xì)菌細(xì)胞、真菌細(xì)胞、酵母細(xì)胞、哺乳動(dòng)物細(xì)胞、昆蟲細(xì)胞或植物細(xì)胞。合適的宿主的選擇在本領(lǐng)域技20術(shù)人員的能力范圍內(nèi)。載體可以使用各種技術(shù)導(dǎo)入宿主細(xì)胞中,包括轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)、病毒感染、基因槍或者Ti介導(dǎo)的基因轉(zhuǎn)移。具體的方法包括磷酸鈣轉(zhuǎn)染、DEAE-Dextran介導(dǎo)的轉(zhuǎn)染、脂轉(zhuǎn)染法(lipofection)或電穿孔(Davis,L.,Dibner,M.,Battey,I.,BasicMethodsinMolecularBiology,(1986))。25在適當(dāng)?shù)那闆r下,工程宿主細(xì)胞可以在傳統(tǒng)的營養(yǎng)培養(yǎng)基中培養(yǎng),所述營養(yǎng)培養(yǎng)基經(jīng)改良而適于激活啟動(dòng)子、選擇轉(zhuǎn)化子或擴(kuò)增本發(fā)明的基因。在合適的宿主株被轉(zhuǎn)化和宿主株生長到合適的細(xì)胞密度之后,用合適的方法(例如,溫度變化或化學(xué)誘導(dǎo))誘導(dǎo)被選擇的啟動(dòng)子,細(xì)胞再培養(yǎng)一段時(shí)期,使得它們產(chǎn)生所需的多肽或其片段。30細(xì)胞可以通過離心收獲,通過物理或化學(xué)方法破碎,保留得到的粗提物以用于進(jìn)一步的純化。被用來表達(dá)蛋白質(zhì)的微生物細(xì)胞可以用任何常規(guī)方法破碎,包括冷凍-融解循環(huán)、超聲波裂解法、機(jī)械破碎法或使用細(xì)胞裂解試劑。這些方法為本領(lǐng)域技術(shù)人員所熟知。表達(dá)的多肽或其片段可以從重組細(xì)胞培養(yǎng)物中通過包括硫酸銨或乙醇沉淀、酸提取、陰離子或陽離子交換色譜、磷酸纖維素色譜、疏35水作用色譜、親和色譜、羥基磷灰石色譜和凝集素色譜在內(nèi)的方法回收和純化。假如必要的話,可以應(yīng)用蛋白質(zhì)重折疊來完成多肽的構(gòu)象。假如需要的話,在最終的純化歩驟中可以采用高效液相色譜(HPLC)。各種哺乳動(dòng)物細(xì)胞培養(yǎng)系統(tǒng)也可以被用于表達(dá)重組蛋白。哺乳動(dòng)物表達(dá)系統(tǒng)的實(shí)例包括猴腎成纖維細(xì)胞的COS-7系(由Gluzman,Cell,21:175,1981描述),以及能從相容載體表達(dá)蛋白的其它細(xì)胞系,如C127、3T3、CHO、HeLa和BHK5細(xì)胞系。宿主細(xì)胞中的構(gòu)建物可以以傳統(tǒng)方式用于產(chǎn)生由重組序列編碼的基因產(chǎn)物。根據(jù)重組產(chǎn)生方法中所用的宿主,由含有載體的宿主細(xì)胞產(chǎn)生的多肽可以糖基化或者非糖基化。本發(fā)明的多肽也可以包括或不包括起始甲硫氨酸殘基??蛇x地,本發(fā)明的多肽,或者含有其至少大約5、10、15、20、25、30、1035、40、50、75、100或150或更多個(gè)連續(xù)氨基酸的片段,可以通過常規(guī)肽合成儀合成產(chǎn)生,例如,如下面所討論。在其它方面,通過肽合成,所述多肽的片段或部分可以被用于產(chǎn)生相應(yīng)的全長多肽;因此,所述片段可用作產(chǎn)生全長多肽的中間物。也可以采用無細(xì)胞的翻譯系統(tǒng)來產(chǎn)生本發(fā)明的多肽之一或含有其至少大15約5、10、15、20、25、30、35、40、50、75、100或150或更多個(gè)連續(xù)氨基酸的片段,其應(yīng)用由DNA構(gòu)建物轉(zhuǎn)錄得到的mRNA,所述DNA構(gòu)建物包括與編碼所述多肽或其片段的核酸可操作地連接的啟動(dòng)子。在一些方面,該DNA構(gòu)建物在進(jìn)行體外轉(zhuǎn)錄反應(yīng)之前可以被線性化。轉(zhuǎn)錄得到的mRNA然后與合適的無細(xì)胞翻譯提取物例如兔網(wǎng)狀細(xì)胞提取物溫育,產(chǎn)生所需的多肽或其片段。20在本發(fā)明的實(shí)踐中,本發(fā)明的核酸和編碼本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的核酸,或本發(fā)明的修飾的核酸,可以通過擴(kuò)增來增殖,例如,通過PCR。擴(kuò)增也可以被用于克隆或修飾本發(fā)25明的核酸。因此,本發(fā)明提供了用于擴(kuò)增本發(fā)明核酸的擴(kuò)增引物序列對(duì)。本
技術(shù)領(lǐng)域
技術(shù)人員能設(shè)計(jì)用于這些序列的任何部分或全長的擴(kuò)增引物序列對(duì)?!矫?,本發(fā)明提供了通過本發(fā)明的擴(kuò)增引物對(duì)擴(kuò)增的核酸,所述擴(kuò)增引物對(duì)例如本發(fā)明的核酸的大約前(5')12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多個(gè)殘基以及互補(bǔ)鏈的大約前(5')15、16、17、18、19、20、3021、22、23、24或25或更多個(gè)殘基所示的引物對(duì)。本發(fā)明提供了用于擴(kuò)增核酸的擴(kuò)增引物序列對(duì),所述核酸編碼具有纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的多肽,其中所述引物對(duì)能夠擴(kuò)增含有本發(fā)明的序列或其片段或子序列的核酸。擴(kuò)增引物序列對(duì)的一個(gè)成員或每一成員可以包含寡核苷酸,該寡核苷酸包含所述序列的至少約10至50個(gè)或更多個(gè)連續(xù)堿基,或所述35序列的約12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多個(gè)連續(xù)殘基。本發(fā)明提供了擴(kuò)增引物對(duì),其中所述引物對(duì)包括第一成員和第二成員,第一成員具有本發(fā)明核酸的大約前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多個(gè)堿基所示的序列,第二成員具有第一成員的互補(bǔ)鏈的大約前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多個(gè)堿基所示的序列。5本發(fā)明提供了通過擴(kuò)增產(chǎn)生的纖維素酶,例如編碼內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶,所述擴(kuò)增例如聚合酶鏈反應(yīng)(PCR),使用本發(fā)明的擴(kuò)增引物對(duì)。本發(fā)明提供了通過擴(kuò)增制備纖維素酶,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的方法,所述擴(kuò)增例如PCR,使用本發(fā)明的擴(kuò)增引物對(duì)。一方面,所述擴(kuò)增引物對(duì)從文庫例如基因文庫諸如環(huán)10境文庫擴(kuò)增核酸。擴(kuò)增反應(yīng)也可以被用于量化樣品中核酸的量(如細(xì)胞樣品中信息的量)、標(biāo)記核酸(例如將其應(yīng)用于陣列或印跡)、檢測核酸,或量化樣品中特異性核酸的量。在本發(fā)明的一個(gè)方面,擴(kuò)增從細(xì)胞或cDNA文庫分離出的信息。技術(shù)人員可以選擇和設(shè)計(jì)合適的寡核苷酸擴(kuò)增引物。擴(kuò)增方法在本技術(shù)領(lǐng)15域也是己知的,包括,例如聚合酶鏈?zhǔn)椒磻?yīng)PCR(例如參見PCRPROTOCOLS,AGUIDETOMETHODSANDAPPLICATIONS,ed.Innis,AcademicPress,N.Y.(1990)和PCRSTRATEGIES(1995),ed.Innis,AcademicPress,Inc.N.Y.,連接酶鏈?zhǔn)椒磻?yīng)(LCR)(例如參見Wu(1989)Genomics4:560;Landegren(1988)Science241:1077;Barringer(1990)Gene89:117);轉(zhuǎn)錄擴(kuò)增(例如參見Kwoh(1989)Proc.Natl.Acad.20Sci.USA86:1173);和自主維持序列復(fù)制(例如參見Guatelli(1990)Proc.Natl.Acad.Sci.USA87:1874);QP復(fù)制酶擴(kuò)增(例如參見Smith(1997)J.Clin.Microbiol.35:1477_1491),自動(dòng)Q_p復(fù)制酶擴(kuò)增測定法(例如參見Burg(1996)Mol.Cell.Probes10:257-271)和其它的RNA聚合酶介導(dǎo)技術(shù)(例如NASBA,Cangene,Mississauga,Ontario);也參見Berger(1987)MethodsEnzymol,152:307-316;Sambrook;Ausubel;25美國專利4,683,195和4,683,202;Sooknanan(1995)Biotechnology13:563-564。確定核酸和多肽的序列同一性本發(fā)明提供了核酸,所述核酸包括與本發(fā)明的示例性核酸(參見表1、2和3,下面的實(shí)施例1和4,以及序列表)在至少大約50、75、100、150、200、30250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多殘基的區(qū)域內(nèi)具有至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、7P/。、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、3583%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性(同源性)的序列。本發(fā)明提供了多肽,該多肽包括與本發(fā)明的示例性多肽(參見表l、2和3,下面的實(shí)施例1和4,以及序列表)具有至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、582%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的序列。序列同一性(同源性)的程度可以使用任何計(jì)算機(jī)程序和相關(guān)參數(shù)來確定,包括本文描述的那些,如BLAST2.2.2或FASTA3.0t78版本,參數(shù)為默認(rèn)值。本發(fā)明的核酸序列可以包括本發(fā)明的示例性序列和與其基本上相同的序10列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500或更多個(gè)連續(xù)核苷酸。本發(fā)明的核酸序列的同源序列和片段可以指與這些序列具有至少約50°/。、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、1587%、88%、89%、90%、91%、92%、93%、94%、95°/。、96%、97%、98%、99%或更高的序列同一性(同源性)的序列。同源性(序列同一性)可以使用本文所描述的任何計(jì)算機(jī)程序和參數(shù)來確定,包括FASTA3.0t78版本,參數(shù)為默認(rèn)值。同源序列還包括RNA序列,其中尿嘧啶取代本發(fā)明核酸序列中的胸腺嘧啶。同源序列可以使用本文描述的任意一種方法獲得,或者從對(duì)測序錯(cuò)誤的糾正中產(chǎn)生。20應(yīng)該意識(shí)到,本發(fā)明的核酸序列可以以傳統(tǒng)的單字母格式表示(例如參見Stryer,Lubert.Biochemistry,3rdEd.,W.HFreeman&Co.,NewYork),或以在序列中記錄核苷酸的身份的任何其它格式表示。在各個(gè)方面,本文描述的序列比較程序被用于本發(fā)明的該方面,即,確定核酸或多肽序列是否在本發(fā)明的范圍之內(nèi)。然而,蛋白和/或核酸序列同一性(同25源性)可以使用本
技術(shù)領(lǐng)域
已知的任何序列比較算法或程序來評(píng)價(jià)。這樣的算法和程序包括,但不限于,TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(參見,例如PearsonandLipman,Proc.Natl.Acad.Sci.USA85(8):2444-2448,1988;Altschul等人,J.Mol.Biol.215(3):403-410,1990;Thompson等人,NucleicAcidsRes.22(2):4673-4680,1994;Higgins等人,MethodsEnzymol.266:383-402,1996;Altschul30等人,j.Mol.Biol.215(3):403-410,1990;Altschul等人,NatureGenetics3:266-272,1993)。一方面,同源性或同一性可以使用序列分析軟件來測量(例如,地址為1710UniversityAvenue,Madison,WI53705的威斯康星大學(xué)生物技術(shù)中心遺傳學(xué)計(jì)算機(jī)組(GeneticsComputerGroup)的序列分析軟件包)。這樣的軟件通過對(duì)各種缺失、35取代和其它的修飾賦予同源性度數(shù)來匹配相似的序列。一方面,用于表示兩個(gè)或者更多個(gè)核酸或者多肽序列之間的關(guān)系的術(shù)語"同源性"和"同一性",是指當(dāng)兩個(gè)或更多個(gè)序列或子序列在某一比較窗口(comparisonwindow)或者指定區(qū)域內(nèi)被比較和聯(lián)配以確定最大一致性時(shí),這些序列是相同的,或者具有特定百分比例的相同氨基酸殘基或核苷酸,其可以應(yīng)用各種序列比較算法或者通過人工聯(lián)配和視覺觀察來確定。一方面,對(duì)于序列比較,將一個(gè)序列作為參考序列,而將測試5序列與之進(jìn)行比較。當(dāng)使用序列比較算法時(shí),將測試序列和參考序列輸入到計(jì)算機(jī)中,指定子序列坐標(biāo),如果必要,也指定序列算法程序參數(shù)??梢允褂媚J(rèn)的程序參數(shù),或者可以指定別的參數(shù)。然后基于程序參數(shù),序列比較算法計(jì)算出測試序列相對(duì)于參考序列的序列同一性百分比?!矫妫珺LAST和BLAST2.0算法被使用,其分別被描述于Altschul(1997)Nuc.AcidsRes.25:3389-3402,1997和Altschul(1990)J.Mol.Biol.215:403-410,19卯。用于實(shí)施BLAST分析的軟件可以通過美國國家生物技術(shù)信息中心公開獲得。這一算法涉及首先通過鑒別待詢序列(querys叫uence)中長度為W的短的字串來確定高分序列對(duì)(highscoringsequencepairs,HSPs),所述高分序列對(duì)在與數(shù)據(jù)庫15序列中同樣長度的字串聯(lián)配時(shí),匹配或者滿足某個(gè)正值的閾值T。T是指鄰近字串(neighborhoodword)的分?jǐn)?shù)閾值(Altschul等,如上)。這些初始的鄰近字串被用來啟動(dòng)搜索以發(fā)現(xiàn)包含有它們的更長的HSPs。所述字串沿著每一個(gè)序列向兩個(gè)方向延伸,只要累積的聯(lián)配分?jǐn)?shù)在增加。對(duì)于核苷酸序列,使用參數(shù)M(—對(duì)匹配的殘基的獎(jiǎng)勵(lì)分?jǐn)?shù);總是大于0)來計(jì)算累積分?jǐn)?shù)。對(duì)于氨基酸序列,使用記分20矩陣來計(jì)算累計(jì)分?jǐn)?shù)。出現(xiàn)下面情況時(shí),字串在各個(gè)方向上的延伸便停止累積的聯(lián)配分?jǐn)?shù)由達(dá)到的最大值下降了數(shù)量X;由于一個(gè)或者多個(gè)記分為負(fù)的殘基聯(lián)配的累積,累積分?jǐn)?shù)達(dá)到0或者0以下;或者延伸到了任一序列的末端。BLAST算法的參數(shù)W、T和X決定了聯(lián)配的靈敏度和速率。BLASTN程序(對(duì)于核苷酸序列)默認(rèn)的是字串長度(W)為11,期望值(E)為10,M=5,N=-4,對(duì)兩25條鏈進(jìn)行比較。對(duì)于氨基酸序列,BLASTP程序默認(rèn)字串長度為3,期望值(E)為10,BLOSUM62記分矩陣(參見Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA89:10915)聯(lián)配(B)為50,期望值(E)為10,M=5,N=-4,對(duì)兩條鏈進(jìn)行比較。BLAST算法也進(jìn)行兩個(gè)序列之間的相似性的統(tǒng)計(jì)學(xué)分析(參見,例如,30Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA90:5873)。由BLAST算法提供的一種相似性量度是最小合計(jì)概率(smallestsumprobability,P(N)),其表示兩個(gè)核苷酸或者氨基酸序列間的匹配將偶然發(fā)生的概率。例如,在測試核酸和參考核酸的比較中,如果最小合計(jì)概率小于大約0.2,更優(yōu)選的是在一方面中小于0.01,最優(yōu)選的是在一方面中小于大約0.001,就認(rèn)為該核酸與參考序列相似。35—方面,應(yīng)用基本局域聯(lián)配搜索工具("BLAST")來評(píng)價(jià)蛋白和核酸序列同源性。具體而言,五個(gè)特定的BLAST程序可以用來進(jìn)行以下的任務(wù)(1)BLASTP和BLAST3把氨基酸待詢序列與蛋白質(zhì)序列數(shù)據(jù)庫進(jìn)行比較;(2)BLASTN把核苷酸待詢序列與核苷酸序列數(shù)據(jù)庫進(jìn)行比較;(3)BLASTX把待詢核苷酸序列(兩條鏈)的六個(gè)閱讀框架的概念上的5翻譯產(chǎn)物與蛋白序列數(shù)據(jù)庫進(jìn)行比較;(4)TBLASTN把待詢蛋白序列與核苷酸序列數(shù)據(jù)庫的所有六個(gè)閱讀框架(兩條鏈)的翻譯結(jié)果進(jìn)行比較;和(5)TBLASTX把核苷酸待詢序列的六個(gè)框架的翻譯結(jié)果與核苷酸序列數(shù)據(jù)庫的六個(gè)框架的翻譯結(jié)果進(jìn)行比較。10BLAST程序通過確定相似片段來確定同源序列,所述相似片段在此是指在待查詢的氨基酸或核酸序列與受測序列之間的"高分片段對(duì)(high-scoringsegmentpairs)",該受測序列一方面從蛋白或者核酸序列數(shù)據(jù)庫得到。高分片段對(duì)一方面利用記分矩陣來鑒定(即,聯(lián)配),很多的記分矩陣在本領(lǐng)域是已知的。一方面,應(yīng)用的記分矩陣為BLOSUM62矩陣(Gonnet(1992),Science256:1443-1445;15Henikoff和Henikoff(1993),Proteins17:49-61)。較不優(yōu)選地,在一方面,也可以應(yīng)用PAM或者PAM250矩陣(參見如,Schwartz和Dayhoff,eds.,1978,Afafn'cesWashingion:NationalBiomedicalResearchFoundation)。BLAST程序通過美國國家醫(yī)學(xué)圖書館(U.S.NationalLibraryofMedicine)可以獲得。20根據(jù)所研究的序列長度和同源性程度,上述算法使用的參數(shù)可以被調(diào)整。在一些方面,在無用戶的指示的情況下,所述參數(shù)使用算法所采用的默認(rèn)參數(shù)。計(jì)算機(jī)系統(tǒng)和計(jì)算機(jī)程序產(chǎn)品本發(fā)明提供了計(jì)算機(jī)、計(jì)算機(jī)系統(tǒng)、計(jì)算機(jī)可讀取的介質(zhì)、計(jì)算機(jī)程序產(chǎn)25品以及其上記錄或存儲(chǔ)了本發(fā)明的核酸和多肽序列的類似設(shè)備。此外,在實(shí)踐本發(fā)明的方法中,例如,為了確定和鑒定序列同一性(為了確定核酸是否在本發(fā)明的范圍之內(nèi))、結(jié)構(gòu)同源性、基序等等,本發(fā)明的核酸或多肽序列可以在可通過計(jì)算機(jī)讀取和訪問的任何介質(zhì)上存儲(chǔ)、記錄和操作。正如此處所用,詞語"記錄"和"存儲(chǔ)"指在計(jì)算機(jī)介質(zhì)上存儲(chǔ)信息的過30程。熟練技術(shù)人員能容易地采用任何已知方法,在計(jì)算機(jī)可讀取的介質(zhì)上存儲(chǔ)信息,以產(chǎn)生包括本發(fā)明的一個(gè)或多個(gè)核酸和/或多肽序列的產(chǎn)品。正如本文所用,術(shù)語"計(jì)算機(jī)"、"計(jì)算機(jī)程序"和"處理器"以它們?cè)谧顝V的普通語境中的含義被使用,包括了所有這樣的設(shè)備,例如下面所詳細(xì)描述的。特定多肽或蛋白的"編碼序列"或"編碼特定多肽或蛋白的序列"是指當(dāng)被置于適當(dāng)?shù)恼{(diào)控序列的控制35下時(shí)可被轉(zhuǎn)錄和翻譯成多肽或蛋白的核酸序列。本發(fā)明的多肽包括本發(fā)明的示例性序列和與其基本上相同的序列以及前述序列的任一個(gè)的子序列(片段)。一方面,基本上相同的、或同源的多肽序列是指與本發(fā)明的示例性序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、583%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93Q/o、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性(同源性)的多肽序列。同源性(序列同一性)可以使用本文所描述的計(jì)算機(jī)程序和參數(shù)的任一種進(jìn)行確定。本發(fā)明的核酸或多肽序列可以在可通過計(jì)算機(jī)讀取和訪問的任何介質(zhì)10上存儲(chǔ)、記錄和操作。正如此處所用,詞語"記錄"和"存儲(chǔ)"指在計(jì)算機(jī)介質(zhì)上存儲(chǔ)信息的過程。熟練技術(shù)人員能容易地采用任何目前已知的方法,在計(jì)算機(jī)可讀取的介質(zhì)上存儲(chǔ)信息,以產(chǎn)生包括本發(fā)明的一個(gè)或多個(gè)核酸序列、本發(fā)明的一個(gè)或多個(gè)多肽序列的產(chǎn)品。本發(fā)明的另一方面是其上記錄有至少2、5、10、15或20或更多個(gè)本發(fā)明的核酸或多肽序列的計(jì)算機(jī)可讀取介質(zhì)。15本發(fā)明的另一方面是其上記錄有本發(fā)明的一個(gè)或多個(gè)核酸序列的計(jì)算機(jī)可讀取介質(zhì)。本發(fā)明的另一方面是其上記錄有本發(fā)明的一個(gè)或多個(gè)多肽序列的計(jì)算機(jī)可讀取介質(zhì)。本發(fā)明的另一方面是其上記錄有至少2、5、10、15或20或更多個(gè)如上面所述的核酸或多肽序列的計(jì)算機(jī)可讀取介質(zhì)。計(jì)算機(jī)可讀取介質(zhì)包括磁性可讀取介質(zhì)、光學(xué)可讀取介質(zhì)、電子可讀取介20質(zhì)和磁/光學(xué)介質(zhì)。例如,計(jì)算機(jī)可讀取的介質(zhì)可以是硬盤、軟盤、磁帶、CD-ROM、數(shù)字化視頻光盤(DVD)、隨機(jī)存取存儲(chǔ)器(RAM)或只讀存儲(chǔ)器(ROM)以及本領(lǐng)域的技術(shù)人員己知的其它類型的其它介質(zhì)。本發(fā)明的方面包括系統(tǒng)(例如基于因特網(wǎng)的系統(tǒng)),例如計(jì)算機(jī)系統(tǒng),它們存儲(chǔ)和操縱本文描述的序列信息。計(jì)算機(jī)系統(tǒng)100的一個(gè)實(shí)例以框圖形式示意25性地描述在圖1中。正如此處所用,"計(jì)算機(jī)系統(tǒng)"指硬件部分、軟件部分以及數(shù)據(jù)存儲(chǔ)部分,它們用于分析本發(fā)明的核酸序列的核苷酸序列或本發(fā)明的多肽序列。一方面,計(jì)算機(jī)系統(tǒng)100包括用于處理、訪問和操縱序列數(shù)據(jù)的處理器。處理器105可以是任何熟知類型的中央處理單元,如來自英特爾公司的奔騰III,或來自Sun、Motorola、Compag、AMD或IBM公司的類似處理器。30—方面,計(jì)算機(jī)系統(tǒng)100是一個(gè)通用的系統(tǒng),該系統(tǒng)包括處理器105和用于存儲(chǔ)數(shù)據(jù)的一個(gè)或多個(gè)內(nèi)部數(shù)據(jù)存儲(chǔ)部件110,以及用于檢索數(shù)據(jù)存儲(chǔ)部件上存儲(chǔ)的數(shù)據(jù)的一個(gè)或多個(gè)數(shù)據(jù)檢索設(shè)備。技術(shù)人員能容易地意識(shí)到,任何一種當(dāng)前可獲得的計(jì)算機(jī)系統(tǒng)都是合適的。在一個(gè)特定的方面,計(jì)算機(jī)系統(tǒng)100包括連接到總線上的處理器105,總35線連接到主存儲(chǔ)器115(在一方面,以RAM來實(shí)現(xiàn))和一個(gè)或多個(gè)內(nèi)部數(shù)據(jù)存儲(chǔ)設(shè)備110,例如其上已經(jīng)存儲(chǔ)了數(shù)據(jù)的硬盤驅(qū)動(dòng)器和/或其它計(jì)算機(jī)可讀介質(zhì)。在一些方面,計(jì)算機(jī)系統(tǒng)100進(jìn)一歩包括一個(gè)或多個(gè)數(shù)據(jù)檢索設(shè)備118,用于讀取在內(nèi)部數(shù)據(jù)存儲(chǔ)設(shè)備110上存儲(chǔ)的數(shù)據(jù)。數(shù)據(jù)檢索設(shè)備118可以是,例如軟盤驅(qū)動(dòng)器、壓縮磁盤驅(qū)動(dòng)器、磁帶驅(qū)動(dòng)器或能連接到遠(yuǎn)程數(shù)據(jù)存儲(chǔ)系統(tǒng)的調(diào)制解調(diào)器(例如通過因特網(wǎng))等等。在一些5方面中,內(nèi)部數(shù)據(jù)存儲(chǔ)設(shè)備110是可移動(dòng)的計(jì)算機(jī)可讀介質(zhì),例如含有控制邏輯和/或其上記錄的數(shù)據(jù)的軟盤、壓縮磁盤、磁帶等等。計(jì)算機(jī)系統(tǒng)100可以有利地包括適當(dāng)?shù)能浖蛴眠m當(dāng)?shù)能浖幊?,用于?dāng)數(shù)據(jù)存儲(chǔ)部件被插入到數(shù)據(jù)檢索設(shè)備中時(shí)從數(shù)據(jù)存儲(chǔ)部件讀取控制邏輯和/或數(shù)據(jù)。計(jì)算機(jī)系統(tǒng)100包括顯示器120,用于給計(jì)算機(jī)用戶顯示輸出。也應(yīng)用注10意到,計(jì)算機(jī)系統(tǒng)100可以被連接到網(wǎng)絡(luò)或廣域網(wǎng)中的其它計(jì)算機(jī)系統(tǒng)125a-c,以便給計(jì)算機(jī)100提供集中訪問。用于訪問和處理本發(fā)明的核酸序列的核苷酸或本發(fā)明的多肽序列的軟件(例如,檢索工具、比較工具和建模工具等等)在執(zhí)行過程中可駐留于主存儲(chǔ)器115中。15在一些方面,計(jì)算機(jī)系統(tǒng)100可以進(jìn)一步包括序列比較算法,其用于比較存儲(chǔ)于計(jì)算機(jī)可讀介質(zhì)上的本發(fā)明核酸序列或本發(fā)明多肽序列與存儲(chǔ)于計(jì)算機(jī)可讀介質(zhì)上的參考核苷酸或多肽序列。"序列比較算法"指在計(jì)算機(jī)系統(tǒng)100上執(zhí)行(本地或遠(yuǎn)程)的一種或多種程序,以比較核苷酸序列和數(shù)據(jù)存儲(chǔ)設(shè)備中存儲(chǔ)的其它核苷酸序列和/或化合物。例如,序列比較算法可以將計(jì)算機(jī)可讀介質(zhì)上存儲(chǔ)20的本發(fā)明的核酸序列的核苷酸序列或本發(fā)明的多肽序列與計(jì)算機(jī)可讀介質(zhì)上存儲(chǔ)的參考序列進(jìn)行比較,以鑒定同源性或結(jié)構(gòu)基序。圖2是示意性說明過程200的一個(gè)方面的流程圖,該過程用于將新的核苷酸或蛋白序列與序列數(shù)據(jù)庫進(jìn)行比較,以便確定新序列和數(shù)據(jù)庫中的序列之間的同源性水平。序列數(shù)據(jù)庫可以是存儲(chǔ)于計(jì)算機(jī)系統(tǒng)100上的個(gè)人數(shù)據(jù)庫,或可以25通過因特網(wǎng)獲得的公共數(shù)據(jù)庫如GENBANK。過程200在起始狀態(tài)201開始,然后轉(zhuǎn)到狀態(tài)202,其中要被比較的新序列被存儲(chǔ)于計(jì)算機(jī)系統(tǒng)100的存儲(chǔ)器上。正如上面所討論的,該存儲(chǔ)器可以是任何類型的存儲(chǔ)器,包括RAM或內(nèi)部存儲(chǔ)設(shè)備。然后過程200轉(zhuǎn)到狀態(tài)204,其中打開序列數(shù)據(jù)庫以進(jìn)行分析和比較。然30后過程200轉(zhuǎn)到狀態(tài)206,其中數(shù)據(jù)庫中存儲(chǔ)的第一個(gè)序列被讀取到計(jì)算機(jī)的存儲(chǔ)器中。然后在狀態(tài)210進(jìn)行比較,以確定第一個(gè)序列是否與第二個(gè)序列相同。重要的是應(yīng)該注意到,該步驟不限于進(jìn)行新序列和數(shù)據(jù)庫中第一個(gè)序列之間的精確比較。用于比較兩個(gè)核苷酸或蛋白序列的熟知的方法對(duì)于本
技術(shù)領(lǐng)域
的普通技術(shù)人員是己知的,即使所述兩個(gè)核苷酸或蛋白序列不完全相同。例如,可以在一個(gè)35序列中引入空位,以提高兩個(gè)測試序列之間的同源性水平??刂瓶瘴换蚱渌卣髟诒容^過程中是否被引入到序列中的參數(shù)通常由計(jì)算機(jī)系統(tǒng)的用戶輸入。—旦已經(jīng)在狀態(tài)210進(jìn)行兩個(gè)序列的比較,在決策狀態(tài)210就要作出兩個(gè)序列是否相同的判斷。當(dāng)然,術(shù)語"相同的"不限于絕對(duì)相同的序列。在過程200中,在由用戶輸入的同源性參數(shù)范圍內(nèi)的序列都將被標(biāo)記為"相同的"。如果作出兩個(gè)序列相同的判斷,過程200轉(zhuǎn)到狀態(tài)214,其中來自數(shù)據(jù)庫5的序列的名稱被顯示給用戶。該狀態(tài)通知用戶,具有顯示的名稱的序列滿足所輸入的同源性限制。一旦所存儲(chǔ)序列的名稱被顯示給用戶,過程200轉(zhuǎn)到?jīng)Q策狀態(tài)218,其中作出數(shù)據(jù)庫中是否存在更多序列的判斷。如果數(shù)據(jù)庫中不存在更多的序歹lj,那么過程200在結(jié)束狀態(tài)220終止。然而,如果數(shù)據(jù)庫中確實(shí)存在更多的序歹廿,那么過程200轉(zhuǎn)到狀態(tài)224,其中指針被指向數(shù)據(jù)庫中的下一個(gè)序列,以便與10新序列進(jìn)行比較。以這種方式,將新序列與數(shù)據(jù)庫中的每一序列聯(lián)配并進(jìn)行比較。應(yīng)該注意到,如果已經(jīng)在決策狀態(tài)212已經(jīng)作出了序列不同源的判斷,那么過程200將立即轉(zhuǎn)到?jīng)Q策狀態(tài)218,以便確定用于比較的數(shù)據(jù)庫中的任何其它序列是否可利用。因此,本發(fā)明的一個(gè)方面是計(jì)算機(jī)系統(tǒng),該系統(tǒng)包括處理器、其上已經(jīng)存15儲(chǔ)了本發(fā)明核酸序列或本發(fā)明的多肽序列的數(shù)據(jù)存儲(chǔ)設(shè)備、其上以可檢索方式存儲(chǔ)了待與本發(fā)明的核酸序列或本發(fā)明的多肽序列比較的參考核苷酸序列或多肽序列的數(shù)據(jù)存儲(chǔ)設(shè)備、以及用于進(jìn)行比較的序列比較器。該序列比較器可以指出被比較的序列之間的同源性水平,或鑒定上述的本發(fā)明的核酸序列的核酸密碼或者本發(fā)明的多肽序列中的結(jié)構(gòu)基序,或者該比較器可以鑒定與這些核酸密碼和多肽20密碼進(jìn)行比較的序列中的結(jié)構(gòu)基序。在一些方面中,數(shù)據(jù)存儲(chǔ)設(shè)備可以在其上已經(jīng)存儲(chǔ)了至少2、5、10、15、20、25、30或40個(gè)或更多個(gè)本發(fā)明的核酸序列或本發(fā)明的多肽序列的序列。本發(fā)明的另一方面是確定本發(fā)明的核酸序列或本發(fā)明的多肽序列和參考核苷酸序列之間的同源性水平的方法。所述方法包括通過使用確定同源性水平的25計(jì)算機(jī)程序讀取核酸密碼或多肽密碼以及參考核苷酸或多肽序列,以及用該計(jì)算機(jī)程序確定核酸密碼或多肽密碼與參考核苷酸或多肽序列之間的同源性水平。所述計(jì)算機(jī)程序可以是確定同源性水平的許多計(jì)算機(jī)程序的任何一種,包括本文中具體羅列的那些程序(例如,BLAST2N,具有默認(rèn)參數(shù)或任何調(diào)整的參數(shù))。所述方法可以使用上述的計(jì)算機(jī)系統(tǒng)執(zhí)行。所述方法還可以如下進(jìn)行通過使用所述30計(jì)算機(jī)程序讀取至少2、5、10、15、20、25、30或40個(gè)或更多個(gè)上述的本發(fā)明的核酸序列或本發(fā)明的多肽序列,以及確定核酸密碼或多肽密碼與參考核苷酸或多肽序列之間的同源性水平。圖3是示意性說明計(jì)算機(jī)中實(shí)施的過程250的一個(gè)方面的流程圖,該過程用于確定兩個(gè)序列是否同源。過程250在起始狀態(tài)252開始,然后轉(zhuǎn)到狀態(tài)254,35其中要被比較的第一個(gè)序列被存儲(chǔ)到存儲(chǔ)器上。然后要被比較的第二個(gè)序列在狀態(tài)256被存儲(chǔ)到存儲(chǔ)器上。然后過程250轉(zhuǎn)到狀態(tài)260,其中讀取第一個(gè)序列中的第一個(gè)字符,然后轉(zhuǎn)到狀態(tài)262,其中讀取第二個(gè)序列的第一個(gè)字符。應(yīng)該理解到,如果序列是核苷酸序列,那么字符將通常是A、T、C、G或U。如果序列是蛋白序列,那么字符一方面可以是單字母氨基酸密碼,以便第一個(gè)序列和第二個(gè)序列可以被容易地比較。5然后在決策狀態(tài)264作出兩個(gè)字符是否相同的判斷。如果它們相同,那么過程250轉(zhuǎn)到狀態(tài)268,其中第一個(gè)和第二個(gè)序列中的下一個(gè)字符被讀取。然后作出該下一個(gè)字符是否相同的判斷。如果它們相同,那么過程250繼續(xù)循環(huán),直到兩個(gè)字符不相同。如果作出的判斷是這兩個(gè)字母不相符,那么過程250轉(zhuǎn)到?jīng)Q策狀態(tài)274,以確定是否有更多的字符或者序列可以讀取。10如果沒有可讀取的任何更多的字符,那么過程250轉(zhuǎn)到狀態(tài)276,其中第一個(gè)和第二個(gè)序列之間的同源性水平被顯示給用戶。同源性水平通過計(jì)算序列之間相同的字符在第一個(gè)序列的序列總數(shù)中的比例來確定。因此,如果第一個(gè)100個(gè)核苷酸序列中的每一個(gè)字符都與第二個(gè)序列中的每一個(gè)字符聯(lián)配,那么同源性水平將是100%。15可以選擇地,計(jì)算機(jī)程序可以是這樣的計(jì)算機(jī)程序,其將本發(fā)明所示的核酸序列的核苷酸序列與一個(gè)或多個(gè)參考核苷酸序列進(jìn)行比較,以確定本發(fā)明的核酸密碼是否在一個(gè)或多個(gè)位置上與參考核酸序列不同。任選地,這樣的程序記錄,相對(duì)于參考多核苷酸序列或者本發(fā)明的核酸序列,被插入、刪除或取代的核苷酸的長度和身份。一方面,計(jì)算機(jī)程序可以是確定本發(fā)明的核酸序列是否相對(duì)于參20考核苷酸序列含有單核苷酸多態(tài)性(SNP)的程序。因此,本發(fā)明的另一方面是確定本發(fā)明的核酸序列是否在一個(gè)或多個(gè)核苷酸處與參考核苷酸序列不同的方法,所述方法包括通過使用鑒定核酸序列之間的差異的計(jì)算機(jī)程序讀取核酸密碼和參考核苷酸序列,并用該計(jì)算機(jī)程序鑒定核酸密碼和參考核苷酸序列之間的差異。在一些方面,計(jì)算機(jī)程序是鑒定單核苷酸多25態(tài)性的程序。該方法可以通過上面描述的計(jì)算機(jī)程序和圖3所示意性說明的方法執(zhí)行。所述方法還可以如下進(jìn)行通過使用所述計(jì)算機(jī)程序讀取至少2、5、10、15、20、25、30或40個(gè)或更多個(gè)本發(fā)明核酸序列和參考核苷酸序列,以及用該計(jì)算機(jī)程序鑒定核酸密碼與參考核苷酸序列之間的差異。在其它方面,基于計(jì)算機(jī)的系統(tǒng)可以進(jìn)一步包括鑒定器,其用于鑒定本發(fā)30明的核酸序列或本發(fā)明的多肽序列中的特征。"鑒定器"指在本發(fā)明的核酸序列或本發(fā)明的多肽序列中鑒定某些特征的一個(gè)或多個(gè)程序。一方面,鑒定器可以包括在本發(fā)明的核酸序列中鑒定開放閱讀框(ORF)的程序。圖4是示意性說明鑒定器過程300的一個(gè)方面的流程圖,即用于檢測序列中特征的存在。過程300在起始狀態(tài)302開始,然后轉(zhuǎn)到狀態(tài)304,其中將被檢査35特征的第一個(gè)序列存儲(chǔ)在計(jì)算機(jī)系統(tǒng)100的存儲(chǔ)器115上。然后過程300轉(zhuǎn)到狀態(tài)306,其中打開序列特征數(shù)據(jù)庫。這樣的數(shù)據(jù)庫包括每一特征的屬性以及該特征的名稱的列表。例如,特征名稱是"起始密碼子",屬性是"ATG"。另一個(gè)實(shí)例是特征名稱"TAATAA序列盒",特征屬性是"TAATAA"。這樣的數(shù)據(jù)庫的實(shí)例由威斯康星大學(xué)遺傳學(xué)計(jì)算機(jī)組(UniversityofWisconsinGeneticsComputerGroup)開發(fā)??梢赃x擇地,這些特征可以是結(jié)構(gòu)多肽基序如a螺旋、J3折疊,或功能多肽5基序如酶活性位點(diǎn)、螺旋-轉(zhuǎn)角-螺旋基序或本
技術(shù)領(lǐng)域
技術(shù)人員已知的其它基序?!┰跔顟B(tài)306打開特征數(shù)據(jù)庫,過程300就轉(zhuǎn)到狀態(tài)308,其中從數(shù)據(jù)庫讀取第一個(gè)特征。然后在狀態(tài)310將第一個(gè)特征的屬性與第一個(gè)序列進(jìn)行比較。接著在決策狀態(tài)316作出在第一個(gè)序列中是否發(fā)現(xiàn)該特征的屬性的判斷。如果發(fā)現(xiàn)了屬性,那么過程300轉(zhuǎn)到狀態(tài)318,其中所發(fā)現(xiàn)的特征的名稱被顯示給用戶。10然后,過程300轉(zhuǎn)到?jīng)Q策狀態(tài)320,其中作出數(shù)據(jù)庫中是否存在更多特征的判斷。如果不存在更多特征,那么過程300在結(jié)束狀態(tài)324終止。然而,如果數(shù)據(jù)庫中確實(shí)存在更多的特征,那么過程300在狀態(tài)326讀取下一個(gè)序列特征,循環(huán)回到狀態(tài)310,其中將下一個(gè)特征的屬性與第一個(gè)序列進(jìn)行比較。應(yīng)當(dāng)注意,如果在決策狀態(tài)316在第一個(gè)序列中沒有發(fā)現(xiàn)特征屬性,那么過程300直接轉(zhuǎn)到15決策狀態(tài)320,以便確定數(shù)據(jù)庫中是否存在更多特征。因此,本發(fā)明的另一方面是鑒定本發(fā)明的核酸序列或本發(fā)明的多肽序列中的特征的方法,所述方法包括通過使用鑒定其中特征的計(jì)算機(jī)程序讀取核酸密碼或多肽密碼,并用該計(jì)算機(jī)程序鑒定核酸密碼中的特征。一方面,計(jì)算機(jī)程序包括鑒定開放閱讀框(ORF)的計(jì)算機(jī)程序。所述方法可以如下進(jìn)行通過使用所20述計(jì)算機(jī)程序讀取本發(fā)明的核酸序列或本發(fā)明的多肽序列中的一個(gè)序列或至少2、5、10、15、20、25、30或40個(gè)或更多個(gè)序列,以及用該計(jì)算機(jī)程序鑒定核酸密碼或多肽密碼中的特征。本發(fā)明的核酸序列或本發(fā)明的多肽序列可以以多種格式在各種數(shù)據(jù)處理器程序中存儲(chǔ)和操作。例如,本發(fā)明的核酸序列或本發(fā)明的多肽序列可以以文本25文件存儲(chǔ)在字處理文件中,如MicrosoftWORD頂或WORDPERFECT,或以ASCII文件存儲(chǔ)在本領(lǐng)域技術(shù)人員熟悉的各種數(shù)據(jù)庫程序中,例如DB2TM、SYBASE或ORACLE。此外,許多計(jì)算機(jī)程序和數(shù)據(jù)庫可以被用作序列比較算法、鑒定器或與本發(fā)明的核酸序列或本發(fā)明的多肽序列進(jìn)行比較的參考核苷酸序列或多肽序列的來源。下面的羅列不意圖限制本發(fā)明,而是提供對(duì)本發(fā)明的核30酸序列或本發(fā)明的多肽序列有用的程序和數(shù)據(jù)庫的指導(dǎo)??梢允褂玫某绦蚝蛿?shù)據(jù)庫,包括但不限于MACPATTERN(EMBL)、DISCOVERYBASE(MolecularApplicationGroup)、GENEMINE(MolecularApplicationGroup)、LOOK(MolecularApplicationGroup)、MACLOOK(MolecularApplicationGroup)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX35(Altschul等人,J.Mol.Biol.215:403,1990)、FASTA(PearsonandLipman,Proc.Natl.Acad.Sci.USA,85:2444,1988)、FASTDB(Brutlag等人,Comp.App.Biosci.6:237-245,1990)、CATALYST(MolecularSimulationsInc.)、Catalyst/SHAPE(MolecularSimulationsInc.)、Cerius2.DBAccessTM(MolecularSimulationsInc.)、HypoGen(MolecularSimulationsInc.)、INSIGHTIITM(MolecularSimulationsInc.)、DISCOVER(MolecularSimulationsInc.)、CHARMm(Molecular5SimulationsInc.)、FELIXTM(MolecularSimulationsInc.)、DELPHI(MolecularSimulationsInc.)、QuanteMMTM(MolecularSimulationsInc.)、Homology(MolecularSimulationsInc.)、MODELER(MolecularSimulationsInc.)、ISIS(MolecularSimulationsInc.)、Quanta/ProteinDesign(MolecularSimulationsInc.)、WebLab(MolecularSimulationsInc.)、WebLabDiversityExplorer(MolecularSimulations10Inc.)、GeneExplorer(MolecularSimulationsInc.)、SeqFold(MolecularSimulationsInc.)、MDLAvailableChemicalsDirectory數(shù)據(jù)庫、MDLDrugDataReport數(shù)據(jù)庫、ComprehensiveMedicinalChemistry數(shù)據(jù)庫、Derwent'sWorldDrugIndex數(shù)據(jù)庫、BioByteMasterFile數(shù)據(jù)庫、Genbank數(shù)據(jù)庫和Genseqn數(shù)據(jù)庫?;诒景l(fā)明的公開內(nèi)容,許多其它程序和數(shù)據(jù)庫對(duì)于本
技術(shù)領(lǐng)域
的技術(shù)人員是顯而易見的。15可以用上述程序檢測的基序包括編碼亮氨酸拉鏈的序列、螺旋-轉(zhuǎn)角-螺旋基序、糖基化位點(diǎn)、泛素化位點(diǎn)、ct螺旋和P折疊、編碼指導(dǎo)被編碼的蛋白分泌的信號(hào)肽的信號(hào)序列、在轉(zhuǎn)錄調(diào)節(jié)中涉及的序列如同源框、酸性伸展物(acidicstretches)、酶活性位點(diǎn)、底物結(jié)合位點(diǎn)和酶切割位點(diǎn)。20核酸的雜交本發(fā)明提供了分離的或重組的核酸,這些核酸與本發(fā)明的示例性序列(例如SEQIDNO:l,SEQIDNO:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQIDNO:ll,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,SEQIDNO:21,SEQIDNO:23,SEQIDNO:25,SEQIDNO:27,SEQIDNO:29,SEQ25IDNO:31,SEQIDNO:33,SEQIDNO:35,SEQIDNO:37,SEQIDNO:39,SEQIDNO:41,SEQIDNO:43,SEQIDNO:45,SEQIDNO:47,SEQIDNO:49,SEQIDNO:51,SEQIDNO:53,SEQIDNO:55,SEQIDNO:57'SEQIDNO:59,SEQIDNO:61,SEQIDNO:63,SEQIDNO:65,SEQIDNO:67,SEQIDNO:69,SEQIDNO:71,SEQIDNO:73,SEQIDNO:75,SEQIDNO:77,SEQIDNO:79,SEQ30IDNO:81,SEQIDNO:83,SEQIDNO:85,SEQIDNO:87,SEQIDNO:89,SEQIDNO:91,SEQIDNO:93,SEQIDNO:95,SEQIDNO:97,SEQIDNO:99,SEQIDNO:101,SEQIDNO:103,SEQIDNO:105,SEQIDNO:107,SEQIDNO:109,SEQIDNO:lll,SEQIDNO:113,SEQIDNO:115,SEQIDNO:117,SEQIDNO:119,SEQIDNO:121,SEQIDNO:123,SEQIDNO:125,SEQIDNO:127,SEQ35IDNO:129,SEQIDNO:131,SEQIDNO:133,SEQIDNO:135,SEQIDNO:137,SEQIDNO:139,SEQIDNO:141,SEQIDNO:143,SEQIDNO:145'SEQIDNO:147,SEQIDNO:149,SEQIDNO:151,SEQIDNO:153,SEQIDNO:155,SEQIDNO:157,SEQIDNO:159,SEQIDNO:161,SEQIDNO:163或SEQIDNO:165(也參見表1、2和3、下面的實(shí)施例1和4,以及序列表))在嚴(yán)緊條件下雜交。嚴(yán)緊條件可以是高度嚴(yán)緊性條件、中度嚴(yán)緊性條件和/或低度嚴(yán)緊性條件,5包括本文描述的高的和降低的嚴(yán)緊性的條件。一方面,正如下面所討論的,洗滌條件的嚴(yán)緊性提供了決定核酸是否在本發(fā)明范圍內(nèi)的條件。"雜交"指這樣一個(gè)過程,g卩,通過該過程核酸鏈與互補(bǔ)鏈通過堿基配對(duì)而結(jié)合。雜交反應(yīng)可以是靈敏的并且是選擇性的,以便感興趣的特定序列可以被鑒定,甚至在其以低濃度存在的樣品中也可以被鑒定。適度的嚴(yán)緊條件(stringent10conditions)可以通過,例如預(yù)雜交和雜交溶液中鹽或甲酰胺的濃度來定義,或者通過雜交溫度來定義,這些嚴(yán)緊條件在本
技術(shù)領(lǐng)域
是已知的。在可選的方面,嚴(yán)緊性可以通過降低鹽的濃度、增加甲酰胺的濃度或升高雜交溫度來增加。在可選擇的方面,本發(fā)明的核酸通過它們?cè)诟鞣N嚴(yán)緊條件(例如強(qiáng)、中等和低嚴(yán)緊條件)下雜交的能力來定義,正如本文所示。15—方面,高度嚴(yán)緊性下的雜交包括在大約37'C到42'C的溫度下大約50%的甲酰胺。一方面,雜交條件包括在大約301:到35'(:下在大約35%至25%的甲酰胺中降低的嚴(yán)緊性條件。一方面,雜交條件包括高度嚴(yán)緊性條件,例如,在42'C、在50%甲酰胺、5XSSPE、0.3%SDS中,和200n/ml的剪切和變性鮭精DNA。一方面,雜交條件包括這些降低的嚴(yán)緊性條件,但在降低的溫度35匸在35%甲酰胺20中。相應(yīng)于特定的嚴(yán)緊性水平的溫度范圍可以通過計(jì)算目標(biāo)核酸中的嘌呤嘧啶比并相應(yīng)調(diào)節(jié)溫度而進(jìn)一步縮小。上述范圍和條件的變化在本領(lǐng)域中是熟知的。在可以選擇的方面中,本發(fā)明的核酸,正如通過它們?cè)趪?yán)緊條件下雜交的能力所定義的,可以在本發(fā)明的核酸的大約五個(gè)殘基到全長之間;例如它們的長度可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、25卯、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多殘基。也包括小于全長的核酸。這些核酸可以用作,例如雜交探針、標(biāo)記探針、PCR寡核苷酸探針、siRNA或miRNA(單鏈或雙鏈)、反義或編碼抗體結(jié)合肽(表位)、基序、活性位點(diǎn)的序列以及類似序列?!矫?,本發(fā)明的核酸通過它們?cè)诟叨葒?yán)緊性下雜交的能力定義,高度嚴(yán)30緊性包括在大約37'C到42'C的溫度下大約50。/。的甲酰胺的條件。一方面,本發(fā)明的核酸通過它們?cè)诮档偷膰?yán)緊性下雜交的能力定義,降低的嚴(yán)緊性包括在大約30'C到35'C在大約35%至25%的甲酰胺中的條件??梢赃x擇地,本發(fā)明的核酸通過它們?cè)诟叨葒?yán)緊性下雜交的能力定義,高度嚴(yán)緊性包括的條件為在42'C、在50%甲酰胺、5XSSPE、0.3。/。SDS中,和封35閉核酸的重復(fù)序列,如cot-l或鮭精DNA(例如200n/ml的剪切和變性鮭精DNA)。一方面,本發(fā)明的核酸通過它們?cè)诮档偷膰?yán)緊性條件下雜交的能力定義,降低的嚴(yán)緊性條件包括在35'C或42°C的降低溫度下的35%或40%甲酰胺中。在核酸雜交反應(yīng)中,用于得到特定嚴(yán)緊性水平的條件將根據(jù)雜交中的核酸的性質(zhì)變化。例如,所述核酸的雜交區(qū)域的長度、互補(bǔ)程度、核苷酸序列組成(例如GC和AT含量)和核酸類型(例如RNA和DNA)可以在選擇雜交條件時(shí)加以5考慮。另外的考慮因素是核酸之一是否被固定,例如固定在濾膜上。雜交可以在低度嚴(yán)緊性、中度嚴(yán)緊性或高度嚴(yán)緊性的條件下進(jìn)行。作為核酸雜交的一個(gè)實(shí)例,含有固定化的變性核酸的聚合物膜首先在45'C在含有如下成分的溶液中預(yù)雜交30分鐘0.9MNaCl、50mMNaH2P04,pH7.0、5.0mMNa2EDTA、0.5%SDS、10XDenhardt,s和0.5mg/ml多核糖腺苷酸。然后在該溶液中加入大約102X107cpm(比活性為4-9X108cpm/ug)的32P末端標(biāo)記的寡核苷酸探針。在溫育12-16小時(shí)后,在室溫下在含有0.5%SDS的IXSET"50mMNaCl、20mMTris鹽酸,pH7.8、lmMNa2EDTA)中將膜洗滌30分鐘,隨后,在該寡核苷酸探針的Tm-l(TC的溫度,在新鮮的1XSET中洗滌30分鐘。然后將膜暴露于放射自顯影膠片,以檢測雜交信號(hào)。所有的前述雜交將被認(rèn)為在高嚴(yán)緊性條件下。15雜交后,洗滌濾膜以除去任何非特異性結(jié)合的可檢測探針。用于洗滌濾膜的嚴(yán)緊性也可以根據(jù)如下方面進(jìn)行變化被雜交的核酸的性質(zhì)、被雜交的核酸的長度、互補(bǔ)程度、核苷酸序列組成(例如GC和AT含量)和核酸類型(例如RNA和DNA)。逐步增高的嚴(yán)緊性條件洗滌的實(shí)例如下2XSSC,0.1%SDS,室溫下洗滌15分鐘(低度嚴(yán)緊性);O.IXSSC,0.5%SDS,室溫下洗滌30分鐘到1小時(shí)20(中度嚴(yán)緊性);O.IXSSC,0.5%SDS,雜交溫度和68'C之間洗滌15到30分鐘(高度嚴(yán)緊性);和0.15MNaCl,72'C洗滌15分鐘(極高嚴(yán)緊性)。最終的低嚴(yán)緊性洗滌可以在0.1XSSC在室溫下進(jìn)行。上述的實(shí)例僅僅是可用于洗滌濾膜的一組條件的示例性說明。本領(lǐng)域技術(shù)人員將知道,對(duì)于不同嚴(yán)緊性的洗滌,可以有多種方案。下面給出了一些其它實(shí)例。25—方面,雜交條件包括洗滌步驟,其包括在室溫下在含有IX150mMNaCl、20mMTris鹽酸,pH7.8、lmMNa2EDTA、0.5%SDS的溶液中洗滌30分鐘,然后在新鮮溶液中洗滌30分鐘。通過放射自顯影或其它常規(guī)技術(shù),鑒定已雜交至探針的核酸??梢詫?duì)上述方法進(jìn)行修飾,以鑒定與探針序列具有降低水平的序列同一性30(同源性)的核酸。例如,為了獲得與可檢測的探針具有降低的序列同一性(同源性)的核酸,可以使用較低嚴(yán)緊性的條件。例如,雜交溫度可以以5'C的梯度變化從68。C降低到42。C,雜交緩沖液的Na+濃度為大約1M。在雜交后,用2XSSC、0.5y。SDs在雜交溫度下洗滌濾膜。這些條件在高于5crc被認(rèn)為是"中度"條件,在低于50'C被認(rèn)為是"低度"條件。特定實(shí)例的"中度"雜交條件是當(dāng)上述雜交35在55。C進(jìn)行。特定實(shí)例的"低度嚴(yán)格性"雜交條件是當(dāng)上述雜交在45'C進(jìn)行??梢赃x擇地,雜交可以在含有甲酰胺的緩沖液如6XSSC中在42'C的溫度下進(jìn)行。在這種情況下,雜交緩沖液中甲酰胺的濃度可以以5%的梯度變化從50%降低到0%,以鑒定與探針具有降低水平的同源性的克隆。在雜交后,用6XSSC、0.5%SDS在5(TC洗滌濾膜。這些條件在高于25%的甲酰胺被認(rèn)為是"中度"條件,在低于25%甲酰胺被認(rèn)為是"低度"條件。特定實(shí)例的"中度"雜交條件是當(dāng)上5述雜交在30%甲酰胺中進(jìn)行。特定實(shí)例的"低度嚴(yán)格性"雜交條件是當(dāng)上述雜交在10%甲酰胺中進(jìn)行。然而,雜交形式的選擇不是關(guān)鍵性的——洗滌條件的嚴(yán)緊性是決定核酸是否在本發(fā)明范圍內(nèi)的條件。用于鑒定本發(fā)明范圍內(nèi)的核酸的洗滌條件包括,例如在pH7大約0.02M的鹽濃度,至少大約50'C或大約55'C到大約60'C的溫度;或10者在72'C大約0.15MNaCi的鹽濃度下大約15分鐘;或者在至少大約50'C或大約55'C到大約6(TC的溫度下大約0.2XSSC的鹽濃度下大約15到大約20分鐘;或者用溶液將雜交復(fù)合物洗滌兩次,所述溶液的鹽濃度為含有0.1%SDS的大約2XSSC,在室溫下洗漆15分鐘,然后用含有0.1%SDS的0.1XSSC在68。C洗滌15分鐘,洗滌兩次;或者等同的條件。參見Sambrook,Tijssen和Ausubel對(duì)于SSC15緩沖液和等同條件的描述。這些方法可以被用于分離或鑒定本發(fā)明的核酸。例如,前述方法可用于分離或鑒定核酸,所述核酸具有與選自本發(fā)明的序列或含有其至少大約IO、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400或500個(gè)連續(xù)堿基的片段以及其互補(bǔ)序列之一的核酸序列具有至少大約50%、51%、52%、53%、2054%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性(同源性)的序歹l」。序列同一性(同源性)可以使用聯(lián)配算法來測量。例如,同源多核苷酸可以25具有編碼序列,該編碼序列是本文描述的編碼序列之一的天然發(fā)生的等位基因變體。當(dāng)與本發(fā)明的核酸比較時(shí),這樣的等位基因變體可以具有一個(gè)或多個(gè)核苷酸的取代、刪除或添加。另外,上述的方法可用于分離編碼多肽的核酸,所述多肽與本發(fā)明的多肽或者包含其至少5、10、15、20、25、30、35、40、50、75、100或150個(gè)連續(xù)氨基酸的片段具有至少大約99%、至少大約95%、至少大約90%、30至少大約85%、至少大約80%、至少大約75%、至少大約70%、至少大約65%、至少大約60%、至少大約55%或至少大約50%的序列同一性(同源性),正如使用序列聯(lián)配算法(例如FASTA3.0t78版本算法,參數(shù)為默認(rèn)值)所確定的。寡核苷酸探針及使用這些寡核苷酸探針的方法35本發(fā)明也提供了核酸探針,例如可以用于鑒定、擴(kuò)增或分離編碼具有纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽的核酸或其片段,或用于鑒定纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的基因。一方面,該探針包括本發(fā)明核酸中的至少大約10個(gè)連續(xù)堿基。可以選擇地,本發(fā)明的探針可以是如本發(fā)明核酸中所示序列的至少大約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、523、24、25、30、35、40、45、50、60、70、80、90、100、110、120、130、150或大約10到50、大約20到60或大約30到70個(gè)連續(xù)堿基。這些探針通過結(jié)合和/或雜交來鑒定核酸。這些探針可以在本發(fā)明的陣列中使用,參見下面的討論,包括例如毛細(xì)管陣列。本發(fā)明的探針也可以用于分離其它核酸或多肽。可以選擇地,多于一種的探針(其中至少一種探針能與核酸樣品中存在的任何互補(bǔ)序列特異性雜交)可以在擴(kuò)增反應(yīng)中使用,以確定樣品是否包含含有本發(fā)明的核酸的生物體(例如從中可分離出所述核酸的生物體)。一方面,這些探針包括寡核苷酸。一方面,擴(kuò)增反應(yīng)可以包括PCR反應(yīng)。PCR實(shí)驗(yàn)方案在在Ausubel和Sambrook,supra中有所描述??蛇x地,擴(kuò)增可以包括連接酶鏈?zhǔn)椒磻?yīng)、3SR或35鏈置換反應(yīng)(見Barany,R,"TheLigaseChainReactioninaPCRWorld",_PC/M"/iocfecr"d^f//cof//(ms丄:5-16,1991;E.Fahyetah,"Self-sustainedSequenceReplication(3SR):AnIsothermalTranscription-basedAmplificationSystemAlternativetoPCR",PC/Me/Zwtfe^^//oW/ow丄:25國33,1991;以及WalkerG.T.etah,"StrandDisplacementAmplification-anIsothermalinvitroDNAAmplificationTechnique",NucleicAcidResearch22:1691-1696,1992)。在這樣的方法中,將樣品5中的核酸與探針接觸,進(jìn)行擴(kuò)增反應(yīng),檢測所得到的擴(kuò)增產(chǎn)物。擴(kuò)增產(chǎn)物可以通過在反應(yīng)產(chǎn)物上進(jìn)行凝膠電泳并用嵌入劑如溴化乙啶染色凝膠來檢測??梢赃x擇地,可以用放射性同位素標(biāo)記一種或多種探針,放射性擴(kuò)增產(chǎn)物的存在在凝膠電泳后通過放射自顯影術(shù)來檢測。衍生自本發(fā)明核酸的末端附近的序列的探針也可以在染色體步移10(chromosomewalking)方法中使用,以鑒定含有臨近本發(fā)明的序列的基因組序列的克隆。這樣的方法允許從宿主生物中分離編碼額外蛋白的基因?!矫?,本發(fā)明的分離或重組的核酸、與其互補(bǔ)的序列、或含有本發(fā)明的序列之一的至少10、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400或500個(gè)連續(xù)堿基的片段、或與其互補(bǔ)的序列,被用作探針,以鑒15定和分離相關(guān)的核酸。在一些方面,該相關(guān)的核酸可以是來自生物體的cDNA或基因組DNA,這些生物體并不是最初從中分離出所述核酸的生物體。例如,其它生物體可以是相關(guān)生物體。在這樣的方法中,核酸樣品在允許探針與相關(guān)序列特異性雜交的條件下與探針接觸。然后用上面描述的任意一種方法檢測探針與來自相關(guān)生物體的核酸的雜交。20通過改變用于鑒定與可檢測探針雜交的核酸例如cDNA或基因組DNA的雜交條件的嚴(yán)緊性,可以鑒定并分離與探針具有不同同源性水平的核酸。嚴(yán)緊性通過在低于探針的解鏈溫度的變化溫度下進(jìn)行雜交來改變。解鏈溫度Tm是50%的耙序列與完全互補(bǔ)的探針雜交時(shí)的溫度(在確定的離子強(qiáng)度和pH下)。選擇非常嚴(yán)緊的條件,使其與特定探針的Tm相等,或比Tm低大約5'C。可以使用下述25公式計(jì)算探針的解鏈溫度對(duì)于長度在14到70個(gè)核苷酸的探針,使用如下公式計(jì)算解鏈溫度(Tm):Tm=81.5+16.6(1og[Na+])+0.41(G+C的比例分?jǐn)?shù))—(600/N),其中N是探針的長度。如果雜交在含有甲酰胺的溶液中進(jìn)行,解鏈溫度使用如下等式計(jì)算Tm=81.530+16.6(1og[Na+])+0.41(G+C的比例分?jǐn)?shù))—(0.63%甲酰胺)一(600/N),其中N是探針的長度。預(yù)雜交在6XSSC、5XDenhardt,s試劑、0.5%SDS、100嗎變性的片段化鮭精DNA或6XSSC、5XDenhardt,s試劑、0.5%SDS、100嗎變性的片段化鮭精DNA、50%甲酰胺中進(jìn)行。SSC和Denhardt,s溶液的配方已在Sambrook等,supra35中列出?!矫?,雜交通過將可檢測探針加入到上面所列出的預(yù)雜交溶液中來進(jìn)行。在探針包括雙鏈DNA的情況下,在加入到雜交溶液之前對(duì)探針變性。一方面,將濾膜與雜交溶液接觸充足的時(shí)間,以允許探針與含有與其互補(bǔ)的序列或與其同源的序列的cDNA或基因組DNA雜交。對(duì)于長度超過200個(gè)核苷酸的探針,雜交可以在比Tm低15-25-C的溫度進(jìn)行。對(duì)于更短的探針,如寡核苷酸探針,雜交在5比Tm低5-10'C的溫度進(jìn)行。一方面,6XSSC中的雜交在大約68t:進(jìn)行。通常,在含有50%甲酰胺的溶液中的雜交是在大約42'C進(jìn)行的。抑制纖維素酶的表達(dá)本發(fā)明提供了與本發(fā)明的核酸例如編碼纖維素酶的核酸互補(bǔ)的核酸(例如10本發(fā)明的核酸的反義序列),例如包括反義序列、siRNA、miRNA、核酶的核酸。含有反義序列的本分明核酸能抑制編碼纖維素酶的基因的轉(zhuǎn)運(yùn)、剪接或轉(zhuǎn)錄。抑制可通過將基因組DNA或信使RNA作為靶標(biāo)來實(shí)現(xiàn)。作為靶標(biāo)的核酸的轉(zhuǎn)錄或功能可以被抑制,例如通過雜交和/或切割。本發(fā)明提供的一組示例性的抑制劑包括寡核苷酸,這些寡核苷酸能結(jié)合纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、15甘露聚糖酶和/或|3-葡糖苷酶基因或信息,在兩種情況下都阻止或抑制纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的產(chǎn)生或功能。結(jié)合可通過序列特異性雜交來完成。另一類有用的抑制劑包括引起纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的信息失活或切割的寡核苷酸。該寡核苷酸可具有引起此類切割的酶活性,如核酶??梢詫?duì)寡核苷酸進(jìn)20行化學(xué)修飾,或與能切割互補(bǔ)核酸的酶或組分偶聯(lián)。可以對(duì)許多不同的這樣的寡核苷酸的庫進(jìn)行篩選來尋找那些具有期望活性的寡核苷酸。因此,本發(fā)明提供了在核酸和/或蛋白水平抑制纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶表達(dá)的各種組合物,例如,含有本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶序列的反義序列、siRNA、25miRNA和核酶,以及抗纖維素酶抗體,如本發(fā)明的抗內(nèi)切葡聚糖酶抗體、抗纖維二糖水解酶抗體、抗甘露聚糖酶抗體和/或抗P-葡糖苷酶抗體。纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶表達(dá)的抑制可以具有各種工業(yè)應(yīng)用。例如,抑制纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的表達(dá)可以減慢或防止變壞。一方面,30本發(fā)明的抑制纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶的表達(dá)和/或活性的組合物的使用,例如抗體、反義寡核苷酸、核酶、siRNA和miRNA的使用,被用于減慢或防止變壞。因此,一方面,本發(fā)明提供了方法和組合物,包括將本發(fā)明的抗體、反義寡核苷酸、核酶、siRNA和miRNA應(yīng)用于植物或者植物產(chǎn)品(如,谷物、谷粒、果實(shí)、種籽、根、葉等),以阻止或者延緩變35壞。這些組分也可以由植物(如,轉(zhuǎn)基因植物)或者其它生物(如,用本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的基因轉(zhuǎn)化的細(xì)菌或者其它微生物)表達(dá)。用于抑制纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶表達(dá)的本發(fā)明的組分(例如,反義序列、iRNA、核酶、抗體)可用作藥物組合物,例如,抗病原劑,或用在其它治療中,例如用作抗微生物劑,如用于5沙門氏菌屬。友義寡拔微本發(fā)明提供了能結(jié)合纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或l3-葡糖苷酶信息的反義寡核苷酸,一方面,其能通過以mRNA作為靶標(biāo)10來抑制纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。設(shè)計(jì)反義寡核苷酸的策略在科學(xué)和專利文獻(xiàn)中有很好的描述,技術(shù)人員能使用本發(fā)明的新試劑設(shè)計(jì)這樣的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶寡核苷酸。例如,篩選有效的反義寡核苷酸的基因步移/RNA作圖方法在本
技術(shù)領(lǐng)域
是熟知的,例如參見Ho(2000)MethodsEnzymol.314:15168-183,該文獻(xiàn)描述了RNA作圖分析法,該分析法是基于標(biāo)準(zhǔn)的分子技術(shù),以提供用于有效的反義序列選擇的一種簡單且可靠的方法。也參見Smith(2000)Eur.J.Pharm.Sci.11:191-198。自然發(fā)生的核酸被用作反義寡核苷酸。該反義寡核苷酸可以是任意長度;例如,在可選擇的方面,該反義寡核苷酸在大約5到100之間,大約10到80之20間,大約15到60之間,大約18到40之間。最適長度可以通過常規(guī)篩選來決定。這些反義寡核苷酸可以以任意濃度存在。最適濃度可通過常規(guī)篩選來決定。廣泛種類的合成的、非天然發(fā)生的核苷酸和核酸類似物是已知的,它們可以解決這一潛在的問題。例如,可以使用含有非離子骨架的肽核酸(PNAs),如含有N-(2-氨基乙基)甘氨酸單元。也可以使用具有硫代磷酸酯鍵的反義寡核苷酸,正如在如下25文獻(xiàn)中所描述的WO97/03211;WO96/39154;Mata(1997)ToxicolApplPharmacol144:189-197;AntisenseTherapeutics,ed.Agrawal(HumanaPress,Totowa,N丄,1996)。正如上面所描述的,本發(fā)明提供的具有合成DNA骨架類似物的反義寡核苷酸也可以包括二硫代磷酸酯、甲基膦酸、氨基磷酸酯、垸基磷酸三酯、氨基磺酸酯、3'-硫代乙縮醛、亞甲基(甲基亞氨)、3'-N-氨基甲酸酯和嗎啉代氨基甲酸酯核30酸。組合化學(xué)方法學(xué)可用于產(chǎn)生大量能被快速篩選特異性寡核苷酸的寡核苷酸,所述特異性寡核苷酸對(duì)任何靶標(biāo)具有適當(dāng)?shù)慕Y(jié)合親和性和特異性,例如本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶正義和反義序列(例如參見Gold(1995)J.,Biol.Chem.270:13581-13584)。35浙縱樣騰本發(fā)明提供了能結(jié)合纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的信息的核酶。這些核酶能抑制纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的活性,例如通過以mRNA作為耙標(biāo)。設(shè)計(jì)核酶和選擇用于靶向的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘5露聚糖酶和/或f3-葡糖苷酶特異性反義序列的策略在科學(xué)和專利文獻(xiàn)中有很好的描述,熟練技術(shù)人員能使用本發(fā)明的新試劑來設(shè)計(jì)這樣的核酶。核酶通過核酶的耙RNA結(jié)合部分來與靶RNA結(jié)合,從而發(fā)揮作用,核酶的靶RNA結(jié)合部分與該RNA上切割靶RNA的酶促部分非常接近。這樣,通過互補(bǔ)的堿基配對(duì),核酶識(shí)別和結(jié)合靶RNA,而且一旦結(jié)合于正確的位置,便以酶促活性作用來切割靶RNA10和使其失活。如果切割發(fā)生在編碼序列中,以這樣的方式切割靶RNA將會(huì)破壞其引導(dǎo)合成編碼的蛋白的能力。核酶結(jié)合和切割其RNA靶之后,它可以從結(jié)合的RNA上釋放出來并且重復(fù)切割新的靶。在一些情況下,核酶的酶促性質(zhì)會(huì)優(yōu)于其它的技術(shù),如反義技術(shù)(其中核酸分子僅結(jié)合于核酸靶來阻止其轉(zhuǎn)錄、翻譯或者與其它分子的聯(lián)系),因?yàn)閷?shí)現(xiàn)治15療效果所必要的核酶有效濃度可能低于反義寡聚核苷酸的濃度。這一潛在的優(yōu)點(diǎn)反映出核酶可以以酶促方式進(jìn)行作用的能力。因此,單個(gè)核酶分子可以切割靶RNA的多個(gè)分子。一方面,核酶是高度特異性的抑制物,其抑制作用的特異性不僅依賴于堿基配對(duì)的結(jié)合機(jī)制,也依賴于該分子抑制與其結(jié)合的RNA的表達(dá)的機(jī)制。艮P,所述抑制是由切割靶RNA引起的,因此特異性定義為靶RNA的切割率與非20靶RNA的切割率的比值。除了涉及堿基配對(duì)的那些因素,這種切割機(jī)制還依賴于另外的因素。這樣,核酶作用的特異性比結(jié)合于同樣的RNA位點(diǎn)的反義寡聚核苷酸強(qiáng)。本發(fā)明的核酶,例如,具有酶活的核酶RNA分子,可以形成錘頭狀基序、發(fā)夾基序,如肝炎S病毒基序、I類內(nèi)含子基序和/或與RNA引導(dǎo)序列(guide25sequence)相聯(lián)系的RNaseP樣RNA。錘頭狀基序的例子在如Rossi(1992)AidsResearchandHumanRetroviruses8:183中有說明;發(fā)夾基序在H咖pel(1989)Biochemistry28:4929和H咖pel(1990)Nuc.AcidsRes.18:299中有說明;肝炎S病毒基序在Perrotta(1992)Biochemistry31:16中有說明;RNaseP基序在Guetrier-Takada(1983)Cell35:849中有說明;I類內(nèi)含子在Cech美國專利4,987,07130中有說明。這些特定基序的引述并不是限制性的。本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到本發(fā)明的核酶,如,本發(fā)明的有酶活的RNA分子,可以有與一個(gè)或者多個(gè)靶基因的RNA區(qū)域互補(bǔ)的特異性底物結(jié)合位點(diǎn)。本發(fā)明的核酶可以在底物結(jié)合位點(diǎn)內(nèi)或者其周圍具有賦予了該分子RNA切割活性的核苷酸序列。35扁f拔f薦"在一個(gè)方面,本發(fā)明提供了被稱為"RNAi"分子的RNA抑制性分子,其含有本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶序列。RNAi分子可以包括雙鏈RNA(dsRNA)分子,例如siRNA和/或miRNA。RNAi分子,例如siRNA和/或miRNA,可抑制纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶基因的表達(dá)。在一個(gè)方面,RNAi5分子如siRNA禾口/或miRNA的長度大約為15、16、17、18、19、20、21、22、23、24、25或更多個(gè)核苷酸的雙鏈。本發(fā)明不限于任何特殊的作用機(jī)制,RNAi可進(jìn)入細(xì)胞中,弓I起相似或相同序列的單鏈RNA(ssRNA)的降解,包括內(nèi)源性mRNA。當(dāng)細(xì)胞暴露于雙鏈RNA(dsRNA)時(shí),來自同源基因的mRNA被稱為RNA干擾(RNAi)的過程選擇性地降解。RNAi的一個(gè)可能的基本機(jī)制是將與特定的基因10序列匹配的雙鏈RNA(dsRNA)打斷成為稱為短的干擾RNA的短的碎片,它可觸發(fā)與其序列匹配的mRNA的降解。在一個(gè)方面,本發(fā)明的RNAi可用于基因沉默(gene陽silencing)療法中,見,例如Shuey(2002)DrugDiscov.Today7:1040-1046。在一個(gè)方面,本發(fā)明提供了使用本發(fā)明的RNAi如siRNA和/或miRNA選擇性降解RNA的方法。該過程可在體外、離體或體內(nèi)實(shí)施。在一個(gè)方面,本發(fā)明的RNAi15分子可用來在細(xì)胞、器官或動(dòng)物中產(chǎn)生喪失功能的突變。制備和應(yīng)用可選擇性降解RNA的RNAi分子如siRNA和/或miRNA的方法在本領(lǐng)域中是為人所熟知的,見,例如美國專利6,506,559;6,5U,824;6,515,109;6,489,127。核酸的修飾——制備本發(fā)明的酶變體20本發(fā)明提供了產(chǎn)生本發(fā)明的核酸的變體的方法,所述本發(fā)明的核酸例如那些編碼纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸。這些方法可以被重復(fù)或者以多種組合使用,以產(chǎn)生具有與模板核酸編碼的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶有所改變的或不同的活性或有所改變的或不同的穩(wěn)定性的纖維素酶如內(nèi)切葡聚糖酶、25纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶。這些方法也可以被重復(fù)或以多種組合使用,從而例如在基因/信息表達(dá)、信息翻譯或信息穩(wěn)定性方面產(chǎn)生變化。另一方面,細(xì)胞的遺傳組成可以被改變,例如通過同源基因的離體修飾,隨后再將其插入到細(xì)胞中。例如,一方面,本發(fā)明提供了分離的或重組的核酸,其具有包含SEQID30NO:163的至少一個(gè)核苷酸堿基殘基修飾的序列,其中所述修飾包括下列改變的一個(gè)或多個(gè)位置265至267的任何一處的核苷酸被修飾為CGT、CGC、CGA、CGG、AGA或AGG;位置307至309的任何一處的核苷酸被修飾為GGT、GGC、GGA或GGG;位置328至330的任何一處的核苷酸被修飾為GGT、GGC、GGA或GGG;位置340至342的任何一處的核苷酸被修飾為TTA、TTG、CTT、CTC、CTA或35CTG;位置469至471的任何一處的核苷酸被修飾為TCT、TCC、TCA、TCG、AGT或AGC;位置1441至1443的任何一處的核苷酸被修飾為TTT或TTC;位置1648至1650的任何一處的核苷酸被修飾為AAT或AAC;或者,位置1768至1770的任何一處的核苷酸被修飾為CGT、CGC、CGA、CGG、AGA或AGG。另一方面,本發(fā)明提供了分離的或重組的多肽,其具有包含SEQIDNO:164的至少一個(gè)氨基酸殘基修飾的序列,其中所述修飾包括下列改變的一個(gè)或多個(gè)氨基酸5位置89的甲硫氨酸被修飾為精氨酸;氨基酸位置103的苯丙氨酸被修飾為甘氨酸;氨基酸位置110的脯氨酸被修飾為甘氨酸;氨基酸位置114的酪氨酸被修飾為亮氨酸;氨基酸位置157的丙氨酸被修飾為絲氨酸;氨基酸位置481的色氨酸被修飾為苯丙氨酸;氨基酸位置550的脯氨酸被修飾為天冬酰胺;或者,氨基酸位置590的甘氨酸被修飾為精氨酸。10另一方面,本發(fā)明提供了分離的或重組的核酸,其具有包含本發(fā)明的示例性序列(例如,SEQIDNO:l、SEQIDNO:3、SEQIDN0:5、SEQIDN0:7、SEQIDNO:9、SEQIDNO:U等等)的核苷酸殘基序列修飾的序列,其中所述修飾包括下列改變的一個(gè)或多個(gè)SEQIDNO:163的位置265至267的任何一處的相當(dāng)位置的核苷酸變?yōu)镃GT、CGC、CGA、CGG、AGA或AGG;SEQIDNO:163的位15置307至309的任何一處的相當(dāng)位置的核苷酸變?yōu)镚GT、GGC、GGA或GGG;SEQIDNO:163的位置328至330的任何一處的相當(dāng)位置的核苷酸變?yōu)镚GT、GGC、GGA或GGG;SEQIDNO:163的位置340至342的任何一處的相當(dāng)位置的核苷酸變?yōu)門TA、TTG、CTT、CTC、CTA或CTG;SEQIDNO:163的位置469至471的任何一處的相當(dāng)位置的核苷酸變?yōu)門CT、TCC、TCA、TCG、AGT或AGC;20SEQIDNO:163的位置1441至1443的相當(dāng)位置的核苷酸變?yōu)門TT或TTC;SEQIDNO:163的位置1648至1650的任何一處的相當(dāng)位置的核苷酸變?yōu)锳AT或AAC;或者,SEQIDNO:163的位置1768至1770的任何一處的相當(dāng)位置的核苷酸變?yōu)镃GT、CGC、CGA、CGG、AGA或AGG。另一方面,本發(fā)明提供了分離的或重組的核酸,其具有包含本發(fā)明的任何核酸的核苷酸殘基序列修飾的序列,其中所25述修飾包括下列改變的一個(gè)或多個(gè)SEQIDNO:163的位置265至267的任何一處的相當(dāng)位置的核苷酸變?yōu)镃GT、CGC、CGA、CGG、AGA或AGG;SEQIDNO:163的位置307至309的任何一處的相當(dāng)位置的核苷酸變?yōu)镚GT、GGC、GGA或GGG;SEQIDNO:163的位置328至330的任何一處的相當(dāng)位置的核苷酸變?yōu)镚GT、GGC、GGA或GGG;SEQIDNO:163的位置340至342的任何一處的相當(dāng)位置的30核苷酸變?yōu)門TA、TTG、CTT、CTC、CTA或CTG;SEQIDNO:163的位置469至471的任何一處的相當(dāng)位置的核苷酸變?yōu)門CT、TCC、TCA、TCG、AGT或AGC;SEQIDNO:163的位置1441至1443的相當(dāng)位置的核苷酸變?yōu)門TT或TTC;SEQIDNO:163的位置1648至1650的任何一處的相當(dāng)位置的核苷酸變?yōu)锳AT或AAC;或者,SEQIDNO:163的位置1768至1770的任何一處的相當(dāng)位置的核苷酸變?yōu)?5CGT、CGC、CGA、CGG、AGA或AGG。另一方面,本發(fā)明提供了分離的或重組的多肽,其具有包含本發(fā)明的示例性序列(例如,SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10等等)的氨基酸殘基修飾的序列,其中所述修飾包括下列改變的一個(gè)或多個(gè)SEQIDNO:164的氨基酸位置89的甲硫氨酸相當(dāng)?shù)陌被嶙優(yōu)榫彼?;SEQIDNO:164的氨基酸位置103的苯丙氨酸相當(dāng)?shù)陌被嶙優(yōu)楦拾彼酳EQID5NO:164的氨基酸位置110的脯氨酸相當(dāng)?shù)陌被嶙優(yōu)楦拾彼?;SEQIDNO:164的氨基酸位置114的酪氨酸相當(dāng)?shù)陌被嶙優(yōu)榱涟彼幔籗EQIDNO:164的氨基酸位置157的丙氨酸相當(dāng)?shù)陌被嶙優(yōu)榻z氨酸;SEQIDNO:164的氨基酸位置481的色氨酸相當(dāng)?shù)陌被嶙優(yōu)楸奖彼幔籗EQIDNO:164的氨基酸位置550的脯氨酸相當(dāng)?shù)陌被嶙優(yōu)樘於0?;或者,SEQIDNO:164的氨基酸位置590的甘氨酸相當(dāng)?shù)陌?0基酸變?yōu)榫彼?。另一方面,本發(fā)明提供了分離的或重組的多肽,其具有包含本發(fā)明的任何多肽的氨基酸殘基修飾的序列,其中所述修飾包括下列改變的一個(gè)或多個(gè)SEQIDNO:164的氨基酸位置89的甲硫氨酸相當(dāng)?shù)陌被嶙優(yōu)榫彼?;SEQIDNO:164的氨基酸位置103的苯丙氨酸相當(dāng)?shù)陌被嶙優(yōu)楦拾彼?SEQIDNO:164的氨基酸15位置110的脯氨酸相當(dāng)?shù)陌被嶙優(yōu)楦拾彼?;SEQIDNO:164的氨基酸位置114的酪氨酸相當(dāng)?shù)陌被嶙優(yōu)榱涟彼?SEQIDNO:164的氨基酸位置157的丙氨酸相當(dāng)?shù)陌被嶙優(yōu)榻z氨酸;SEQIDNO:164的氨基酸位置481的色氨酸相當(dāng)?shù)陌被嶙優(yōu)楸奖彼?SEQIDNO:164的氨基酸位置550的脯氨酸相當(dāng)?shù)陌被嶙優(yōu)樘於0?;或?SEQIDNO:164的氨基酸位置590的甘氨酸相當(dāng)?shù)陌被嶙優(yōu)榫彼帷?0本發(fā)明的核酸可以通過任何方法來改變。例如,隨機(jī)(random或stochastic)方法、或者非隨機(jī)、或者"定向進(jìn)化"的方法,參見如,美國專利6,361,974。基因的隨機(jī)突變方法在本領(lǐng)域是已知的,參見如,美國專利5,830,696。例如,可以應(yīng)用突變劑來對(duì)基因進(jìn)行隨機(jī)突變。突變劑包括,如,紫外線或者Y輻射,或者化學(xué)誘變劑,如,絲裂霉素,亞硝酸,光活化的補(bǔ)骨脂內(nèi)酯,它們單獨(dú)使用或者25組合使用來誘導(dǎo)DNA的斷裂,其可以通過重組被修復(fù)。另外的化學(xué)誘變劑包括,如,亞硫酸氫鈉、亞硝酸、羥胺、肼或者甲酸。其它的誘變劑是核苷酸前體的類似物,如,亞硝基胍、5-溴尿嘧啶、2-氨基嘌呤或者吖啶。這些試劑可以加入到PCR反應(yīng)中替換核苷酸前體,從而突變?cè)撔蛄?。也可以?yīng)用嵌入試劑如普羅黃素、吖啶黃、奎納克林和類似物。30可以應(yīng)用分子生物學(xué)上的任何技術(shù),如隨機(jī)PCR誘變,參見,如,Rice(1992)Proc.Natl.Acad.Sci.USA89:5467-5471;或者組合式多重盒式誘變,參見如,Crameri(1995)Biotechinques18:194-196??蛇x擇地,核酸,如基因,可以在隨機(jī)片段化后重新裝配,參見,如,美國專利6,291,242;6,287,862;6,287,861;5,955,358;5,830,721;5,824,514,5,811,238;5,605,793.。在可選擇的方面,修飾、35增加或者刪除可以通過易錯(cuò)PCR、改組、寡核苷酸誘導(dǎo)的定點(diǎn)突變、裝配PCR、有性PCR誘變、體內(nèi)誘變、盒式誘變、遞歸整體誘變、指數(shù)整體突變、位點(diǎn)專一性誘變、基因再裝配、基因位點(diǎn)飽和誘變(GSSM)、合成連接重裝配(SLR)、重組、遞歸序列重組(recursives叫uencerecombination)、硫代磷酸酯修飾的DNA誘變、含有尿嘧啶模板的誘變、缺口雙重誘變(gappedduplexmutagenesis),點(diǎn)錯(cuò)配修復(fù)誘變(pointmismatchrepairmutagenesis),修復(fù)缺陷型宿主株誘變、化學(xué)誘變、5放射誘變、缺失誘變、限制選擇誘變(restriction-selectionmutagenesis)、限制純化誘變(restriction-purificationmutagenesis)、人工基因合成、整體誘變、嵌合核酸多聚體生成、染色體飽和誘變(CSM)和/或者這些方法和其它方法的組合產(chǎn)生。以下的出版物描述了可以整入到本發(fā)明的方法中的各種遞歸重組程序和/或方法Stemmer(1999)"Molecularbreedingofvirusesfortargetingandotherclinical10properties"TumorTargeting4:1-4;Ness(1999)NatureBiotechnology17:893-896;Chang(1999)"EvolutionofacytokineusingDNAfamilyshuffling"NatureBiotechnology17:793-797;Minshull(1999)"Proteinevolutionbymolecularbreeding"CurrentOpinioninChemicalBiology3:284-290;Christians(1999)"DirectedevolutionofthymidinekinaseforAZTphosphorylationusingDNAfamilyshuffling"Nature15Biotechnology17:259-264;Crameri(1998)"DNAshufflingofafamilyofgenesfromdiversespeciesacceleratesdirectedevolution"Nature391:288-291;Crameri(1997)"MolecularevolutionofanarsenatedetoxificationpathwaybyDNAshuffling"NatureBiotechnology15:436-438;Zhang(1997)"Directed-evolutionofaneffectivefucosidasefromagalactosidasebyDNAshufflingandscreening"Proc.Natl.Acad.Sci.20USA94:4504-4509;Patten等(1997)"ApplicationsofDNAShufflingtoPharmaceuticalsandVaccines"CurrentOpinioninBiotechnology8:724-733;Crameri等(1996)"Constructionandevolutionofantibody-phagelibrariesbyDNAshuffling"NatureMedicine2:100-103;Gates等(1996)"Affinityselectiveisolationofligandsfrompeptidelibrariesthroughdisplayonalacrepressor'headpiecedimer'"Journalof25MolecularBiology255:373-386;Stemmer(1996)"SexualPCRandAssemblyPCR"In:TheEncyclopediaofMolecularBiology.VCHPublishers,NewYork.447-457頁;Crameri禾卩Stemmer(1995)"Combinatorialmultiplecassettemutagenesiscreatesallthepermutationsofmutantandwildtypecassettes"BioTechniques18:194-195;Stemmer等(1995)"Single-stepassemblyofageneandentireplasmidformlargenumbersof30oligodeoxyribonucleotides,,Gene,164:49-53;Stemmer(1995)"TheEvolutionofMolecularComputation"Science270:1510;Stemmer(1995)"SearchingSequenceSpace"Bio/Technology13:549-553;Stemmer(1994)"RapidevolutionofaproteininvitrobyDNAshuffling"Nature370:389-391;和Stemmer(1994)"DNAshufflingbyrandomfragmentationandreassembly:Invitrorecombinationformolecular35evolution"Proc.Natl.Acad.Sci.USA91:10747-10751。產(chǎn)生多樣性的突變方法包括,例如,定點(diǎn)誘變(Ling等.(1997)"ApproachestoDNAmutagenesis:anoverview"AnalBiochem.254(2):157-178;Dale等(1996)"Oligonucleotide-directedrandommutagenesisusingthephosphorothioatemethod"MethodsMol.Biol.57:369-374;Smith(1985)"Invitromutagenesis"Ann.Rev.Genet.19:423-462;Botstein&Shortle(1985)"Strategiesandapplicationsofinvitro5mutagenesis"Science229:1193-1201;Carter(1986)"Site-directedmutagenesis',Biochem.J.237:1-7;禾口Kunkel(1987)"Theefficiencyofoligonucleotidedirectedmutagenesis"在NucleicAcids&MolecularBiology(Eckstein,F.禾口Lilley,D.M.J.eds.,SpringerVerlag,Berlin));使用含有尿嘧啶的模板的誘變(KunkeK1985)"Rapidandefficientsite-specificmutagenesiswithoutphenotypicselection"Proc.Natl.Acad.10Sci.USA82:488-492;Kunkel等(1987)"Rapidandefficientsite-specificmutagenesiswithoutphenotypicselection"MethodsinEnzymol.154,367-382;和Bass等(1988)"MutantTiprepressorswithnewDNA-bindingspecificities"Science242:240-245);寡核苷酸誘導(dǎo)的定點(diǎn)誘變(MethodsinEnzymol.100:468-500(1983);MethodsinEnzymol.154:329-350(1987);Zoller(1982)"Oligonucleotide-directedmutagenesis15usingM13-derivedvectors:anefficientandgeneralprocedurefortheproductionofpointmutationsinanyDNAfragment"NucleicAcidsRes.10:6487-6500;Zoller&Smith(1983)"Oligonucleotide-directedmutagenesisofDNAfragmentsclonedintoM13vectors"MethodsinEnzymol.100:468-500和Zoller(1987)Oligonucleotide-directedmutagenesis:asimplemethodusingtwooUgonucleotide20primersandasingle-strandedDNAtemplate"MethodsinEnzymol.154:329-350);硫代磷酸酯修飾的DNA誘變(Taylor(1985)"Theuseofphosphorothioate-modifiedDNAinrestrictionenzymereactionstopreparenickedDNA"Nucl.AcidsRes.13:8749-8764;Taylor(1985)"Therapidgenerationofoligonucleotide-directedmutationsathighfrequencyusingphosphorothioate-modifiedDNA"Nucl.AcidsRes.2513:8765-8787(1985);Nakamaye(1986)"InhibitionofrestrictionendonucleaseNciIcleavagebyphosphorothioategroupsanditsapplicationtooligonucleotide-directedmutagenesis"Nucl.AcidsRes.14:9679-9698;Sayers(1988)"Y-TExonucleasesinphosphorothioate-basedoligonucleotide-directedmutagenesis,,Nucl.AsidsRes.16:791-802;和Sayers等(1988)"Strandspecificcleavageof30phosphorothioate-containingDNAbyreactionwithrestrictionendonucleasesinthepresenceofethidiumbromide"Nucl.AcidsRes.16:803-814);使用缺口雙鏈體DNA的誘變(Kramer等(1984)"ThegappedduplexDNAapproachtooligonucleotide-directedmutationconstruction"Nucl.AcidsRes.12:9441-9456;Kramer&Fritz(1987)MethodsinEnzymol."Oligonucleotide-directedconstructionof35mutationsviagappedduplexDNA"154:350-367;Kramer(1988)"ImprovedenzymaticinvitroreactionsinthegappedduplexDNAapproachtooligonucleotide-directedconstructionofmutations"Nucl.AcidsRes.16:7207;禾口Fritz(1988)"Oligonucleotide-directedconstructionofmutations:agappedduplexDNAprocedurewithoutenzymaticreactionsinvitro"Nucl.AcidsRes.16:6987-6999)。可以用于實(shí)踐本發(fā)明的另外的實(shí)驗(yàn)方案包括點(diǎn)錯(cuò)配修復(fù)(Kramer(1984)"PointMismatchRepair"Cell38:879-887),應(yīng)用修復(fù)缺陷型宿主株的誘變(Carter5等(1985)"Improvedoligonucleotidesite-directedmutagenesisusingMl3vectors"Nucl.AcidsRes.13:4431-4443禾口Carter(1987)"Improvedoligonucleotide-directedmutagenesisusingM13vectors"MethodsinEnzymol.154:382-403),缺失i秀變(Eghtedarzadeh(1986)"Useofoligonucleotidestogeneratelargedeletions"Nucl.AcidsRes.14:5115),限制-選擇和限制-純化(Wells等(1986)"Importanceof10hydrogen-bondformationinstabilizingthetransitionstateofsubtilisin"Phil.Trans.R.Soc.Lond.A317:415-423),通過全基因合成的誘變(Nambiar等(1984)"TotalsynthesisandcloningofagenecodingfortheribonucleaseSprotein"Science223:1299-1301;Sakamar禾卩Khorana(1988)"Totalsynthesisandexpressionofageneforthea-subunitofbovinerodoutersegmentguaninenucleotide-bindingprotein15(transducin)"Nucl.AcidsRes.14:6361-6372;Wells等(1985)"Cassettemutagenesis:anefficientmethodforgenerationofmultiplemutationsatdefinedsites"Gene34:315-323禾口Grundstrom等(1985)"Oligonucleotide-directedmutagenesisbymicroscale'shot-gun'genesynthesis"Nucl.AcidsRes.13:3305-3316),雙鏈斷裂修復(fù)(Mandecki(1986),Arnold(1993)"Proteinengineeringforunusualenvironments"20CurrentOpinioninBiotechnology4:450-455."Oligonucleotide-directeddouble-strandbreakrepairinplasmidsofEscherichiacoli:amethodforsite鄰eciflcmutagenesis"Proc.Natl.Acad.Sci.USA,83:7177-7181)。很多以上的方法的另外的細(xì)節(jié)在MethodsinEnzymology的154巻中有說明,其中也描述了用于解決各種誘變方法中所會(huì)遇到的問題的有用策略。25在例如下列的文件中描述了可以用于實(shí)踐本發(fā)明的實(shí)驗(yàn)方案,如Stemmer的美國專利5,605,793(1997.2.25),"MethodsforInVitroRecombination";Stemmer等的美國專利5,811,238(1998.9.22)"MethodsforGeneratingPolynucleotideshavingDesiredCharacteristicsbyIterativeSelectionandRecombination";Stemmer等的美國專利5,830,721(1998.11.3),"DNAMutagenesisbyRandomFragmentationand30Reassembly";Stemmer等的美國專利5,834,252(1998,11.10),"End-ComplementaryPolymeraseReaction";Minshull等的美國專利5,837,458(1998.11.17)"MethodsandCompositionsforCellularandMetabolicEngineering";WO95/22625,Stemmer禾口Crameri,"MutagenesisbyRandomFragmentationandReassembly,';WO96/33207,Stemmer禾卩Lipschutz,"EndComplementaryPolymeraseChainReaction";WO3597/20078,Stemmer禾口Crameri的"MethodsforGeneratingPolynucleotideshavingDesiredCharacteristicsbyIterativeSelectionandRecombination";WO97/35966,Minshull禾口Stemmer,"MethodsandCompositionsforCellularandMetabolicEngineerin";WO99/41402,Punnonen等,"TargetingofGeneticVaccineVectors";WO99/41383,Punnonen等,"AntigenLibraryImmunization";WO99/41369,Punnonen等,"GeneticVaccineVectorEngineering,,;WO99/41368,Punnonen等,5"OptimizationofImmunomodulatoryPropertiesofGeneticVaccines";EP752008,Stemmer禾BCrameri,"DNAMutagenesisbyRandomFragmentationandReassembly";EP0932670,Stemmer,"EvolvingCellularDNAUptakebyRecursiveSequenceRecombination";WO99/23107,Stemmer等,"ModificationofVirusTropismandHostRangebyViralGenomeShuffling";WO99/21979,Apt等,"Human10PapillomavirusVectors";WO98/31837,delCardayre等,"EvolutionofWholeCellsandOrganismsbyRecursiveSequenceRecombination";WO98/27230,Patten禾卩Stemmer,"MethodsandCompositionsforPolypeptideEngineering";WO98/27230,Stemmer等,"MethodsforOptimizationofGeneTherapybyRecursiveSequenceShufflingandSelection";WO00/00632,"MethodsforGeneratingHighlyDiverse15Libraries";WO00/09679,"MethodsforObtaininginVitroRecombinedPolynucleotideSequenceBanksandResultingSequences";WO98/42832,Arnold等,"PolynucleotideSequencesUsingRandomorDefinedPrimers";WO99/29902,Arnold等,"MethodforCreatingPolynucleotideandPolypeptideSequences";WO98/41653,Vind,"AninVitroMethodforConstructionofaDNALibrary";WO2098/41622,Borchert等,"MethodforConstructingaLibraryUsingDNAShuffling";以及WO98/42727,Pati和Zarling,"S叫uenceAlterationsusingHomologousRecombination"。非隨機(jī)或"定向進(jìn)化"方法包括,例如飽和誘變?nèi)缁蛭稽c(diǎn)飽和誘變(GSSM)、合成連接重裝配(SLR)或其組合,它們被用于修飾本發(fā)明的核酸,以產(chǎn)生具有新的或改變的特性(例如在高度酸性或堿性條件下的活性,在高溫或10低溫的活性,等等)的纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶。由修飾的核酸編碼的多肽可以在測試葡聚糖水解或其它活性之前被篩選活性??梢允褂萌魏涡问交?qū)嶒?yàn)方案,例如使用毛細(xì)管陣列平臺(tái)。例如參見美國專利6,361,974;6,280,926;5,939,250。15基微點(diǎn)靜赦或G淑本發(fā)明提供了使用基因位點(diǎn)飽和誘變或GSSM制備酶的方法,如在本文中以及美國專利6,171,820和6,579,258所述的。一方面,含有簡并N,N,G/T序列的密碼子引物被用于將點(diǎn)突變引入多核苷酸中,例如纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶或本發(fā)明的抗體,以便產(chǎn)生一組子代20多肽,其中在每一氨基酸位置上可表現(xiàn)出全范圍的單氨基酸取代,取代發(fā)生的位置例如酶活性位點(diǎn)中的氨基酸殘基,或?qū)⒁恍揎椀呐潴w結(jié)合位點(diǎn)。這些寡核苷酸可以包括相鄰的第一同源序列,簡并N,N,G/T序列,和任選地第二同源序列。由使用這些寡核苷酸而得到的下游子代翻譯產(chǎn)物包含沿著多肽的每一氨基酸位點(diǎn)上的所有可能的氨基酸變化,這是由于N,N,G/T序列的簡并性包括了所有20個(gè)氨25基酸的密碼子。一方面,一個(gè)這樣的簡并寡核苷酸(例如包括一個(gè)簡并N,N,G/T序列盒)被用于使親本多核苷酸模板中的每一原始密碼子進(jìn)行完全范圍的密碼子取代。另一方面,使用至少兩個(gè)簡并序列盒,或在相同的寡核苷酸中或不同的寡核苷酸中,用于使親本多核苷酸模板中的至少兩個(gè)原始密碼子進(jìn)行完全范圍的密碼子取代。例如,一個(gè)寡核苷酸中可以包含一個(gè)以上N,N,G/T序列,以便在多于30—個(gè)的位點(diǎn)上引入氨基酸突變。這些多個(gè)N,N,G/T序列可以直接相鄰,或由一個(gè)或多個(gè)額外的核苷酸序列分隔開。另一方面,用于引入插入和刪除的寡核苷酸可以單獨(dú)使用,或者與含有N,N,G/T序列的密碼子組合使用,以便引入氨基酸插入、刪除和/或取代的任何排列組合?!矫妫瑑蓚€(gè)或更多個(gè)連續(xù)氨基酸位置的同時(shí)誘變是使用含有相鄰35N,N,G/T三聯(lián)體的寡核苷酸進(jìn)行的,即簡并(N,N,G/T)序列。另一方面,使用與N,N,G/T序列相比具有較低簡并性的簡并序列盒。例如,在一些情況下,可能期望(例如,在寡核苷酸中)使用僅包括一個(gè)N的簡并三聯(lián)體序列,其中所述的N可以在三聯(lián)體的第一、第二或第三位置上。在該三聯(lián)體的剩余兩個(gè)位置上,可以使用包括任意排列組合的任何其它堿基??梢赃x擇地,在一些情況下可能期望使用(例如在寡聚體中)簡并N,N,N三聯(lián)體序列。5—方面,使用簡并三聯(lián)體(例如N,N,G/T三聯(lián)體)允許在多肽中的每一和每個(gè)氨基酸位置上系統(tǒng)且容易地產(chǎn)生完全范圍的可能的天然氨基酸(總共20種氨基酸)(在可以選擇的方面,這些方法也包括在每一氨基酸殘基或密碼子、位置產(chǎn)生低于所有可能種類的取代)。例如,對(duì)于100個(gè)氨基酸的多肽,可以產(chǎn)生2000個(gè)不同種類(即每個(gè)位置上的20種可能氨基酸X100個(gè)氨基酸位置)。通過使用含10有簡并N,N,G/T三聯(lián)體的寡核苷酸或一組寡核苷酸,32種不同序列可編碼所有20種可能的天然氨基酸。因此,在其中使用至少一種這樣的寡核苷酸對(duì)親本多核苷酸序列進(jìn)行飽和誘變的反應(yīng)容器中,產(chǎn)生了編碼20種不同多肽的32種不同的子代多核苷酸。相反,在定點(diǎn)誘變中使用非簡并寡核苷酸在每個(gè)反應(yīng)容器中僅僅導(dǎo)致一種子代多肽。非簡并寡核苷酸可以任選地與所公開的簡并引物組合使用;例15如,非簡并寡核苷酸可以被用于在工作多核苷酸中產(chǎn)生特異性點(diǎn)突變。這提供了產(chǎn)生特異性沉默點(diǎn)突變、導(dǎo)致相應(yīng)的氨基酸變化的點(diǎn)突變、以及導(dǎo)致產(chǎn)生終止密碼子和多肽片段的相應(yīng)表達(dá)的手段?!矫?,每一飽和誘變反應(yīng)容器含有編碼至少20種子代多肽(例如纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶)分子的20多核苷酸,以便所有的20種天然氨基酸都會(huì)出現(xiàn)在對(duì)應(yīng)于親本多核苷酸中被誘變的密碼子位置的特定氨基酸位置(其它方面使用了少于20個(gè)天然的組合)。從每一飽和誘變反應(yīng)容器產(chǎn)生的32倍簡并的子代多肽可以被克隆擴(kuò)增(例如使用表達(dá)載體克隆到合適的宿主中,例如大腸桿菌宿主中),并進(jìn)行表達(dá)篩選。當(dāng)單個(gè)子代多肽通過篩選鑒定,顯示出有利的特性變化時(shí)(當(dāng)與親本多肽相比時(shí),如在堿性25或酸性條件下增高的葡聚糖水解活性),可以對(duì)其測序以鑒定其中所含的相應(yīng)的有利氨基酸取代?!矫?,如本文所公開的,應(yīng)用飽和誘變對(duì)親本多肽的各個(gè)和所有的氨基酸位置進(jìn)行誘變后,可以在超過一個(gè)的氨基酸位置確定出的有利的氨基酸變化。可以產(chǎn)生一個(gè)或多個(gè)新的子代分子,其含有所有或部分這些有利的氨基酸取代的30組合。例如,如果在多肽的3個(gè)氨基酸位置的每一個(gè)氨基酸位置處鑒定出2個(gè)特異的有利的氨基酸變化,那么出現(xiàn)的排列就包括每一位置上的3種可能性(與原始氨基酸沒有變化的可能性,以及兩個(gè)有利變化中的每一個(gè)的可能性)和3個(gè)位置。因此,總共有3X3X3或27種可能性,其中包括了先前被檢驗(yàn)的7種可能性,即6個(gè)單點(diǎn)突變(即三個(gè)位置的每一個(gè)位置有2個(gè))和在任何位置上沒有變化的35點(diǎn)突變。另一方面,位點(diǎn)飽和誘變可以與改組、嵌合、重組和其它誘變方法以及篩選一起使用。本發(fā)明提供了以反復(fù)的方式使用任何誘變方法,包括飽和誘變。在一個(gè)實(shí)例中,任何誘變方法的反復(fù)使用結(jié)合篩選使用。本發(fā)明還提供了使用專有密碼子引物(含有簡并N,N,N序列)將點(diǎn)突變引入多核苷酸中,以便產(chǎn)生一組子代多肽,其中在每一氨基酸位置上可表現(xiàn)出全范5圍的單氨基酸取代(基因位點(diǎn)飽和誘變(GSSM))。這些寡聚體包括相鄰的第一同源序列,簡并N,N,N序列,以及一方面不必須包括第二同源序列。由使用這些寡聚體而得到的下游子代翻譯產(chǎn)物包含沿著多肽的每一氨基酸位點(diǎn)上的所有可能的氨基酸變化,這是由于N,N,N序列的簡并性包括了所有20個(gè)氨基酸的密碼子。—方面,一個(gè)這樣的簡并寡聚體(包括一個(gè)簡并N,N,N序列盒)被用于使10親本多核苷酸模板中的每一原始密碼子進(jìn)行完全范圍的密碼子取代。另一方面,使用至少兩個(gè)簡并N,N,N序列盒,或在相同的寡聚體中或不同的寡聚體中,用于使親本多核苷酸模板中的至少兩個(gè)原始密碼子進(jìn)行完全范圍的密碼子取代。因此,一個(gè)寡聚體中可以包含一個(gè)以上N,N,N序列,以便在多于一個(gè)的位點(diǎn)上引入氨基酸突變。這些多個(gè)N,N,N序列可以直接相鄰,或由一個(gè)或多個(gè)額外的核苷酸序列15分隔開。另一方面,用于引入插入和刪除的寡聚體可以單獨(dú)使用,或者與含有N,N,N序列的密碼子組合使用,以便引入氨基酸插入、刪除和/或取代的任何排列組合?!矫?,使用含有相鄰N,N,N三聯(lián)體的寡聚體,即簡并(N,N,N)n序列,進(jìn)行兩個(gè)或更多個(gè)連續(xù)氨基酸位置的同時(shí)誘變是可能的。另一方面,本發(fā)明提供了使用與N,N,N序列相比具有較低簡并性的簡并序列盒。例如,在一些情況下可20能期望使用(例如在寡聚體中)僅包括一個(gè)N的簡并三聯(lián)體序列,其中所述的N可以在三聯(lián)體的第一、第二或第三位置上。在三聯(lián)體的剩余兩個(gè)位置上,可以使用包括任意排列組合的任何其它堿基??梢赃x擇地,在一些情況下可能期望使用(例如在寡聚體中)簡并N,N,N三聯(lián)體序列、N,N,G/T或N,N,G/C三聯(lián)體序列?!矫?,由于若干個(gè)原因,使用簡并三聯(lián)體(例如N,N,G/T或N,N,G/C三25聯(lián)體序列)是有利的。一方面,本發(fā)明提供了在多肽中的每一和每個(gè)氨基酸位置上系統(tǒng)且相對(duì)容易地產(chǎn)生完全范圍的可能的天然氨基酸(總共20種氨基酸)的取代的方法。因此,對(duì)于100個(gè)氨基酸的多肽,本發(fā)明提供了系統(tǒng)且相對(duì)容易地產(chǎn)生產(chǎn)生2000個(gè)不同種類(即每個(gè)位置上的20種可能氨基酸X100個(gè)氨基酸位置)的方法??梢岳斫猓ㄟ^使用含有簡并N,N,G/T或N,N,G/C三聯(lián)體序列的寡聚體,3032種不同序列可編碼所有20種可能的天然氨基酸。因此,在其中使用至少一種這樣的寡聚體對(duì)親本多核苷酸序列進(jìn)行飽和誘變的反應(yīng)容器中,產(chǎn)生了編碼20種不同多肽的32種不同的子代多核苷酸。相反,在定點(diǎn)誘變中使用非簡并寡聚體在每個(gè)反應(yīng)容器中僅僅導(dǎo)致一種子代多肽。本發(fā)明還提供了非簡并寡聚體的使用,其可以任選地與所公開的簡并引物35組合使用。可以理解,在一些情況中,使用非簡并寡聚體在工作多核苷酸中產(chǎn)生特異性點(diǎn)突變是有利的。本發(fā)明提供了產(chǎn)生特異性沉默點(diǎn)突變、導(dǎo)致相應(yīng)的氨基酸變化的點(diǎn)突變、以及導(dǎo)致產(chǎn)生終止密碼子和多肽片段的相應(yīng)表達(dá)的手段。因此,在本發(fā)明的一方面,每一飽和誘變反應(yīng)容器含有編碼至少20種子代多肽分子的多核苷酸,以便所有的20種天然氨基酸都會(huì)出現(xiàn)在對(duì)應(yīng)于親本多核苷酸中被誘變的密碼子位置的特定氨基酸位置。從每一飽和誘變反應(yīng)容器產(chǎn)生的532倍簡并的子代多肽可以被克隆擴(kuò)增(例如使用表達(dá)載體克隆到合適的大腸桿菌宿主中),并進(jìn)行表達(dá)篩選。當(dāng)單個(gè)子代多肽通過篩選鑒定,顯示出有利的特性變化時(shí)(當(dāng)與親本多肽相比時(shí)),可以對(duì)其測序以鑒定其中所含的相應(yīng)的有利氨基酸取代。—方面,如本文所公開的,應(yīng)用飽和誘變對(duì)親本多肽的各個(gè)和所有的氨基10酸位置進(jìn)行誘變后,可以在超過一個(gè)的氨基酸位置確定出的有利的氨基酸變化。可以產(chǎn)生一個(gè)或多個(gè)新的子代分子,其含有所有或部分這些有利的氨基酸取代的組合。例如,如果在多肽的3個(gè)氨基酸位置的每一個(gè)氨基酸位置處鑒定出2個(gè)特異的有利的氨基酸變化,那么出現(xiàn)的排列就包括每一位置上的3種可能性(與原始氨基酸沒有變化的可能性,以及兩個(gè)有利變化中的每一個(gè)的可能性)和3個(gè)位15置。因此,總共有3X3X3或27種可能性,其中包括了先前被檢驗(yàn)的7種可能性,即6個(gè)單點(diǎn)突變(即三個(gè)位置的每一個(gè)位置有2個(gè))和在任何位置上沒有變化的點(diǎn)突變。除了沿著基因的全序列進(jìn)行誘變之外,本發(fā)明提供了誘變可用于取代多核苷酸序列中任意數(shù)量的堿基的每一個(gè),其中待被誘變的堿基的數(shù)量在一個(gè)方面為從15至100,000中的每一個(gè)整數(shù)。因此,并不是沿著分子誘變每一個(gè)位置,可以對(duì)每一個(gè)或獨(dú)立數(shù)目的堿基(在一個(gè)方面為總共15至100,000的亞組)進(jìn)行誘25變。一方面,單獨(dú)的核苷酸被用于沿著多核苷酸序列誘變每一個(gè)位置或一組位置。待被誘變的3個(gè)位置可以是密碼子。使用誘變引物可以引入突變,該誘變引物含有異源序列盒,也稱為誘變序列盒。示例性的序列盒可以具有1至500個(gè)堿基。在這樣的異源序列盒中每一個(gè)核苷酸位置可以是N、A、C、G、T、A/C、A/G、A/T、C/G、C/T、G/T、C/G/T、A/G/T、A/C/T、A/C/G或E,其中E是非A、C、30G或T的任何堿基(E可以被稱為設(shè)計(jì)寡聚體(designeroligo))?!矫妫柡驼T變包括誘變有待誘變的限定多核苷酸序列(其中待誘變的序列長度一方面為約15至100,000個(gè)堿基)中的一整組誘變序列盒(其中每一個(gè)序列盒的長度一方面為約1-500個(gè)堿基)。因此,一組突變(從1至100個(gè)突變)被引入每一個(gè)待誘變的序列盒。在應(yīng)用一輪飽和誘變的過程中,一組待被引入到35—個(gè)序列盒的突變可以與第二組待被引入到第二個(gè)序列盒的突變不同或相同。這樣的分組通過缺失、插入、特定密碼子的分組以及特定核苷酸序列盒的分組加以例示?!矫妫徽T變的限定序列包括全基因、通路、cDNA、整個(gè)開放閱讀框(ORF)以及整個(gè)啟動(dòng)子、增強(qiáng)子、阻抑物/反式激活蛋白、復(fù)制原點(diǎn)、內(nèi)含子、操縱子或任何多核苷酸功能組。通常,為了此目的,"限定序列(definedsequence)"5可以是15堿基多核苷酸序列的任何多核苷酸以及長度在15個(gè)堿基和15,000個(gè)堿基的多核苷酸序列(本發(fā)明特別指出中間的每一個(gè)整數(shù))。選擇密碼子分組時(shí)的考慮因素包括由簡并誘變序列盒編碼的氨基酸類型?!矫?,可被引入到誘變序列盒中的突變分組,本發(fā)明特別提供了在每一個(gè)位置編碼2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、1019和20種氨基酸的簡并密碼子取代(使用簡并寡聚體)以及由此編碼的多肽文庫。*成遂體微說"本發(fā)明提供了非隨機(jī)的基因修飾系統(tǒng),命名為"合成連接重裝配"或簡單地稱作"SLR",這是一種"定向進(jìn)化方法",可以產(chǎn)生具有新的或改變的特性的多15肽,例如本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶或本發(fā)明的抗體。SLR是將寡核苷酸片段非隨機(jī)地連接在一起的一種方法。該方法與隨機(jī)寡核苷酸改組不同的地方在于,核酸構(gòu)件(buildingblocks)沒有被隨意地改組、連接或嵌合,而是被非隨機(jī)地裝配。例如參見美國專利6,773,900;6,740,506;6,713,282;206,635,449;6,605,449;6,537,776。一方面,SLR包括下述步驟(a)提供模板多核苷酸,其中模板多核苷酸包含編碼同源基因的序列;(b)提供多個(gè)構(gòu)件多核苷酸,其中這些構(gòu)件多核苷酸被設(shè)計(jì)成可在預(yù)定的序列處與模板多核苷酸交換重裝配(cross-overreassemble),所述構(gòu)件多核苷酸包含作為同源基因變體的序列和與變體序列兩側(cè)的模板多核苷酸同源的序列;(c)將構(gòu)件多核苷酸與模板多核苷酸組25合在一起,以便構(gòu)件多核苷酸與模板多核苷酸交換重裝配,以產(chǎn)生包含同源基因序列變異體的多核苷酸。SLR不依賴于將被重新排列的多核苷酸之間存在高度同源性。因此,該方法可以被用于非隨機(jī)地產(chǎn)生包括超過101()<)個(gè)不同嵌合體的子代分子的文庫(或集合)。SLR可以被用于產(chǎn)生包括超過10^o個(gè)不同子代嵌合體的文庫。因此,本發(fā)30明的一些方面包括產(chǎn)生一組最終嵌合的核酸分子的非隨機(jī)方法,所述最終嵌合的核酸分子具有按設(shè)計(jì)所選擇的整個(gè)裝配次序。該方法包括按設(shè)計(jì)產(chǎn)生多個(gè)特異性核酸構(gòu)件的步驟,以及裝配這些核酸構(gòu)件的步驟,這樣可獲得依設(shè)計(jì)而定的整個(gè)裝配次序,所述的多個(gè)特異性核酸構(gòu)件具有可被應(yīng)用的互相相容的可連接末端。將被裝配的核酸構(gòu)件的互相相容的可連接末端被認(rèn)為對(duì)于這種類型的有35序裝配是"有用的",如果它們能使這些構(gòu)件以預(yù)定次序結(jié)合。因此,核酸構(gòu)件可以被偶聯(lián)的整個(gè)裝配次序是由可連接末端的設(shè)計(jì)來確定。如果使用多于一個(gè)的裝配步驟,那么核酸構(gòu)件可被偶聯(lián)的總裝配次序也由裝配步驟的連續(xù)次序來確定。一方面,用酶例如連接酶(例如T4DNA連接酶)處理退火的結(jié)構(gòu)片段,以實(shí)現(xiàn)結(jié)構(gòu)片段的共價(jià)結(jié)合?!矫妫押塑账針?gòu)件的設(shè)計(jì)通過分析一組祖先核酸序列模板來獲得,所5述祖先核酸模板作為產(chǎn)生最終嵌合的多核苷酸的子代集合的基礎(chǔ)。這些親本寡核苷酸模板因此作為序列信息的來源,它們?cè)趯⒈徽T變例如被嵌合或改組的核酸構(gòu)件的設(shè)計(jì)中有用。在該方法的一個(gè)方面,多個(gè)親本核酸模板的序列被聯(lián)配,以便選擇一個(gè)或多個(gè)分界點(diǎn)。這些分界點(diǎn)可以位于同源區(qū)域,由一個(gè)或多個(gè)核苷酸構(gòu)成。這些分界點(diǎn)優(yōu)選地由至少兩個(gè)祖先模板共享。從而這些分界點(diǎn)可以被用于描10繪將要產(chǎn)生的寡核苷酸構(gòu)件的邊界,以便重排列親本多核苷酸。在祖先分子中鑒定和選擇的分界點(diǎn)作為最終嵌合的子代分子的裝配中的潛在嵌合點(diǎn)。分界點(diǎn)可以是由至少兩個(gè)親本多核苷酸序列分享的同源區(qū)域(包括至少一個(gè)同源性核苷酸堿基)。可以選擇地,分界點(diǎn)可以是由至少一半的親本多核苷酸序列分享的同源區(qū)域,或者可以是由至少三分之二的親本多核苷酸序列分享的同源區(qū)域。甚至更優(yōu)選地,15有用的分界點(diǎn)是由至少四分之三的親本多核苷酸序列分享的同源區(qū)域,或者可以是由幾乎所有的親本多核苷酸序列分享的同源區(qū)域。一方面,分界點(diǎn)是由所有親本多核苷酸序列分享的同源區(qū)域。—方面,連接再裝配過程被徹底地進(jìn)行,以便產(chǎn)生含有盡量可能多的子代嵌合多核苷酸的文庫。換句話說,核酸構(gòu)件的所有可能的有序組合都呈現(xiàn)在最終20嵌合的核酸分子集合中。同時(shí),另一方面,在每一組合中的裝配次序(即各個(gè)最終嵌合核酸的5,到3序列中每一構(gòu)件的裝配次序)是如上所述地遵循預(yù)先的設(shè)計(jì)(或非隨機(jī)地)。由于本發(fā)明的非隨機(jī)特性,大大地降低了不需要的副產(chǎn)品的可能性。另一方面,連接再裝配方法被系統(tǒng)地進(jìn)行。例如,實(shí)施該方法,以便產(chǎn)生25子代分子的系統(tǒng)區(qū)分化的文庫,該文庫分成能被系統(tǒng)地篩選的數(shù)個(gè)部分,例如可以逐個(gè)地篩選。換句話說,通過選擇性的和審慎的應(yīng)用特定的核酸構(gòu)件,再加上選擇性的和審慎的應(yīng)用連續(xù)的分步驟的裝配反應(yīng),本發(fā)明使得這樣一種設(shè)計(jì)可以實(shí)現(xiàn),即可以在各個(gè)反應(yīng)容器中制備出各自特定的一系列子代產(chǎn)物。這樣的設(shè)計(jì)允許進(jìn)行系統(tǒng)的檢査和篩選步驟。因此,這些方法允許很可能非常大量的子代分30子以更小的組被系統(tǒng)地檢査。由于其具有以高度變通而又徹底和系統(tǒng)的方式進(jìn)行嵌合化反應(yīng)的能力,尤其是當(dāng)祖先分子之間具有低水平的同源性時(shí),這些方法可以產(chǎn)生包含大量子代分子的文庫(或集合)。由于本發(fā)明的連接再裝配的非隨機(jī)特性,所產(chǎn)生的子代分子一方面包含有最終嵌合核酸分子的文庫,這些核酸分子具有按設(shè)計(jì)而選擇的總裝配次序。飽和誘變和優(yōu)化的定向進(jìn)化方法也可以被用于產(chǎn)35生不同的子代分子種類。應(yīng)該意識(shí)到,本發(fā)明在分界點(diǎn)的選擇、核酸構(gòu)件的大小和數(shù)量以及偶聯(lián)的大小和設(shè)計(jì)方面提供了選擇的自由度和可控制性。進(jìn)一步,應(yīng)該意識(shí)到,就本發(fā)明的可操作性而言,對(duì)分子間同源性的要求大大地放寬了。事實(shí)上,甚至可以在有很少的分子間同源性或沒有分子間同源性的區(qū)域內(nèi)選擇分界點(diǎn)。例如,由于密碼子的擺動(dòng),即密碼子的簡并性,可以將核苷酸取代引入核酸構(gòu)件,同時(shí)又不會(huì)改變?cè)谙鄳?yīng)的祖先模板中最初編碼的氨基酸。可以選擇地,可5以改變密碼子,從而改變對(duì)原始氨基酸的編碼。在本發(fā)明中,這樣的取代可以被引入到核酸構(gòu)件中,以便增加分子間同源分界點(diǎn)的發(fā)生率,從而使得在構(gòu)件之間可獲得的偶聯(lián)的數(shù)量增加,而這又允許產(chǎn)生更多數(shù)量的子代嵌合分子。合成基茵棘配10—方面,本發(fā)明提供了非隨機(jī)的方法,命名為合成基因重裝配,其在一定程度上與隨機(jī)改組相關(guān),只是核酸構(gòu)件不隨機(jī)改組、連接或嵌合,而是被非隨機(jī)地裝配。例如參見美國專利6,537,776。合成基因重裝配法不依賴于將被改組的多核苷酸之間存在高度同源性。本發(fā)明可以被用于非隨機(jī)地產(chǎn)生包括超過101()()個(gè)不同嵌合體的子代分子的文庫(或15集合)??梢韵胂蟮兀铣苫蛑匮b配可以被用于產(chǎn)生包括超過101()()()個(gè)不同子代嵌合體的文庫。因此,一方面,本發(fā)明提供了產(chǎn)生一組最終嵌合的核酸分子的非隨機(jī)方法,所述最終嵌合的核酸分子具有按設(shè)計(jì)所選擇的整個(gè)裝配次序,該方法包括按設(shè)計(jì)產(chǎn)生多個(gè)特異性核酸構(gòu)件的步驟,以及裝配這些核酸構(gòu)件的步驟,這樣可獲得依20設(shè)計(jì)而定的整個(gè)裝配次序,所述的多個(gè)特異性核酸構(gòu)件具有可被應(yīng)用的互相相容的可連接末端。將被裝配的核酸構(gòu)件的互相相容的可連接末端被認(rèn)為對(duì)于這種類型的有序裝配是"有用的",如果它們能使這些構(gòu)件以預(yù)定次序結(jié)合。因此,一方面,核酸構(gòu)件可以被偶聯(lián)的整個(gè)裝配次序是由可連接末端的設(shè)計(jì)來確定,并且如果使用25多于一個(gè)的裝配步驟,那么核酸構(gòu)件可被偶聯(lián)的總裝配次序也由裝配步驟的連續(xù)次序來確定。在本發(fā)明的一方面,用酶例如連接酶(例如T4DNA連接酶)處理退火的結(jié)構(gòu)片段,以實(shí)現(xiàn)結(jié)構(gòu)片段的共價(jià)結(jié)合。另一方面,核酸構(gòu)件的設(shè)計(jì)通過分析一組祖先核酸模板的序列來獲得,所述祖先核酸模板作為產(chǎn)生最終嵌合的多核苷酸的子代集合的基礎(chǔ)。這些祖先核酸30模板因此作為序列信息的來源,它們?cè)趯⒈徽T變例如被嵌合或改組的核酸構(gòu)件的設(shè)計(jì)中有用。在一個(gè)示例中,本發(fā)明提供了相關(guān)基因的家族和它們編碼的相關(guān)產(chǎn)物的家族之間的嵌合。在具體的示例中,編碼的產(chǎn)物是酶。根據(jù)本文描述的方法,本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶可35以被誘變。因此,根據(jù)本發(fā)明的一個(gè)方面,多個(gè)祖先核酸模板序列(例如本發(fā)明的多核苷酸)被聯(lián)配,以便選擇一個(gè)或多個(gè)分界點(diǎn),這些分界點(diǎn)可以位于同源區(qū)域。這些分界點(diǎn)可以被用于描繪將要產(chǎn)生的寡核苷酸構(gòu)件的邊界。因此,在祖先分子中鑒定和選擇的分界點(diǎn)作為子代分子的裝配中的潛在嵌合點(diǎn)。—方面,有用的分界點(diǎn)是由至少兩個(gè)祖先模板分享的同源區(qū)域(包括至少5—個(gè)同源核苷酸堿基),但分界點(diǎn)可以是由至少一半的祖先模板、至少三分之二的祖先模板、至少四分之三的祖先模板以及一方面可以是由幾乎所有的祖先模板分享的同源區(qū)域。甚至仍在一方面,有用的分界點(diǎn)是由所有祖先模板分享的同源區(qū)域?!矫?,基因再裝配過程被徹底地進(jìn)行,以便產(chǎn)生含有盡量可能多的文庫。10換句話說,核酸構(gòu)件的所有可能的有序組合都呈現(xiàn)在最終嵌合的核酸分子集合中。同時(shí),另一方面,在每一組合中的裝配次序(即各個(gè)最終嵌合核酸的5'到3序列中每一構(gòu)件的裝配次序)是設(shè)計(jì)的(或非隨機(jī)地)。由于本發(fā)明的非隨機(jī)特性,大大地降低了不需要的副產(chǎn)品的可能性。另一方面,基因再裝配過程在所述方法中被系統(tǒng)地進(jìn)行,以便例如產(chǎn)生子15代分子的系統(tǒng)區(qū)分化的文庫,該文庫分成能被系統(tǒng)地篩選的數(shù)個(gè)部分,例如可以逐個(gè)地篩選。換句話說,通過選擇性的和審慎的應(yīng)用特定的核酸構(gòu)件,再加上選擇性的和審慎的應(yīng)用連續(xù)的分步驟的裝配反應(yīng),本發(fā)明使得這樣一種設(shè)計(jì)可以實(shí)現(xiàn),即可以在各個(gè)反應(yīng)容器中制備出各自特定的一系列子代產(chǎn)物。這樣的設(shè)計(jì)允許進(jìn)行系統(tǒng)的檢査和篩選步驟。因此,這些方法允許很可能非常大量的子代分子20以更小的組被系統(tǒng)地檢査。由于其具有以高度變通而又徹底和系統(tǒng)的方式進(jìn)行嵌合化反應(yīng)的能力,尤其是當(dāng)祖先分子之間具有低水平的同源性時(shí),本發(fā)明可以產(chǎn)生包含大量子代分子的文庫(或集合)。由于本發(fā)明的基因再裝配的非隨機(jī)特性,所產(chǎn)生的子代分子一方面包含有最終嵌合核酸分子的文庫,這些核酸分子具有按設(shè)計(jì)而選擇的總裝配25次序。在特別的方面,這樣的所產(chǎn)生的文庫包括大于103至101()00種不同的子代分子種類。—方面,如所述產(chǎn)生的一組最終嵌合的核酸分子包括編碼多肽的多核苷酸。根據(jù)一方面,該多核苷酸是基因,其可以是人造基因。根據(jù)另一方面,該多核苷酸可以是基因通路,其可以是人造基因通路。本發(fā)明產(chǎn)生的一種或更多種人30造基因在本發(fā)明中可以摻入人造基因途徑,例如在真核生物體(包括植物)中可操縱的途徑。在另一個(gè)示例中,產(chǎn)生構(gòu)件的步驟的合成屬性允許設(shè)計(jì)和引入核苷酸(例如一個(gè)或多個(gè)核苷酸,例如可以是密碼子或內(nèi)含子或調(diào)控序列),這些核苷酸隨后可以在體外過程中(例如通過誘變)或者在體內(nèi)過程中(例如通過利用宿主生物35體的基因剪接能力)被任選地去除。應(yīng)該意識(shí)到,在許多情況下,除了產(chǎn)生有用的分界點(diǎn)的好處之外,還有許多其它原因也使得可能期望引入這些核苷酸。因此,根據(jù)另一方面,核酸構(gòu)件在本發(fā)明中被用于引入內(nèi)含子。這樣,功能性內(nèi)含子在本發(fā)明中被引入到本發(fā)明的人造基因中。功能性內(nèi)含子在本發(fā)明中還可以被引入本發(fā)明的人造基因通路中。因此,本發(fā)明提供了嵌合多核苷酸的產(chǎn)生,該嵌合多核苷酸是含有一個(gè)(或多個(gè))人工引入的內(nèi)含子的人造基因。5本發(fā)明還提供了嵌合多核苷酸的產(chǎn)生,該嵌合多核苷酸是含有一個(gè)(或多個(gè))人工引入的內(nèi)含子的人造基因通路。一方面,人工引入的內(nèi)含子在一種或多種宿主細(xì)胞的基因剪接中發(fā)揮作用,其發(fā)揮作用的方式與天然發(fā)生的內(nèi)含子在基因剪接中發(fā)揮作用的方式在很大程度上是相同的。本發(fā)明提供了產(chǎn)生含人造內(nèi)含子的多核苷酸的方法,該多核苷酸將被引入宿主生物體中,用于重組和/或剪接。10使用本發(fā)明產(chǎn)生的人造基因也可作為底物發(fā)揮作用,用于與另一核酸重組。同樣,使用本發(fā)明產(chǎn)生的人造基因途徑也可作為底物發(fā)揮作用,用于與另一核酸重組。一方面,重組由人造的含內(nèi)含子基因和作為重組伙伴的核酸之間的同源區(qū)域促進(jìn),或發(fā)生在人造的含內(nèi)含子基因和作為重組伙伴的核酸之間的同源區(qū)域。一方面,重組伙伴也可以是本發(fā)明產(chǎn)生的核酸,包括人造基因或人造基因途15徑。重組可以由人造基中一個(gè)(或多個(gè))人工引入的內(nèi)含子上存在的同源區(qū)域促進(jìn),或發(fā)生在由人造基中一個(gè)(或多個(gè))人工引入的內(nèi)含子上存在的同源區(qū)域?!矫妫景l(fā)明的合成基因再裝配方法使用多種核酸構(gòu)件,其每一種一方面具有兩個(gè)可連接末端。在每一個(gè)核酸構(gòu)件上的兩個(gè)可連接末端可以是兩個(gè)平端(即,每一個(gè)末端具有零個(gè)核苷酸的突出),或者一方面可以是一個(gè)平端和一個(gè)突20出端,或者一方面可以是兩個(gè)突出端。一方面,用于該目的的一個(gè)有用的突出端可以是3'突出端或5'突出端。因此,核酸構(gòu)件可以具有一個(gè)3'突出端或可選地具有一個(gè)5'突出端或可選地具有兩個(gè)3'突出端或可選地具有兩個(gè)5'突出端。核酸構(gòu)件被裝配來形成最終嵌合的核酸分子的整個(gè)裝配次序通過有目的試驗(yàn)設(shè)計(jì)確定并且是非隨機(jī)的。25因此,可以確定概率密度函數(shù)(PDF),預(yù)測在一個(gè)連接反應(yīng)的每一步中可能發(fā)生的遺傳交換事件的總數(shù),其中給定了一套具有確定數(shù)目的親本變異體、對(duì)20應(yīng)于每種變體的寡核苷酸、以及在連接反應(yīng)的每個(gè)步驟中的每種變異體的濃度。在確定PDF中應(yīng)用到的統(tǒng)計(jì)學(xué)和數(shù)學(xué)在下面被描述。通過應(yīng)用這些方法,可以計(jì)算這樣的概率密度函數(shù),而且這樣就富集了來源于特定連接反應(yīng)的具有預(yù)定數(shù)目的遺傳交換事件的嵌合子代群體。此外,可以預(yù)先確定遺傳交換事件的目標(biāo)數(shù)目,然后對(duì)該系統(tǒng)進(jìn)行程序化,以計(jì)算在該連接反應(yīng)的每一個(gè)步驟中,每種親本寡聚25核苷酸的起始量,從而得到以遺傳交換事件的預(yù)先確定的數(shù)目為中心的概率密度函數(shù)。這些方法涉及還原性重配、重組和選擇的重復(fù)循環(huán)應(yīng)用,通過重組實(shí)現(xiàn)編碼多肽的核酸的定向分子進(jìn)化。該系統(tǒng)允許產(chǎn)生大量的進(jìn)化出的嵌合序列,其中產(chǎn)生的群體顯著地富集了具有預(yù)定數(shù)目遺傳交換事件的序列。遺傳交換事件是在嵌合序列中的一個(gè)點(diǎn),在這里,從一個(gè)親本變異體到另一個(gè)親本變異體的序列轉(zhuǎn)30換發(fā)生。這樣的點(diǎn)一般是在兩個(gè)親本的寡聚核苷酸連接在一起形成單個(gè)序列的連接處。這一方法允許計(jì)算寡聚核苷酸序列的正確濃度,這樣,序列的最終嵌合群體富集了選定數(shù)目的遺傳交換事件。這也提供了對(duì)選擇具有預(yù)定數(shù)目的遺傳交換事件的嵌合突變體的更多控制。此外,這些方法與其他系統(tǒng)相比,提供了一種用于探究大數(shù)量的可能蛋白35變異體的方便手段。通過應(yīng)用在這里描述的方法,嵌合分子的群體可以富集那些含有特定數(shù)目的遺傳交換事件的變異體。因此,盡管在反應(yīng)中可以仍然產(chǎn)生1013個(gè)嵌合分子,但是所選擇的用于進(jìn)一歩分析的每一個(gè)分子很可能具有,例如,僅僅三個(gè)遺傳學(xué)交換事件。因?yàn)榈玫降淖哟后w可以傾向于具有預(yù)定數(shù)目的遺傳交換事件,所以造成嵌合分子之間的功能多樣性的界線減少。當(dāng)計(jì)算出在最初的親本多聚核苷酸中的哪一個(gè)可能影響到特定的性質(zhì)時(shí),便提供了更加可控制的變量。5—方面,該方法通過產(chǎn)生對(duì)應(yīng)于每一個(gè)親本序列的片段或者部分的寡聚核苷酸,產(chǎn)生嵌合子代多核苷酸序列。每一個(gè)寡核苷酸優(yōu)選地包括重疊的獨(dú)特區(qū)域,這樣把所述寡聚核苷酸混合,得到具有以正確順序裝配的寡核苷酸片段的新的變異體。也可參見美國專利6,773,900;6,740,506;6,713,282;6,635,449;6,605,449;6,537,776;6,361,974。10線定爻換事伴本發(fā)明的任何過程可以被迭代重復(fù),例如,可以鑒定出編碼本發(fā)明的改變的或者新的纖維素酶表型如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶的核酸,再分離,再修飾,再測試活性。這一過程可以重復(fù)直到工程化得到所需的表型。例如,完整的生物化學(xué)合成代謝或分解代謝途徑可以被工程化到細(xì)胞中,例如包括纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/25或P-葡糖苷酶活性的細(xì)胞。類似地,如果確定了某特定寡核苷酸對(duì)于所期望的特性(例如新的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶表型)不會(huì)造成任何影響,則可以合成包括這段待除去的序列在內(nèi)的更大的親本寡核苷酸,從而將這段序列從變量中除去。由于將這段序列合并到更大的序列中,可以避免任30何遺傳交換事件,所以在子代多核苷酸中,這一序列不再有任何變異。確定哪些寡核苷酸與所需的性質(zhì)最有關(guān)系,以及哪些與所需的性質(zhì)無關(guān)的重復(fù)實(shí)踐可以更有效地探尋所有可能的具有特定性質(zhì)或者活性的蛋白變異體。沐力微35在各個(gè)方面,分子的體內(nèi)改組在本發(fā)明的方法中使用,提供本發(fā)明的多肽的變體,例如本發(fā)明的抗體、本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶以及類似物。體內(nèi)改組可以利用細(xì)胞重組多聚體的天然特性進(jìn)行。盡管體內(nèi)重組是提供分子多樣性的主要天然途徑,但遺傳重組仍然是一種相對(duì)復(fù)雜的過程,該過程涉及1)同源性識(shí)別;2)鏈切割,鏈侵入,和導(dǎo)致產(chǎn)生重組交叉(recombinationchiasma)的代謝歩驟;和最后3)交叉消除,5得到分離的重組分子。交叉的形成需要同源序列的識(shí)別。另一方面,本發(fā)明包括一種方法,用于由至少第一多核苷酸和第二多核苷酸獲得雜合多核苷酸。本發(fā)明也用于產(chǎn)生雜合多核苷酸,通過將共享至少一個(gè)部分序列同源的區(qū)域的至少第一多核苷酸和第二多核苷酸(例如,一個(gè)或兩者都是示例性的纖維素酶,例如本發(fā)明的內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶10和/或(3-葡糖苷酶)引入到合適的宿主細(xì)胞中實(shí)現(xiàn)。部分序列同源的區(qū)域促進(jìn)了導(dǎo)致產(chǎn)生雜合多核苷酸的序列再組織過程。正如此處所用,術(shù)語"雜合多核苷酸"是從本發(fā)明的方法產(chǎn)生的任何核苷酸序列,其含有來自至少兩個(gè)原始多核苷酸序列的序列。這樣的雜合多核苷酸可以來自可促進(jìn)DNA分子間序列整合的分子間重組事件。此外,這樣的雜合多核苷酸可以來自于分子內(nèi)還原重配過程,該過程利15用重復(fù)序列來改變DNA分子內(nèi)的核苷酸序列?!矫?,體內(nèi)重裝配集中在"分子間,,的過程上,統(tǒng)稱為"重組";在細(xì)菌中,它一般被視為是"RecA-依軟'的現(xiàn)象。本發(fā)明可以依賴于宿主細(xì)胞的重組過程來重組和重裝配序列,或者依賴于細(xì)胞介導(dǎo)還原過程的能力,通過缺失來減少細(xì)胞中的準(zhǔn)-重復(fù)序列的復(fù)雜性。該"還原性重配"過程通過"分子內(nèi)的"、RecA-依賴過程20而發(fā)生。在本發(fā)明的另一方面,通過還原性重裝配過程,產(chǎn)生新型的多核苷酸。該方法包括產(chǎn)生含有連續(xù)序列(起始的編碼序列)的構(gòu)建物,它們插入到合適的載體中,并且然后將它們引入到合適的宿主細(xì)胞。單個(gè)分子同一性的重裝配通過在構(gòu)建物中具有同源性區(qū)域的連續(xù)序列間的組合過程,或者準(zhǔn)-重復(fù)單位間的組合過25程而發(fā)生。重裝配過程重組和/或降低重復(fù)序列的復(fù)雜性和程度,并且導(dǎo)致產(chǎn)生新型的分子種類??梢詰?yīng)用各種處理來提高重裝配效率。這些處理包括用紫外光,或者損壞DNA的化學(xué)試劑處理,和/或使用表現(xiàn)增高水平的"遺傳不穩(wěn)定性"的宿主細(xì)胞系。因此,這樣的重裝配過程可以涉及同源重組或者準(zhǔn)-重復(fù)序列指導(dǎo)它們自身進(jìn)化的天然特性。30重復(fù)或者"準(zhǔn)重復(fù)(quasi-repeated)"序列在遺傳不穩(wěn)定性中起作用。一方面,"準(zhǔn)重復(fù)"是并不限于它們起初的單元結(jié)構(gòu)的重復(fù)。準(zhǔn)重復(fù)單元可以在構(gòu)建物中以序列的排列出現(xiàn);以相似序列的連續(xù)單元出現(xiàn)。一旦連接,在連續(xù)序列之間的連接處變得基本上無形,并且得到的構(gòu)建物的準(zhǔn)重復(fù)性質(zhì)在分子水平現(xiàn)在是連續(xù)的。細(xì)胞在準(zhǔn)重復(fù)序列之間進(jìn)行的缺失過程降低了得到的構(gòu)建物的復(fù)雜性。準(zhǔn)重35復(fù)單位提供了一個(gè)實(shí)際上沒有限制的模板內(nèi)容,在模板上可以發(fā)生滑移事件。一方面,含有準(zhǔn)重復(fù)的構(gòu)建物有效地提供了足夠的分子彈性,缺失(和潛在的插入)事件實(shí)際上可以在準(zhǔn)重復(fù)單元內(nèi)的任何地方發(fā)生。當(dāng)準(zhǔn)重復(fù)序列全部以相同方向連接,例如,頭對(duì)尾或者反之亦然,細(xì)胞就不能區(qū)別各個(gè)單元。因此,還原過程可以在整個(gè)序列中發(fā)生。相反地,例如,當(dāng)所述單元以頭對(duì)頭存在,而不是頭對(duì)尾,相鄰單元的頭尾倒置,這樣缺失的形成5將有利于不連續(xù)單元的失去。因此,優(yōu)選地,待重裝配序列是處于相同的方向。準(zhǔn)重復(fù)序列的隨機(jī)定向?qū)?huì)導(dǎo)致重裝配效率的損失,而序列的一致定向?qū)?huì)為序列的定向提供最高的效率。然而,雖然具有較少的相同方向的連續(xù)序列會(huì)降低效率,但是仍然可以為新型分子的有效回收提供足夠的彈性。用定向相同以允許更高效率的準(zhǔn)重復(fù)序列制備構(gòu)建物。10應(yīng)用各種方法中的任何一種,可以將序列裝配成頭對(duì)尾的定向,包括以下方法a)可以使用包括poly-A頭和poly-T尾的引物,當(dāng)制成單鏈時(shí),包括poly-A頭和poly-T尾的引物將提供定向。這通過具有由RNA制備引物的頭幾個(gè)堿基來完成,而且隨后用RNaseH可以很容易去除RNA。15b)可以應(yīng)用包括獨(dú)特的限制酶切割位點(diǎn)的引物。這需要多個(gè)位點(diǎn)、一組獨(dú)特的序列、和重復(fù)的合成和連接步驟。c)引物的內(nèi)部幾個(gè)堿基可以被硫醇化,并且用外切酶來產(chǎn)生合適的具有尾巴的分子?!矫?,重裝配序列的回收依賴于具有下降的重復(fù)指數(shù)(RI)的克隆載體20的確定。被重裝配的編碼序列可以隨后通過擴(kuò)增回收。產(chǎn)物被再克隆和表達(dá)。具有降低的RI的克隆載體的回收可以這樣被完成,艮口1)應(yīng)用僅僅當(dāng)構(gòu)建物的復(fù)雜性下降時(shí)才能穩(wěn)定地維持的載體。2)通過物理程序?qū)s短的載體進(jìn)行物理回收。在這一情況下,克隆載體將應(yīng)用標(biāo)準(zhǔn)的質(zhì)粒分離程序進(jìn)行回收,或者在具有低分子量截留的瓊脂糖凝膠或25者柱子上利用標(biāo)準(zhǔn)程序進(jìn)行大小分離。3)插入物的大小下降時(shí),對(duì)含有可以選擇的斷裂基因的載體進(jìn)行回收。4)應(yīng)用表達(dá)載體以及適當(dāng)?shù)倪x擇,使用定向選擇技術(shù)。相關(guān)的生物體的編碼序列(例如,基因)可以表現(xiàn)出高度的同源性,并且編碼相當(dāng)多樣化的蛋白產(chǎn)物。這些類型的序列特別可作為準(zhǔn)重復(fù)序列用在本發(fā)明30中。然而,盡管下面所描述的例子證明了幾乎相同的起始編碼序列(準(zhǔn)-重復(fù))的再裝配,這一過程并不限于這種幾乎相同的重復(fù)。下面的例子展示了本發(fā)明的示例性方法。描述了來自三個(gè)(3)獨(dú)特種的編碼性核酸序列(準(zhǔn)-重復(fù))。每一序列編碼具有一套不同特征的蛋白質(zhì)。每一個(gè)序列在序列的唯一位置只有一個(gè)或者幾個(gè)堿基對(duì)的不同。準(zhǔn)-重復(fù)序列分別地或者共35同被擴(kuò)增并且被連接到隨機(jī)的裝配體中,以便所有可能的排列和組合可以在連接的分子群體中獲得。準(zhǔn)-重復(fù)單位的數(shù)目可以通過裝配條件來控制。在構(gòu)建物中,準(zhǔn)-重復(fù)單位的平均數(shù)目通過重復(fù)指數(shù)(RI)來定義?!┬纬?,構(gòu)建物可以,或不必按照出版的方法通過瓊脂糖凝膠來按大小分離,插入到克隆載體,并且轉(zhuǎn)染到合適的宿主細(xì)胞中。然后細(xì)胞進(jìn)行繁殖,并且進(jìn)行"還原性重裝配"。如果需要,還原性重裝配過程的速率可以通過引入DNA5損傷來刺激。RI的降低是通過一種"分子內(nèi)"的機(jī)制在重復(fù)序列間形成缺失來介導(dǎo),還是通過"分子間"的機(jī)制由類似重組的事件來介導(dǎo)是不重要的。最終的結(jié)果是分子被重裝配,得到所有可能的組合。任選地,本方法包括一個(gè)額外的步驟,即對(duì)改組的文庫成員進(jìn)行篩選,以確定個(gè)別的改組文庫成員,其具有與一種預(yù)定的大分子如蛋白質(zhì)受體、寡糖、病10毒顆?;蛘咂渌念A(yù)定的化合物或者結(jié)構(gòu)結(jié)合或者不同方式地相互作用,或者催化特定的反應(yīng)(如,酶的催化結(jié)構(gòu)域)的能力。從這樣的文庫所鑒定得到的多肽可以用于治療、診斷、研究和相關(guān)目的(例如,催化劑,用于增加水溶液的滲透性的溶質(zhì)等等)和/或可以進(jìn)行改組和/或選擇的一個(gè)或者多個(gè)另外的循環(huán)。15在另一方面,可以預(yù)見,在重組或重裝配之前,或者在重組或重裝配的過程中,通過本發(fā)明的方法產(chǎn)生的多核苷酸可以用試劑處理或進(jìn)行加工,這些處理或加工促進(jìn)突變引入到原始的多核苷酸中。引入這樣的突變將會(huì)增加得到的雜合多核苷酸及由其編碼的多肽的多樣性。促進(jìn)誘變的試劑和過程可以包括,但不限于(+)-CC-1065,或者合成的類似物如(+)-CC-1065-(N3-腺嘌呤)(參見Sun和20Hurley,(1992);能夠抑制DNA合成的N-乙酰化或者脫乙?;?'-氟-4-氨基聯(lián)苯加合物(見,例如,vandePoll等(1992)),或者能夠抑制DNA合成的N-乙?;蛘呙撘阴;?-氨基聯(lián)苯加合物(也見,vandePoll等(1992),751-758頁);三價(jià)鉻、三價(jià)鉻的鹽、可以抑制DNA復(fù)制的多環(huán)芳香烴(PAH)DNA加合物,如7-溴甲基-苯[a]蒽("BMA")、三(2,3-二溴丙基)磷酸鹽("Tris-BP")、1,2-二溴-3-25氯丙烷("DBCP")、2-溴丙烯醛(2BA)、苯并[a]芘-7,8-二氫二醇-9-10-環(huán)氧化物("BPDE")、鈾(II)卣素鹽、N-羥基-2-氨基-3-甲基咪唑[4,5-q-喹啉("N-羥基-IQ")、和N-羥基-2-氨基-l-甲基-6-苯基咪唑[4,5-f]-吡啶("N-羥基-PhIP")。用于減慢或者停止PCR擴(kuò)增的示例性方法由紫外線(+)-CC-1065和(+)-CC-1065-(N3-腺嘌呤)組成。特別包含的方法是DNA加合物或者來自多核苷酸或者多核苷酸庫的含有DNA30加合物的多核苷酸,在進(jìn)一步的處理前,其可以通過包括加熱含有所述多核苷酸的溶液的過程進(jìn)行釋放或者去除。另一方面,本發(fā)明涉及產(chǎn)生具有生物活性的重組蛋白,其通過在根據(jù)本發(fā)明產(chǎn)生雜合或再裝配多核苷酸的條件下處理含有編碼野生型蛋白的雙鏈模板多核苷酸的樣品。35產(chǎn)生,艦辦本發(fā)明也提供了用于產(chǎn)生本發(fā)明核酸(例如纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶)序列的序列變異體的其它方法。本發(fā)明也提供了使用本發(fā)明的核酸和多肽分離纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的其它方法。一方面,本發(fā)明提供了本發(fā)明5的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶編碼序列(例如基因、cDNA或信息)的變異體,這些變異體可以通過任何方法來產(chǎn)生,如上所描述,例如包括隨意或隨機(jī)方法、或非隨機(jī)或"定向進(jìn)化"方法。被分離的變異體可以是天然發(fā)生的。變異體也可以在體外產(chǎn)生。變異體也可以應(yīng)用基因工程技術(shù)來產(chǎn)生,如定點(diǎn)誘變、隨機(jī)的化學(xué)誘變、核酸外切酶III缺10失方法和標(biāo)準(zhǔn)的克隆技術(shù)。可選擇地,可以應(yīng)用化學(xué)合成或者修飾方法來產(chǎn)生這樣的變異體、片段、類似物或者衍生物。本領(lǐng)域技術(shù)人員也熟悉制備變異體的其它方法。這些方法包括這樣的程序,其中,從天然分離物中獲得的核酸序列經(jīng)過修飾而產(chǎn)生編碼具有某些特征的多肽的核酸,所述的特征使這些多肽在工業(yè)或者實(shí)驗(yàn)室應(yīng)用中具有更高的價(jià)值。在這樣的程序中,大量的變異體序列被獲得和表15征,這些變異體序列與從天然分離物中得到的序列相比,有一個(gè)或者多個(gè)核苷酸的差異。這些核苷酸的差異可能引起相對(duì)于天然分離得到的核酸序列編碼的多肽的氨基酸變化。例如,變異體可以通過易錯(cuò)PCR產(chǎn)生。在易錯(cuò)PCR的一個(gè)方面中,PCR在DNA聚合酶的復(fù)制保真性較低的情況下進(jìn)行,這樣便在全長的PCR產(chǎn)物中得20到較高的點(diǎn)突變率。易錯(cuò)PCR在例如,Leung,D.W.,等,Technique,1:11~15,1989和Caldwell,R.C.和JoyceG.R,PCRMethodsApplic.,2:28-33,1992中描述。簡要地說,在這樣的程序中,待誘變的核酸與PCR引物、反應(yīng)緩沖液、MgCl2、MnCl2、Taq聚合酶以及適當(dāng)濃度的dNTP混合,在全長的PCR產(chǎn)物中得到高的點(diǎn)突變率。例如,反應(yīng)可以使用20fino1待誘變的核酸進(jìn)行,每種PCR引物30pmol,反應(yīng)緩25沖液包括50mMKCl、lOmMTrisHCl(pH8.3)和0.01%明膠、7mM的MgCl2、0.5mMMnCl2、5units的Taq聚合酶、0.2mMdGTP、0.2mMdATP、ImMdCTP和lmMdTTP。PCR可以進(jìn)行30個(gè)循環(huán),每個(gè)循環(huán)為94°C1分鐘;45'C1分鐘;和72°C1分鐘。然而,應(yīng)該意識(shí)到,這些參數(shù)可以適當(dāng)?shù)刈兓UT變的核酸克隆到一個(gè)適當(dāng)?shù)妮d體,并評(píng)價(jià)由誘變核酸編碼的多肽的活性。30—方面,變異體也可以用寡核苷酸誘導(dǎo)的定向突變產(chǎn)生,在任何感興趣的克隆DNA中產(chǎn)生位點(diǎn)特異性的突變。寡核苷酸誘變?cè)冢?,Reidhaar-01son(1988)Science241:53-57中描述。簡要地說,在這樣的程序中,合成多個(gè)具有將要被導(dǎo)入被克隆的DNA中的一個(gè)或多個(gè)突變的雙鏈寡聚核苷酸,將這些寡聚核苷酸插入到待誘變的克隆DNA中。一方面,回收含有誘變DNA的克隆,表達(dá),并評(píng)估它們35編碼的多肽的活性。另一種產(chǎn)生變異體的方法是裝配PCR。裝配PCR涉及由小DNA片段的混合物來裝配PCR產(chǎn)物。大量不同的PCR反應(yīng)在相同的容器中平行地發(fā)生,一個(gè)反應(yīng)的產(chǎn)物引發(fā)另一個(gè)反應(yīng)的產(chǎn)物。裝配PCR已經(jīng)被描述,例如在美國專利5,965,408中?!矫?,有性PCR誘變是產(chǎn)生本發(fā)明的變異體的示例性方法。在有性PCR5誘變的一個(gè)方面中,由于基于序列同源性的DNA分子隨機(jī)片段化,在不同的但是高度相關(guān)的DNA序列的DNA分子之間,在體外強(qiáng)行發(fā)生同源重組,然后通過PCR反應(yīng)的引物延伸,遺傳交換得到固定。有性PCR誘變?cè)?,例如,Stemmer(1994)Proc.Natl.Asad.Sci.USA91:10747-10751中描述。簡要地說,在這樣的程序中,多個(gè)待重組的核酸用DNase消化,產(chǎn)生具有50到200個(gè)核苷酸的平均大小的片段。10純化具有所需的平均大小的片段,重懸于PCR混合物中。在有利于核酸片段重組的條件下進(jìn)行PCR反應(yīng)。例如,PCR可以這樣進(jìn)行將純化的片段重懸于含有0.2mM的各種dNTP、2.2mMMgCl2、50mMKC1、10mM的Tris-HCl,pH9.0以及0.1%的TritonX-100的溶液中,其濃度為10-30ng/pl。以100:1的比例在反應(yīng)混合物中加入2.5Units的Taq聚合酶,用以下的條件進(jìn)行PCR:94'C60秒,94°C3015秒,50-55'C30秒,72'C30秒(30-45次),然后72'C進(jìn)行5分鐘。然而,可以意識(shí)到,這些參數(shù)可以進(jìn)行適當(dāng)?shù)淖兓?。在一些方面,寡聚核苷酸可以被包括在該P(yáng)CR反應(yīng)中。在其它方面,DNA聚合酶I的Klenow片段可以用于第一輪PCR反應(yīng),而Taq聚合酶可以用于后續(xù)的PCR反應(yīng)。重組序列被分離,并評(píng)估它們編碼的多肽的活性。20—方面,變異體也可以通過體內(nèi)誘變產(chǎn)生。在一些方面,感興趣的序列中的隨機(jī)突變通過在細(xì)菌菌株中增殖該感興趣的序列而產(chǎn)生,所述細(xì)菌菌株例如在一個(gè)或者多個(gè)DNA修復(fù)途徑中具有突變的大腸桿菌菌株。這樣的"突變"菌株具有比野生型親本更高的隨機(jī)突變率。在一種這樣的菌株中進(jìn)行DNA的繁殖,最終可產(chǎn)生DNA中的隨機(jī)突變。適于在體內(nèi)誘變中應(yīng)用的突變菌株在,例如,PCT公25開號(hào)WO91/16427中有描述,其在1991年10月31日公開,題目為"MethodsforPhenotypeCreationfromMultipleGenePopulations"。變異體也可以通過應(yīng)用盒式誘變產(chǎn)生。在盒式誘變中,雙鏈DNA分子的一個(gè)小的區(qū)域被不同于天然序列的合成的寡核苷酸"盒"替代。所述寡核苷酸一般含有完全和/或部分隨機(jī)的天然序列。30遞歸整體誘變也可以用于產(chǎn)生變異體。遞歸整體誘變是一種用于蛋白質(zhì)工程(蛋白誘變)的算法,它的開發(fā)是為了產(chǎn)生表型相關(guān)的突變體組成的多樣性群體,其成員在氨基酸序列上有所不同。該方法應(yīng)用反饋機(jī)制來控制連續(xù)多輪的組合式盒式誘變。遞歸整體誘變?cè)谌鏏ikin(1992)Proc.Natl.Acad.Sci.USA89:7811-7815中有描述。35在一些方面,用指數(shù)整體誘變產(chǎn)生變異體。指數(shù)整體誘變是一個(gè)用于產(chǎn)生具有較高百分比的獨(dú)特且具功能性的突變體的組合文庫的過程,其中少部分的殘基被隨機(jī)化,同時(shí)在每一個(gè)被改變的位置確認(rèn)導(dǎo)致功能性蛋白的氨基酸。指數(shù)整體誘變?cè)谌纾珼elegrave(1993)BiotechnologyRes.11:1548-1552中有描述。隨機(jī)和定點(diǎn)誘變?cè)谌纾珹rnold(1993)CurrentOpinioninBiotechnology4:450-455中有描述。5在一些方面,變異體利用改組方法產(chǎn)生,其中編碼不同的多肽的多個(gè)核酸的部分被融合在一起,產(chǎn)生編碼嵌合多肽的嵌合核酸序列,其描述見美國專利5,965,408,其提交于1996年7月9日,題為"MethodofDNAReassemblybyInterruptingSynthesis";以及美國專利5,939,250,其提交于1996年5月22日,題為"ProductionofEnzymesHavingDesiredActivitiesbyMutagenesis。10本發(fā)明的多肽的變異體可以是這樣的變異體,其中本發(fā)明的多肽的一個(gè)或多個(gè)氨基酸殘基被保守或非保守氨基酸殘基(一方面,保守氨基酸殘基)取代,這樣取代的氨基酸殘基可以是由遺傳密碼編碼或不被其編碼的氨基酸?!矫?,保守取代是那些在多肽中一個(gè)給定的氨基酸被另一個(gè)具有類似特性的氨基酸取代的取代。一方面,本發(fā)明的保守取代包括下列的取代脂肪族氨15基酸如丙氨酸、纈氨酸、亮氨酸和異亮氨酸用另一個(gè)脂肪族氨基酸取代;絲氨酸用蘇氨酸取代,或蘇氨酸用絲氨酸取代;酸性殘基如天冬氨酸和谷氨酸用另一個(gè)酸性殘基取代;具有酰胺基因的殘基,如天冬酰胺和谷氨酰胺用另一個(gè)具有酰胺基因的殘基取代;堿性殘基如賴氨酸和精氨酸用另一個(gè)堿性殘基來交換;芳香族殘基如苯丙氨酸、酪氨酸用另一個(gè)芳香族殘基取代。20其它變異體是那些在本發(fā)明的多肽的一個(gè)或多個(gè)氨基酸殘基中包含有取代基團(tuán)的變異體。一方面,其它變異體是那些在其中多肽與別的化合物聯(lián)接的變異體,所述化合物例如增加多肽的半衰期的化合物(例如聚乙二醇)。其它變異體是那些在其中額外的氨基酸被融合到多肽上的變異體,額外的氨基酸例如前導(dǎo)序歹ij、分泌序列、蛋白原序列(proproteinsequence)或有助于多肽的純化、富集或25穩(wěn)定的序列。在一些方面,片段、衍生物和類似物保持了與本發(fā)明的多肽的相同的生物功能或活性。在其它方面,片段、衍生物或類似物包括蛋白原,這樣,變異體、片段、衍生物或類似物可以通過蛋白原部分的切割來激活,以產(chǎn)生活性多肽。優(yōu)化密碼子以便在宿主細(xì)胞中獲得高水平的蛋白表達(dá)本發(fā)明提供了修飾編碼纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸來改變(例如,優(yōu)化)密碼子使用的方法。一方面,本發(fā)明提供了修飾編碼纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸中的密碼子來增加或者降低其在宿主細(xì)胞中的表達(dá)的方35法。本發(fā)明也提供了編碼纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸,該核酸經(jīng)過修飾從而其在宿主細(xì)胞中的表達(dá)增加,例如,經(jīng)過這樣的修飾的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或l3-葡糖苷酶,以及制備修飾的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的方法。該方法包括鑒定編碼纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的核酸中的"非優(yōu)選的"或"較5不優(yōu)選的"密碼子,并且用編碼相同氨基酸的"優(yōu)選密碼子"作為替換密碼子替換一個(gè)或者多個(gè)這些非優(yōu)選或者較不優(yōu)選的密碼子,并且在所述核酸中至少一個(gè)非優(yōu)選或較不優(yōu)選的密碼子被編碼相同氨基酸的優(yōu)選密碼子替換。優(yōu)選密碼子是在宿主細(xì)胞基因的編碼序列中被較多使用的密碼子,而不優(yōu)選的或者較不優(yōu)選的密碼子是指在宿主細(xì)胞基因的編碼序列中較少使用的密碼子。10用于表達(dá)本發(fā)明的核酸、表達(dá)序列盒以及載體的宿主細(xì)胞包括細(xì)菌、酵母、真菌、植物細(xì)胞、昆蟲細(xì)胞和哺乳動(dòng)物細(xì)胞(參見上面的討論)。因此,本發(fā)明提供了在所有這些細(xì)胞中優(yōu)化密碼子使用的方法、密碼子被改變的核酸,以及由所述的密碼子被改變的核酸編碼的多肽。示例性的宿主細(xì)胞包括革蘭氏陰性細(xì)菌,如大腸桿菌(£sc;iehcWaco);革蘭氏陽性細(xì)菌,如鏈霉菌屬(S/repto/w_ycM)、15加氏乳酸桿菌(丄a"o^c///1^gawe〃')、乳酸乳球菌(£ac/ocoaw/ac似)、乳脂乳球菌(Zactococczwcre加o/7's)、枯草芽胞桿菌(5arcv7/"jsi/6""51)、4山人掌桿菌(5a"7/"sceww)。示例性的宿主細(xì)胞也包括真核生物體,如,各種酵母,如酵母菌屬(Sacc/jaram;ycessp.),包括酉良酒酵母(Sacc/wromycescerevisz'cre)、粟酒裂殖酵母(ScWmsflccWom少ces戶附&e)、畢赤酵母(尸認(rèn)"戸,or&)和乳酸克魯維酵母20(A7M嚴(yán)eram[yc^/acto)、多形漢森酵母(//1myeww/flpo(y附or//fl)、黑曲霉(J5perg〃/uym'ger)和哺乳動(dòng)物細(xì)胞和細(xì)胞系以及昆蟲細(xì)胞和細(xì)胞系。因此,本發(fā)明也包括在這些生物體和物種中表達(dá)被優(yōu)化的核酸和多肽。例如,從細(xì)菌細(xì)胞中分離出的編碼纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的核酸的密碼子被修飾,以便該核酸在不同于25獲得該纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的細(xì)菌的細(xì)胞,如酵母、真菌、植物細(xì)胞、昆蟲細(xì)胞或者哺乳動(dòng)物細(xì)胞中被最優(yōu)化地表達(dá)。優(yōu)化密碼子的方法在本領(lǐng)域是已知的,參見如,美國專利5,795,737;Baca(2000)Int.J.Parasitol.30:113-118;Hale(1998)ProteinExpr.Purif.12:185-188;Narum(2001)Inect.Immun.69:7250-7253。也參見Narum(2001)Infect.Immun.3069:7250-7253,描述了在小鼠系統(tǒng)中優(yōu)化密碼子;Outchkourov(2002)ProteinExpr.Purif.24:18-24,描述了在酵母中優(yōu)化密碼子;Feng(2000)Biochemistry39:15399-15409,描述了在大腸桿菌中優(yōu)化密碼子;Humphreys(2000)ProteinExpr.Purif20:252-264,描述了大腸桿菌中影響分泌的優(yōu)化的密碼子使用。35轉(zhuǎn)基因非人動(dòng)物本發(fā)明提供了轉(zhuǎn)基因非人動(dòng)物,其包含本發(fā)明的核酸、多肽(例如纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶)、表達(dá)序列盒或載體或轉(zhuǎn)染細(xì)胞或轉(zhuǎn)化細(xì)胞。本發(fā)明也提供了產(chǎn)生和應(yīng)用這些轉(zhuǎn)基因非人動(dòng)物的方法。轉(zhuǎn)基因非人類動(dòng)物可以是,例如包含本發(fā)明的核酸的狗、山羊、兔、綿羊、5豬(包括所有的豬(swine)、公豬和相關(guān)動(dòng)物)、牛、大鼠和小鼠。這些動(dòng)物可以用作例如體內(nèi)模型來研究纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或J3-葡糖苷酶的活性,或者作為模型來在體內(nèi)篩選改變纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的活性的試劑。要在轉(zhuǎn)基因非人動(dòng)物中表達(dá)的多肽的編碼序列可以設(shè)計(jì)為組成型的,或者在組織特異性、發(fā)10育特異性或者可誘導(dǎo)的轉(zhuǎn)錄調(diào)控因子的控制之下。轉(zhuǎn)基因非人動(dòng)物可以應(yīng)用本領(lǐng)域任何已知的方法設(shè)計(jì)和產(chǎn)生;參見,如,美國專利6,211,428;6,187,992;6,156,952;6,118,044;6,111,166;6,107,541;5,959,171;5,922,854;5,892,070;5,880,327;5,891,698;5,639,940;5,573,933;5,387,742;5,087,571,它們描述了制造和應(yīng)用轉(zhuǎn)化的細(xì)胞和卵以及轉(zhuǎn)基因小鼠、15大鼠、兔、羊、豬和牛。也參見,如,Pollock(1999)J.Immunol.Methods231:147-157,描述了在轉(zhuǎn)基因奶牛動(dòng)物的乳汁中生產(chǎn)重組蛋白;Baguisi(1999)Nat.Biotechnol.17:456-461,描述了轉(zhuǎn)基因山羊的產(chǎn)生。美國專利6,211,428,描述了制備和應(yīng)用在其腦中表達(dá)含有DNA序列的核酸構(gòu)建物的轉(zhuǎn)基因非人哺乳動(dòng)物。美國專利5,387,742,描述了把克隆的重組子或者合成的DNA序列注射至小鼠受精卵中,移20植注射的卵至假孕的雌鼠中,并生長成為轉(zhuǎn)基因鼠,它的細(xì)胞表達(dá)與阿爾茨海默氏病的病理相關(guān)的蛋白。美國專利6,187,992,描述了制備和應(yīng)用轉(zhuǎn)基因小鼠。"基因敲除動(dòng)物"也可以被用于實(shí)踐本發(fā)明的方法。例如,一方面,本發(fā)明的轉(zhuǎn)基因或修飾動(dòng)物包括"基因敲除動(dòng)物",例如"基因敲除小鼠",其被進(jìn)行了遺傳工程以至于不表達(dá)內(nèi)源基因,該基因被表達(dá)本發(fā)明纖維素酶如內(nèi)切葡聚糖25酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的基因或包含有本發(fā)明纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的融合蛋白的基因代替。轉(zhuǎn)基因植物和種子30本發(fā)明提供了轉(zhuǎn)基因植物和種子,其包含本發(fā)明的核酸、多肽(例如纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶)、表達(dá)序列盒或載體或轉(zhuǎn)染或轉(zhuǎn)化的細(xì)胞。本發(fā)明也提供了包含本發(fā)明的核酸和/或多肽(例如纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶)的植物產(chǎn)品,例如油、種子、葉、提取物和類似物。轉(zhuǎn)基因植物可以是雙子葉(雙35子葉植物)或單子葉的(單子葉植物)。本發(fā)明也提供了制備和應(yīng)用這些轉(zhuǎn)基因植物和種子的方法。表達(dá)本發(fā)明的多肽的轉(zhuǎn)基因植物或者植物細(xì)胞可以按照本領(lǐng)域任何已知的方法構(gòu)建。參見例如,美國專利6,309,872。本發(fā)明的核酸和表達(dá)構(gòu)建物可以通過任何方式導(dǎo)入到植物細(xì)胞中。例如,核酸或者表達(dá)構(gòu)建物可以導(dǎo)入到所希望的植物宿主的基因組中,或者,核酸或表達(dá)構(gòu)建物可以是附加體??梢詫?dǎo)入到所希望的植物的基因組中,這樣,宿主的纖5維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的產(chǎn)生被內(nèi)源性的轉(zhuǎn)錄或者翻譯控制元件調(diào)控。本發(fā)明也提供了"基因敲除植物",其中例如同源重組導(dǎo)致的基因序列插入破壞了內(nèi)源性基因的表達(dá)。產(chǎn)生"基因敲除"植物的方法在本領(lǐng)域是屬知的,參見,如,Strepp(1998)ProcNatl.Acad.Sci.USA95:4368-4373;Miao(1995)PlantJ7:359-365。參見下面的轉(zhuǎn)基因植物的討論。10本發(fā)明的核酸可以用來將所需的性質(zhì)賦予基本上任何植物,例如產(chǎn)淀粉的植物,如馬鈴薯、番茄、小麥、大豆、甜菜、玉米、稻、大麥以及類似的植物。本發(fā)明的核酸可以用于操作植物的代謝途徑,以優(yōu)化或者改變宿主的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的表達(dá)。這可以改變植物中的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖15苷酶的活性??梢赃x擇地,本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶可以在轉(zhuǎn)基因植物的生產(chǎn)中被應(yīng)用,以產(chǎn)生該植物不能天然產(chǎn)生的化合物。這可以降低生產(chǎn)成本或者產(chǎn)生一種新的產(chǎn)物?!矫?,生產(chǎn)轉(zhuǎn)基因植物的第一步涉及制備用于在植物細(xì)胞中表達(dá)的表達(dá)構(gòu)建物。這些技術(shù)在本領(lǐng)域是熟知的。它們可以包括選擇和克隆啟動(dòng)子、便于核20糖體有效結(jié)合mRNA的編碼序列,以及選擇適當(dāng)?shù)幕蚪K止子序列。一個(gè)示例性的組成型啟動(dòng)子是來自花椰菜花葉病毒的CaMV35S,它一般在植物中導(dǎo)致高水平的表達(dá)。其它的啟動(dòng)子是更特異的,并且對(duì)植物內(nèi)部或者外部環(huán)境中的暗示有反應(yīng)。一個(gè)示例性的光誘導(dǎo)的啟動(dòng)子是來自編碼主要葉綠素a/b結(jié)合蛋白的cab基因的啟動(dòng)子。25—方面,修飾核酸來實(shí)現(xiàn)在植物細(xì)胞中更強(qiáng)的表達(dá)。例如,本發(fā)明的序列很可能具有比在植物中更高的A-T核苷酸對(duì)百分率,而一些植物優(yōu)選G-C核苷酸對(duì)。因此,編碼序列中的A-T核苷酸可以用G-C核苷酸取代,而不顯著改變氨基酸序列,從而可以增加基因產(chǎn)物在植物細(xì)胞中的生產(chǎn)。為了鑒定已經(jīng)成功整合了轉(zhuǎn)基因的植物細(xì)胞或者組織,可以將選擇性標(biāo)記30基因加入到基因構(gòu)建物中。這可能是必要的,因?yàn)樵谥参锛?xì)胞中完成基因的整合和表達(dá)是一個(gè)小概率事件,僅僅在較少百分率的靶組織和細(xì)胞中發(fā)生。選擇性標(biāo)記基因編碼對(duì)試劑有抗性的蛋白,所述試劑一般對(duì)植物有毒性,如抗生素或者除草劑。當(dāng)在含有適當(dāng)?shù)目股鼗蛘叱輨┑呐囵B(yǎng)基上生長時(shí),只有已經(jīng)整合了選擇性標(biāo)記基因的植物細(xì)胞可以成活。與其它的插入基因一樣,為了有恰當(dāng)?shù)墓δ?35標(biāo)記基因也需要啟動(dòng)子和終止序列。—方面,制備轉(zhuǎn)基因植物或種子包括將本發(fā)明的序列以及任選的標(biāo)記基因整合到目標(biāo)表達(dá)構(gòu)建物(如,質(zhì)粒)中,同時(shí)設(shè)置啟動(dòng)子和終止子序列。這可以包括通過合適的方法將修飾的基因轉(zhuǎn)移至植物中。例如,構(gòu)建物可以應(yīng)用如電擊轉(zhuǎn)化和微注射植物細(xì)胞原生質(zhì)體的技術(shù)直接引入到植物細(xì)胞的基因組DNA中,或者構(gòu)建物可以應(yīng)用彈道方法(ballisticmethods),如,DNA微粒轟擊(DNAparticle5bombardment)的方法直接引入到植物組織中。例如,參見如,Christou(1997)PlantMol.Biol.35:197-203;Pawlowski(1996)Mol.Biotechnol.6:17-30;Klein(1987)Nature327:70-73;Talcumi(1997)GenesGenetSyst.72:63-69,討論了應(yīng)用微粒轟擊引入轉(zhuǎn)基因到小麥中;以及Adam(1997)如上,應(yīng)用微粒轟擊引入YAC至植物細(xì)胞中。例如,Rinehart(1997)如上,用微粒轟擊來產(chǎn)生轉(zhuǎn)基因棉花植物。10用于加速微粒的設(shè)備在美國專利5,015,580中有說明;而且,可以商購得到BioRad(Biolistics)PDS-2000微粒加速設(shè)備;也參見,John,美國專利5,608,148;和Ellis,美國專利5,681,730,描述了微粒介導(dǎo)的裸子植物的轉(zhuǎn)化?!矫?,原生質(zhì)體可以被固定,并用核酸例如表達(dá)構(gòu)建物注射。盡管源自原生質(zhì)體的植物再生對(duì)于谷類并不容易,但是應(yīng)用體細(xì)胞胚胎發(fā)生由原生質(zhì)體來15源的愈傷組織進(jìn)行植物再生在豆類中是有可能的。機(jī)化組織可以使用基因槍技術(shù)用裸DNA轉(zhuǎn)化,其中,DNA被包裹于鎢微射彈(tungstenmicroprojectiles)上,射出物的大小為細(xì)胞大小的1/100,它攜帶DNA深入到細(xì)胞和細(xì)胞器中。轉(zhuǎn)化的組織然后被誘導(dǎo)再生,一般通過體細(xì)胞胚胎發(fā)生技術(shù)。這一技術(shù)已經(jīng)在包括玉米和水稻的幾個(gè)谷類物種中成功應(yīng)用。20核酸,例如表達(dá)構(gòu)建物,也可以應(yīng)用重組病毒引入到植物細(xì)胞中。植物細(xì)胞可以用病毒載體轉(zhuǎn)化,如,煙草花葉病毒衍生的載體(Rouwendal(1997)PlantMol.Biol.33:989-999),參見Porta(1996)"Useofviralrepliconsfortheexpressionofgenesinplants",Mol.Biotechnol.5:209-221??蛇x擇地,核酸,如表達(dá)構(gòu)建物,可以與合適的T-DNA側(cè)翼區(qū)組合,并25導(dǎo)入到傳統(tǒng)的根瘤農(nóng)桿菌宿主載體中。根瘤農(nóng)桿菌宿主的毒力功能將在植物細(xì)胞受該細(xì)菌感染時(shí),引導(dǎo)構(gòu)建物和鄰近的標(biāo)記插入至植物細(xì)胞DNA中。根瘤農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化技術(shù),包括disarming和應(yīng)用二元載體,在科學(xué)文獻(xiàn)中有詳細(xì)的說明。參見,如,Horsch(1984)S"e"ce233:496-498;Fraley(1983)/VocA^Z.JcadSW.80:4803(1983);7hww/e〃o尸/a"",Potrykus,ed.(Springer-Veriag,Berlin301995)。根瘤農(nóng)桿菌細(xì)胞的DNA被包含在細(xì)菌染色體中,也被包含在稱為Ti(腫瘤誘導(dǎo))質(zhì)粒的另一種結(jié)構(gòu)中。Ti質(zhì)粒含有一段命名為T-DNA的DNA(20kb長)和一系列毒力(毒性)基因,T-DNA在感染過程中被轉(zhuǎn)移到植物細(xì)胞中,毒力基因則引導(dǎo)所述感染過程。根瘤農(nóng)桿菌可以通過傷口感染植物當(dāng)一種植物的根或者莖受傷時(shí),它釋放某種化學(xué)信號(hào),作為對(duì)這種信號(hào)的響應(yīng),根瘤農(nóng)桿菌的35毒力基因被激活,并引發(fā)一系列從Ti質(zhì)粒轉(zhuǎn)移T-DNA至植物染色體所必需的事件。T-DNA然后通過傷口進(jìn)入到植物細(xì)胞。一個(gè)推測是T-DNA—直等到植物DNA復(fù)制或者轉(zhuǎn)錄,然后將自身插入到暴露的植物DNA中。為了應(yīng)用根瘤農(nóng)桿菌作為轉(zhuǎn)基因載體,必須去除T-DNA的腫瘤誘導(dǎo)部分,而保留T-DNA的邊界區(qū)域和毒力基因。轉(zhuǎn)基因然后插入到T-DNA的邊界區(qū)域之間,從這里轉(zhuǎn)移到植物細(xì)胞并且整合到植物的染色體中。5本發(fā)明提供了應(yīng)用本發(fā)明的核酸進(jìn)行包括重要的谷類植物在內(nèi)的單子葉植物的轉(zhuǎn)化,參見Hiei(1997)PlantMol.Biol.35:205-218。也參見如,Horsch,Science(1984)233:496;Fraley(1983)Proc.NatlAcad.SciUSA80:4803;Thykjaer(1997)如上;Park(1996)PlantMol.Biol.32:1135-1148,討論了將T-DNA整合到基因組DNA中。也參見D'Halluin,美國專利5,712,135,描述了包含在谷類或者其它單子10葉植物的細(xì)胞中的具有功能的基因的DNA的穩(wěn)定整合過程?!矫?,第三步可能涉及完整植物的選擇和再生,所述植物能夠?qū)⒄系陌谢騻鬟f至下一代。這樣的再生技術(shù)依賴于在組織培養(yǎng)生長培養(yǎng)基中對(duì)某些植物激素的操作。一方面,該方法利用與所需的核苷酸序列一同引入的殺蟲劑和/或除草劑標(biāo)記。源自培養(yǎng)的原生質(zhì)體的植物再生在以下文獻(xiàn)中有說明,Evans等,15Pra鄉(xiāng)/a加/so/加'omaweCW&re,Z/aw必ooA:o/iV"WO//Cw/ft^e,124-176頁,MacMillilanPublishingCompany,NewYork,1983;禾qBinding,iegenen3n'owo/尸/aw",尸/aWiVorop/a^y,21-73頁,CRCPress,BocaRaton,1985。再生也可以從植物愈傷組織、外植體、器官或者其中的一部分得到。這樣的再生技術(shù)在Klee(1987)Ann.Rev.ofplantPhys.38:467-486中有總體的說明。為了從轉(zhuǎn)基因組織如未成熟的胚胎20獲得整個(gè)植物,它們可以在一系列含有營養(yǎng)物和激素的培養(yǎng)基中在可控制的環(huán)境條件下培養(yǎng),即稱為組織培養(yǎng)的過程。一旦整個(gè)植物再生并且產(chǎn)生種子,便開始評(píng)測其子代?!矫妫诒磉_(dá)序列盒穩(wěn)定地整入到轉(zhuǎn)基因植物之后,其可以通過有性雜交(sexualcrossing)引入到其它的植物中??梢詰?yīng)用任何的標(biāo)準(zhǔn)繁殖技術(shù),這依25賴于待雜交的物種。因?yàn)楸景l(fā)明核酸的轉(zhuǎn)基因表達(dá)導(dǎo)致表型變化,包含本發(fā)明的重組核酸的植物可以和另一植物有性雜交而得到最終產(chǎn)物。因此,本發(fā)明的種子可以來自本發(fā)明的兩個(gè)轉(zhuǎn)基因植物的雜交,或者來自本發(fā)明的植物和其它植物的雜交。當(dāng)兩個(gè)親本植物都表達(dá)本發(fā)明的多肽(例如纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶)時(shí),所需的效應(yīng)(例如,表達(dá)本30發(fā)明的多肽來產(chǎn)生一種開花行為被改變的植物)可以被增強(qiáng)。所需的效應(yīng)通過標(biāo)準(zhǔn)的繁殖方法傳到以后的植物世代中?!矫妫景l(fā)明的核酸和多肽被表達(dá)于或者插入到任何植物或者種子中。本發(fā)明的轉(zhuǎn)基因植物可以是雙子葉植物或者單子葉植物。本發(fā)明的單子葉轉(zhuǎn)基因植物的例子是草,如牧草(藍(lán)草,早熟禾屬尸oa),飼料草如羊茅屬,黑麥草屬,35溫帶草,如翦股穎屬C4gra幼'",和谷類,如,小麥、燕麥、黑麥、大麥、水稻、蜀黍和玉米(corn)。本發(fā)明的雙子葉轉(zhuǎn)基因植物的例子是煙草,豆類如羽扇豆,馬鈴薯,甜菜,豌豆,蠶豆和大豆,以及十字花科植物(5row/caceae科),如花椰菜,油菜籽,和緊密相關(guān)的模式生物擬南芥"ra6Wo/w/1yf/ia//flmj)。因此,本發(fā)明的轉(zhuǎn)基因植物和種子包括很寬范圍的植物,包括,但不限于,以下屬的物種-腰果屬""acaW/ww)、落花生屬"rac/H^)、天冬屬(Asparag^)、茄屬Ufra;a)、5燕麥屬"ve"a)、蕓苔屬(5raw/ca)、柑桔屬(C!7nw)、Cz>m//us、辣椒屬"7a/wi'cwm)、CaW/7am"s、椰子(Coaw)、咖啡(Co#ea)、香瓜屬(Ci/cw/m's)、南瓜屬(CwcM/^!7a)、胡蘿卜屬(Dawcws)、油棕屬草莓屬(fVagm7'fl)、大豆屬(Gfya、e)、棉屬(Gowy;^ww)、向日葵屬(//e//a"f/n)、//e/ewca〃&、大麥屬(Z/orJeM/n)、天仙子屬(/fyosc戸/mw)、萵苣屬(Za"Mca)、亞麻屬("""w)、黑麥草屬ao//wm)、10羽扇豆屬(丄w//mw)、番茄屬(Z^copery/cow)、蘋果屬(Ma/ws)、木薯屬(Mflm'Ao/)、Mq/oma、苜蓿屬(A/eAcago)、煙草屬(Mco"awa)、木樨欖屬(OZea)、稻屬(Ojza)、稷屬(戶a"/e"m)、狼尾草屬(尸a""&"謂)、鱷梨屬(Perwa)、菜豆屬(尸/jawoto)、P&acWa、豌豆屬(尸&"附)、梨屬(尸,MS)、李屬(Pn/mw)、蘿卡屬(ia;^am^)、蓖麻屬(i!'c/"m)、黑麥屬(Seca/e)、千里光屬(Se"edo)、S/wa;^、茄屬(So/o"mw)、15高粱屬(5brg/i"m)、7Tieo6rowM"葫蘆巴屬(7Wgowe//a)、小麥屬(rn'"ami)、野豌豆屬(Wc/")、葡糖屬(Wto)、豇豆屬(P7g"a)和玉蜀黍?qū)?Zea)。在可選擇的實(shí)施方式中,本發(fā)明的核酸在含有纖維細(xì)胞的植物中表達(dá),包括,如,棉、絲棉樹(木棉、吉貝木棉)、沙漠柳、石炭酸灌木、winterfat、輕木(balsa)、苧麻、洋麻、大麻、洛神葵、黃麻、馬尼拉劍麻和亞麻。在可供選擇的20實(shí)施方式中,本發(fā)明的轉(zhuǎn)基因植物可以是棉屬(Gw^^'M/n)的成員,包括任何棉禾中(Go,/wm)的成員,如,亞洲棉(G。rZw畫)、草棉(G/^6ac畫)、海島棉(G6aAa&Awe)和陸地棉(G)。本發(fā)明也提供了用于產(chǎn)生大量本發(fā)明多肽(例如纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶)的轉(zhuǎn)基因植物。例如,參見25Palingren(1997)TrendsGenet.13:348;Chong(1997)TransgenicRes.6:289-296(利用植物生長素誘導(dǎo)的雙向甘露氨酸合成酶(masl',2')啟動(dòng)子,應(yīng)用根瘤農(nóng)桿菌介導(dǎo)的葉片圓盤(leafdisc)轉(zhuǎn)化方法在轉(zhuǎn)基因馬鈴薯植物中生產(chǎn)人乳汁蛋白P-酪蛋白)。應(yīng)用已知的程序,技術(shù)人員可以通過檢測在轉(zhuǎn)基因植物中轉(zhuǎn)基因mRNA30或蛋白的增加或減少來篩選本發(fā)明的植物。檢測和定量mRNA或蛋白的方法在本領(lǐng)域是熟知的。多肽和肽—方面,本發(fā)明提供了分離的或重組的多肽,其與本發(fā)明的示例性序列具35有序列同一性(例如至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性),本發(fā)明的示例性序列例如具有SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:IO,5SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,SEQIDNO:22,SEQIDNO:24,SEQIDNO:26,SEQIDNO:28,SEQIDNO:30,SEQIDNO:32,SEQIDNO:34,SEQIDNO:36,SEQIDNO:38,SEQIDNO:40,SEQIDNO:42,SEQIDNO:44,SEQIDNO:46,SEQIDNO:48,SEQIDNO:50,SEQIDNO:52,SEQIDNO:54,SEQIDNO:56,SEQIDNO:58,SEQIDNO:60,10SEQIDNO:62,SEQIDNO:64,SEQIDNO:66,SEQIDNO:68,SEQIDNO:70,SEQIDNO:72,SEQIDNO:74,SEQIDNO:76,SEQIDNO:78,SEQIDNO:80,SEQIDNO:82,SEQIDNO:84,SEQIDNO:86,SEQIDNO:88,SEQIDNO:90,SEQIDNO:92,SEQIDNO:94,SEQIDNO:96,SEQIDNO:98,SEQIDNO:100,SEQIDNO:102,SEQIDNO:104,SEQIDNO:106,SEQIDNO:108,SEQID15NO:110,SEQIDNO:m,SEQIDNO:114,SEQIDNO:116,SEQIDNO:118,SEQIDNO:120,SEQIDNO:122,SEQIDNO:124,SEQIDNO:126,SEQIDNO:128,SEQIDNO:130,SEQIDNO:132,SEQIDNO:134,SEQIDNO:136,SEQIDNO:138,SEQIDNO:140,SEQIDNO:142,SEQIDNO:144,SEQIDNO:146,SEQIDNO:148,SEQIDNO:150,SEQIDNO:152,SEQIDNO:154,SEQID20NO:156,SEQIDNO:158,SEQIDNO:160,SEQIDNO:162,SEQIDNO:164或SEQIDNO:166中所示的序列的蛋白(也參見表l、2和3,下面的實(shí)施例1和4,以及序列表)。序列同一性百分比可以在多肽的全長的區(qū)域內(nèi),或同一性可以在至少大約50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700或更多殘基的區(qū)域內(nèi)。25[391a]本發(fā)明的多肽也可以比所述的示例性多肽的全長短。在可以選擇的方面,本發(fā)明提供了大小范圍在大約5到多肽全長的多肽(肽、片段),例如酶,如纖維素酶,諸如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶;示例性的大小為大約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100、125、150、175、200、250、300、350、400、450、500、550、30600、650、700或更多殘基,這些殘基例如是本發(fā)明的示例性纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的相鄰殘基。本發(fā)明的肽(例如,本發(fā)明的示例性多肽的子序列)可以用作,例如標(biāo)記探針,抗原(免疫原),耐受原,基序,纖維素酶例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性位點(diǎn)(例如,"催化結(jié)構(gòu)域"),信號(hào)序列和/或前原結(jié)構(gòu)域(prepro35domains)。在可選的方面,本發(fā)明的具有纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的多肽,是一類多肽的成員,該類多肽共享與纖維素酶活性如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性相關(guān)的特定結(jié)構(gòu)元件,例如氨基酸殘基。這些共享的結(jié)構(gòu)元件可用于常規(guī)產(chǎn)生纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶變體。本5發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的這些共享結(jié)構(gòu)元件可用于指導(dǎo)本發(fā)明的多肽種類范圍內(nèi)的纖維素酶例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶變體的常規(guī)產(chǎn)生。如本文所使用,術(shù)語"纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶"包括能夠催化纖維素的完全或部分分解和/或水解的任10何多肽或酶(例如,本發(fā)明的示例性多肽,也參見下面的表1、2和3,實(shí)施例1和4),或者能夠進(jìn)行纖維素或木素纖維素材料如含有木素纖維素的生物材料的任何修飾的任何多肽或酶。在一些方面,本發(fā)明可以具有可選的酶促活性,例如,如在下面的表3中所示。例如,具有如SEQIDNO:164中所示的序列的多肽,由例如SEQIDNO:16315編碼,可以具有堿性內(nèi)切葡聚糖酶/纖維素酶活性;具有如SEQIDNO:110中所示的序列的多肽,由例如SEQIDNO:109編碼,可以具有木聚糖酶活性;具有如SEQIDNO:12中所示的序列的多肽,由例如SEQIDNO:11編碼,可以具有NAD結(jié)合氧化還原酶活性;具有如SEQIDNO:118中所示的序列的多肽,由例如SEQIDNO:117編碼,可以具有短鏈脫氫酶活性;具有如SEQIDNO:14中所示的序列的20多肽,由例如SEQIDNO:13編碼,可以具有NADH依賴性脫氫酶活性;具有如SEQIDNO:138中所示的序列的多肽,由例如SEQIDNO:137編碼,可以具有肽酶活性;具有如SEQIDNO:162中所示的序列的多肽,由例如SEQIDNO:161編碼,除了纖維素酶活性外還可以具有堿性內(nèi)切葡聚糖酶活性;具有如SEQIDNO:42中所示的序列的多肽,由例如SEQIDNO:41編碼,可以具有半胱氨酰tRNA25合成酶活性;具有如SEQIDNO:32中所示的序列的多肽,由例如SEQIDNO:31編碼,可以具有纖維糊精磷酸化酶活性;具有如SEQIDNO:50中所示的序列的多肽,由例如SEQIDNO:49編碼,可以具有fdhd/narq氧化還原酶活性;具有如SEQIDNO:54中所示的序列的多肽,由例如SEQIDNO:53編碼,可以具有自由基S-腺苷蛋氨酸(SAM)活性;具有如SEQIDNO:58中所示的序列的多肽,由例如30SEQIDNO:57編碼,可以具有類似枯草蛋白酶的蛋白酶活性(枯草蛋白酶樣蛋白酶活性);等等,如下所示表3:<formula>formulaseeoriginaldocumentpage127</formula><table>tableseeoriginaldocumentpage128</column></row><table><table>tableseeoriginaldocumentpage129</column></row><table>ORF011-家族37,38葡糖苷瞎)ORP004-椎定的氧化還原酶39.40ORF004-半胱氨酰tRM合成酶41,4243,44ORF011—ORF006—家族1(&-葡糖苷酶)ORF00Z-家族1(a"47,48蕭耱苷籌)49,60氧化還原酶5,6ORF312-家族6(纖維素酶)1-29MTRRS,VRSSSNKWLVLAGAALLACTALG51,52ORF001-家族5(纖維素酶)1-20MSRGHJLVMLSVLSGAALA53,54ORF002—自由基SAI^族ORF004-家族1(ft"55,58葡糖苷瞎)57,58ORF加1-類似枯直蛋白酶的蛋白酶59,60家族5(纖維親酶)61,62家族5(纖維素酶)ORF114263,64家族5(纖維素鵬)ORF4,-2465,66家族10(木聚糖酶)1"3967.68家族5(纖維親鵬VORF21-23MVWTPARSTLAGSSEIPLMTMNIFPNRKDSRMSL州KLG'LCMMAGTVMVHQMKRREFMU3GAGVAALASTLGVSAMNTLLPR亂WSSTAIRTLMGALMGMVLAPVSAANAMKYIFSYIIMMlUOFIPVYGR34.1.1.6,1-1.163,2.1.213.2."1...3.2.1.2112.1.43.2.1.43.2.1.43.2.1.4200680016175.5勢溢齒被98/148JB;nwnx口口nw口口頭頭知知.w.,*K知未未未未未未未w知w知知^f^知知未未未未未未未未未未<table>tableseeoriginaldocumentpage131</column></row><table>未如本文所使用,"氨基酸"或"氨基酸序列"是指寡肽、肽、多肽或蛋白序列,或寡肽、肽、多肽或蛋白序列中任意一種的片段、部分或亞基,以及天然發(fā)生的或合成的分子。"氨基酸"或"氨基酸序列"包括寡肽、肽、多肽或蛋白序列,或寡肽、肽、多肽或蛋白序列中任意一種的片段、部分或亞基,以及天然發(fā)5生的或合成的分子。如本文所使用,術(shù)語"多肽"是指通過肽鍵或修飾的肽鍵即肽等排體(peptideisosteres)彼此結(jié)合在一起的氨基酸,可以含有除20個(gè)由基因編碼的氨基酸之外的修飾的氨基酸。所述多肽可以通過天然過程,如,翻譯后加工或者通過本領(lǐng)域所熟知的化學(xué)修飾技術(shù)修飾所述多肽。修飾可以發(fā)生在所述多肽的任何地方,包括肽骨架、氨基酸側(cè)鏈和氨基端或者羧基端??梢岳斫?,相同10類型的修飾可以在給定的多肽中以相同的或者不同的水平在幾個(gè)位點(diǎn)處發(fā)生。一個(gè)給定的多肽也可以具有很多類型的修飾。修飾包括乙?;Ⅴ;饔谩DP-核糖基化作用、酰胺化作用、共價(jià)連接核黃素、共價(jià)連接血紅素組分、共價(jià)連接核苷酸或者核苷酸衍生物、共價(jià)連接脂質(zhì)或者脂質(zhì)衍生物、共價(jià)連接磷脂酰肌醇、交聯(lián)的環(huán)化作用、形成二硫鍵、去甲基作用、形成共價(jià)交聯(lián)、形成半胱氨酸、形15成焦谷氨酸、甲?;饔?、"羧化作用、糖基化作用、形成GPI錨、羥基化作用、碘化作用、甲基化作用、肉豆蔻酰基化作用、氧化作用、聚乙二醇化、葡聚體水解酶處理、磷酸化作用、異戊烯作用、外消旋作用、硒化作用、硫酸鹽化作用,和轉(zhuǎn)移RNA介導(dǎo)氨基酸添加到蛋白質(zhì)中,如精氨?;?參見,如,Creighton,T.E.,Proteins-StructureandMolecularProperties2ndEd.,W.H.Freeman和Company,New20York(1993);PosttranslationalCovalentModificationofProteins,B.C.Johnson,Ed"AcademicPress,NewYork,11-12頁(1983〉)。本發(fā)明的肽和多肽也包括所有"模擬物"和"肽模擬物"形式,正如下面進(jìn)一步詳細(xì)描述的。如本文所使用,術(shù)語"分離的"意指從其原始環(huán)境(例如天然環(huán)境,如果該環(huán)境是天然存在的話)中分離出的物質(zhì)(本發(fā)明的蛋白或核酸)。例如,在活的25動(dòng)物中存在的天然發(fā)生的多核苷酸或多肽不是分離的,但與該天然系統(tǒng)中的一些或所有的共存物質(zhì)分離開的同一多核苷酸或多肽是分離的。這樣的多核苷酸可以成為載體的一部分,和/或這樣的多核苷酸或多肽可以是組合物的一部分,但它們?nèi)匀皇欠蛛x的,因?yàn)檫@樣的載體或組合物不是其天然環(huán)境的組成部分。正如本文所用,術(shù)語"純化的"并不要求絕對(duì)的純度;它更確切的說,這意味著是一個(gè)相30對(duì)定義。從文庫獲得的各核酸可以按慣例純化為電泳同質(zhì)。從這些克隆獲得的序列不能夠從所述文庫或從總?cè)薉NA直接獲得。本發(fā)明的純化的核酸已經(jīng)以至少10、10M咅從該生物體的基因組DNA的剩余物中純化出來。一方面,術(shù)語"純化的"包括核酸,這些核酸已經(jīng)以至少一個(gè)數(shù)量級(jí),例如一方面,以兩個(gè)或三個(gè),或者,四個(gè)或五個(gè)數(shù)量級(jí)的程度從基因組DNA的剩余物或從文庫或其它序列中被純化出35來。"重組的"多肽或蛋白是指通過重組DNA技術(shù)產(chǎn)生的多肽或蛋白;艮P,由用編碼期望多肽或蛋白的外源DNA構(gòu)建物轉(zhuǎn)化的細(xì)胞產(chǎn)生的多肽或蛋白。"合成的"多肽或蛋白是那些通過化學(xué)合成制備的多肽或蛋白。固相化學(xué)肽合成方法也可以用于合成本發(fā)明的多肽或者片段。這樣的方法自二十世紀(jì)六十年代早期起就是本領(lǐng)域已知的方法(Memfield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)5(也參見Stewart,J.M.和Young,J.D.,SolidPhasePeptideSynthesis,第二版,PierceChemicalCo.,Rockford,III,11-12頁),并且這些方法已經(jīng)可以通過商業(yè)上可獲得的實(shí)驗(yàn)室肽設(shè)計(jì)和合成試劑盒(CambridgeResearchBiochemicals)而被應(yīng)用。這樣的商業(yè)上可獲得的實(shí)驗(yàn)室試劑盒一般是利用H.M.Geysen等,Prac.Wa".Aad5W.,t/S4,M:3998(1984)的方法,它們讓肽合成在多個(gè)"桿(rods)"或者"釘10(pins)"的頂端進(jìn)行,而所有的"桿"或者"釘"都被連接到一塊板上。短語"基本上相同(substantiallyidentical)"在用于兩個(gè)核酸或多肽時(shí),是指當(dāng)兩個(gè)或更多個(gè)序列被比較和聯(lián)配(aligned)以尋找最大一致性(maximuncorrespondence)時(shí),它們具有例如至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、1569%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的核苷酸或氨基酸殘基(序列)同一性,所述同一性可以使用任意一種已知的序列比較算法測量,或者通過視覺觀察。在可選擇的方面,基本上相同存在于至少大約100或更多個(gè)殘基的區(qū)域內(nèi),最經(jīng)常地,20在至少大約150至200或更多殘基的區(qū)域內(nèi)所述序列是基本上相同的。在一些方面,本發(fā)明的核酸序列可以在多肽編碼區(qū)的整個(gè)長度范圍內(nèi)是基本上相同的。此外,"基本上相同的"氨基酸序列可以是通過一個(gè)或多個(gè)保守或非保守氨基酸的取代、缺失或插入而與參考序列有所不同的序列。在一個(gè)方面,取代發(fā)生在不是分子的活性位點(diǎn)的位置,或者可選地,取代發(fā)生在分子的活性位點(diǎn)的位25置,前提是該多肽基本上保持其功能(酶促)特性。保守的氨基酸取代,例如用一個(gè)氨基酸取代另一個(gè)相同類別的氨基酸(例如用一個(gè)疏水氨基酸,如異亮氨酸、纈氨酸、亮氨酸或甲硫氨酸,取代另一個(gè)疏水氨基酸,或用一個(gè)極性氨基酸取代另一個(gè)極性氨基酸,例如用精氨酸取代賴氨酸、用谷氨酸取代天冬氨酸,或用谷氨酰胺取代天冬酰胺)。可以從例如纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、30甘露聚糖酶和/或P-葡糖苷酶多肽中刪除一個(gè)或多個(gè)氨基酸,從而形成對(duì)多肽結(jié)構(gòu)的修飾,而又不會(huì)顯著地改變其生物活性。例如,對(duì)纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的生物活性來說不需要的氨基或羧基末端氨基酸可以被去除。可以通過任何方法測定本發(fā)明的修飾的多肽序列的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶生物活性,35所述方法包括將所述修飾的多肽序列和底物接觸,確定所述修飾的多肽是否在該測定中減少特定底物的量或者增加功能性纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酷、甘露聚糖酶和/或p-葡糖苷酶與底物的酶促反應(yīng)的生物產(chǎn)物。如本文所使用,"片段"是天然存在的蛋白質(zhì)的一部分,其可以以至少兩種不同的構(gòu)象存在。片段可以具有與天然發(fā)生的蛋白質(zhì)相同或基本上相同的氨基酸序列。具有與天然存在的蛋白質(zhì)有所不同的三維結(jié)構(gòu)的片段也被包括在內(nèi)。這5樣的一個(gè)例子是"原-形式(pro-form)"分子,例如,低活性的蛋白原,其可以通過切割而被修飾,產(chǎn)生具有顯著更高的活性的成熟酶?!矫妫景l(fā)明提供了本發(fā)明的蛋白和肽例如纖維素酶的晶體(三維)結(jié)構(gòu);其可以使用本領(lǐng)域中熟知的常規(guī)方案進(jìn)行制備并加以分析,例如,在下列文獻(xiàn)中有所描述MacKenzie(1998)Crystalstructureofthefamily7endoglucanaseI10(Cel7B)fromif應(yīng)/co/flf'/wo/e/wat2.2Aresolutionandidentificationofthecatalyticnucleophilebytrappingofthecovalentglycosyl-enzymeintermediate,Biochem.J.335:409-416;Sakon(1997)Structureandmechanismofendo/exocellulaseE4from77jermoMonos/ora/wsca,Nat.Struct.Biol4:810-818;Vaxrot(1999)Crystalstructureofthecatalyticcoredomainofthefamily6cellobiohydrolaseII,Cel6A,ftom/f謂/co/。15/;wo/em,at1.92Aresolution,Biochem.J.337:297-304;舉例說明并鑒定了特定的結(jié)構(gòu)元件,其可用于指導(dǎo)本發(fā)明的纖維素酶變體的常規(guī)產(chǎn)生,并用于指導(dǎo)鑒別本發(fā)明的范圍內(nèi)的酶種類。本發(fā)明的多肽和肽可以分離自天然來源,可以是合成的,或者可以是重組產(chǎn)生的多肽。肽和蛋白可以在體外或體內(nèi)重組表達(dá)。本發(fā)明的肽和多肽可以使用20本
技術(shù)領(lǐng)域
已知的任何方法產(chǎn)生和分離。本發(fā)明的多肽和肽也可以使用本
技術(shù)領(lǐng)域
熟知的化學(xué)方法全部或部分合成。例如參見Caruthers(1980)NucleicAcidsRes.Symp.Ser.215-223;Horn(1980)NucleicAcidsRes.Symp.Ser.225-232;Banga,A.K.,TherapeuticPeptidesandProteins,Formulation,ProcessingandDeliverySystems(1995)TechnomicPublishingCo.,Lancaster,PA。例如,肽合成可以使25用各種固相技術(shù)進(jìn)行(例如參見Roberge(1995)Science269:202;Memfield(1997)MethodsEnzymol.289:3-13),自動(dòng)合成可以根據(jù)制造商提供的說明書來實(shí)施,例如使用ABI431A肽合成儀(PerkinElmer)。本發(fā)明的肽和多肽也可以是糖基化的,所述糖基化可以在翻譯后通過化學(xué)方法或者通過細(xì)胞的生物合成機(jī)制而加上,其中后者包括應(yīng)用已知的糖基化作用30基序,所述糖基化作用基序可以對(duì)于所述序列是天然的,或者是作為肽段而被加入的,或者是在核酸編碼序列中加入的。糖基化作用可以是O-連接的或者是N-連接的?!?404]本發(fā)明的肽和多肽,如以上所定義的,包括所有的"模擬物(mimetic)"和"肽模擬物(peptidomimetic)"形式。術(shù)語"模擬物"和"肽模擬物"是指具有35與本發(fā)明的多肽實(shí)質(zhì)上相同的結(jié)構(gòu)和/或功能特征的合成的化學(xué)化合物。該模擬物或者完全由合成的非天然的氨基酸類似物組成,或者是由部分天然的肽氨基酸和部分非天然的氨基酸類似物構(gòu)成的嵌合分子。所述模擬物也可以包括任意數(shù)量的天然氨基酸保守取代,只要這樣的取代本質(zhì)上不改變?cè)撃M物的結(jié)構(gòu)和/或活性。對(duì)于作為保守性變異體的本發(fā)明的多肽或一類本發(fā)明的多肽的成員(例如,具有與本發(fā)明的示例性序列具有大約50%或更高的序列同一性的成員),常規(guī)實(shí)驗(yàn)將可以確定一種模擬物是否在本發(fā)明的范圍內(nèi),艮P,其結(jié)構(gòu)和/或功能并沒有實(shí)質(zhì)上的5改變。因此,一方面,如果一種模擬組合物具有纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的活性,那么它在本發(fā)明的范圍內(nèi)。本發(fā)明的多肽模擬組合物可以包含非天然結(jié)構(gòu)成分的任何組合。在可供選擇的方面,本發(fā)明的模擬組合物包括以下三種結(jié)構(gòu)基團(tuán)中的一種或所有a)不是天然酰胺鍵("肽鍵")連接的殘基連接基團(tuán);b)取代天然發(fā)生的氨基酸殘基的非10天然殘基;或者c)誘導(dǎo)二級(jí)結(jié)構(gòu)擬態(tài)(mimicry)的殘基,B卩,可以誘導(dǎo)或者穩(wěn)定二級(jí)結(jié)構(gòu),如P轉(zhuǎn)角、y轉(zhuǎn)角、卩折疊、a螺旋構(gòu)象,以及類似的結(jié)構(gòu)。例如,當(dāng)本發(fā)明的多肽的所有殘基或者一些殘基通過非天然肽鍵的化學(xué)方式連接時(shí),該多肽可以作為模擬物來表征。各個(gè)肽模擬物殘基可以通過肽鍵、其它的化學(xué)鍵或者偶聯(lián)方式連接,如,通過戊二醛、N-羥基琥珀酰亞胺酯、雙功能馬來酰亞胺、15N,N'-二環(huán)己基碳二亞胺(DCC)或者N,N'-二異丙基碳二亞胺(DIC)連接??梢蕴娲鷤鹘y(tǒng)的酰胺鍵("肽鍵")連接的連接基團(tuán)包括,如,酮基亞甲基(如,-<:(=0)-0^-代替-C(-O)-NH-)、氨基亞甲基(CH2-NH)、次乙基、烯烴(CH=CH)、醚(CH2-0)、硫醚(CH2-S)、四唑(CN4-)、噻唑、逆酰胺(retroamide)、硫代酰胺或者酯(參見女口,Spatola(1983)在ChemistryandBiochemistryofAminoAcids,Peptidesand20Proteins,第7巻,267-357頁,"P印tideBackboneModifications"MarcellDekker,NY)。本發(fā)明的多肽也可以通過含有全部或者部分替代了天然發(fā)生的氨基酸殘基的非天然氨基酸殘基而被表征為模擬物。在科學(xué)和專利文獻(xiàn)中描述了非天然的殘基;作為天然氨基酸殘基的模擬物的一些典型的非天然化合物及指導(dǎo)在下面有25描述。芳香族氨基酸的模擬物可以通過用以下的取代來產(chǎn)生,如,D-或L-萘基丙氨酸;D-或L-苯基甘氨基,D-或L-2thieneyl丙氨酸;D-或L-l,-2,3-或4-芘基丙氨酸;D-或L-3thieneyl丙氨酸;D-或L-(2-吡啶基)-丙氨酸;D-或L-(3-吡啶基)-丙氨酸;D-或L-(2-吡嗪基)-丙氨酸,D-或L-(4-異丙基)-苯基甘氨酸;D-(三氟甲基)-苯基甘氨酸;D-(三氟甲基)-苯基丙氨酸;D-p-氟-苯基丙氨酸;D-或L-p-二苯基苯30基丙氨酸;D-者L-p-甲氧基-二苯基苯基丙氨酸;D-或L-2-吲哚(烷基)丙氨酸;和,D-或L-烷基丙氨酸,其中的烷基可以是取代的或非取代的甲基、乙基、丙基、己基、丁基、戊基、異丙基、異丁基、仲異基(sec-isotyl)、異戊基或者非酸性氨基酸。非天然氨基酸的芳香環(huán)包括,如噻唑基、苯硫基、吡唑基、苯并咪唑基、萘基、呋喃基、吡咯基和吡啶基芳香環(huán)。35酸性氨基酸的模擬物可以通過用以下的取代來產(chǎn)生,如,保持有負(fù)電荷的非羧酸氨基酸;(膦?;?丙氨酸;硫酸化的蘇氨酸。羧基側(cè)鏈(如,天冬氨?;蛘吖劝滨;?也可以通過與碳二亞胺(R'-N-C-N-R')反應(yīng)進(jìn)行選擇性的修飾,所述碳二亞胺如l-環(huán)己基-3(2-嗎啉基-(4-乙基)碳二亞胺或者l-乙基-3(4-氮鏡4,4-二甲基戊基)碳二亞胺。天冬氨?;蛘吖劝滨;部梢酝ㄟ^與銨離子反應(yīng)轉(zhuǎn)化為天冬酰胺?;凸劝滨0孵;?。堿性氨基酸的模擬物可以通過用如,(除了賴氨酸和5精氨酸外)鳥氨酸、瓜氨酸、或者(胍基)-乙酸,或者(胍基)烷基-乙酸的取代產(chǎn)生,其中烷基如以上定義。腈衍生物(如,含有取代COOH的CN-部分)可以取代天冬酰胺或者谷氨酰胺。天冬酰胺?;凸劝滨0孵;梢悦摪被蔀橄鄳?yīng)的天冬氨?;蛘吖劝滨;?。精氨酸殘基模擬物可以通過精氨?;c例如一種或者多種常規(guī)試劑一方面在堿性的條件下反應(yīng)而產(chǎn)生,所述的常規(guī)試劑包括如苯乙二醛、102,3-丁二酮、1,2-環(huán)己二酮或者茚三酮。酪氨酸殘基模擬物可以通過酪氨?;c例如芳香重氮化合物或者四硝基甲垸反應(yīng)而產(chǎn)生。N-acetylimidizol和四硝基甲烷可以分別用于形成O-乙?;野滨N镔|(zhì)和3-硝基衍生物。半胱氨酸殘基模擬物可以通過半胱氨酰殘基與例如a-離素乙酸例如2-氯乙酸或者氯乙酰胺和相應(yīng)的胺反應(yīng)而產(chǎn)生;得到羧甲基或者羧酰胺甲基衍生物。半胱氨酸殘基模擬物也可以通過半15胱氨酰殘基與例如溴代-三氟丙酮、a-溴-l3-(5-imidozoyl)丙酸;氯乙酰磷酸、N-烷基馬來酰亞胺、3-硝基-2-吡啶基二硫化物;甲基2-吡啶基二硫化物;p-氯汞苯甲酸鹽;2-氯滎-4硝基苯酚,或者,氯-7-硝基苯并-氧雜-l,3-二唑反應(yīng)而產(chǎn)生。可以通過賴氨?;c例如琥珀酸或者其它的羧酸酸酐反應(yīng)而產(chǎn)生賴氨酸模擬物(和改變氨基末端殘基)。賴氨酸和其它的含有a-氨基的殘基模擬物也可以通過與亞氨酸酯20例如methylpicolinimidate、磷酸吡哆醛、吡哆醛、氯硼氫化物、三硝基-苯磺酸、O-甲基異脲、2,4,戊二酮的反應(yīng),和與乙醛酸的轉(zhuǎn)酰胺基酶催化的反應(yīng)而產(chǎn)生。甲硫氨酸的模擬物可以通過與例如甲硫氨酸亞砜反應(yīng)而產(chǎn)生。脯氨酸的模擬物包括,例如,2-哌啶酸、四氫噻唑羧酸、3-或4-羥脯氨酸、脫氫脯氨酸、3-或4-甲基脯氨酸,或者3,3,-二甲基脯氨酸。組氨酸殘基模擬物可以通過組氨?;c例如二乙基25原碳酸酯或?qū)︿灞郊柞<谆寤锓磻?yīng)而產(chǎn)生。其它的模擬物包括,例如,由脯氨酸和賴氨酸的羥基化作用產(chǎn)生的模擬物;由絲氨?;蛘咛K氨酰的羥基的磷酸化作用產(chǎn)生的模擬物;由賴氨酸、精氨酸和組氨酸的a氨基基團(tuán)的甲基化作用產(chǎn)生的模擬物;由N-末端胺的乙?;饔枚a(chǎn)生的模擬物;由主鏈酰胺殘基的甲基化或用N-甲基氨基酸取代而產(chǎn)生的模擬物;或者,由C-末端羧基的酰胺化而產(chǎn)生的30模擬物。—方面,本發(fā)明的多肽的殘基例如氨基酸也可以用相反手性的氨基酸(或者肽模擬物殘基)替代。一方面,任何天然發(fā)生的L-構(gòu)型(也可以被稱為R或者S,取決于化學(xué)實(shí)體的結(jié)構(gòu))的任何氨基酸都可用相同化學(xué)結(jié)構(gòu)類型但是具有相反手性的氨基酸或者肽模擬物替代,相反手性的氨基酸稱為D-氨基酸,但也可以稱35R-或者S-型。本發(fā)明也提供了通過天然過程,如,翻譯后加工(如,磷酸化,?;约邦愃谱饔?或者通過化學(xué)修飾技術(shù)來修飾本發(fā)明的多肽的方法,以及得到的被修飾的多肽。修飾可以發(fā)生在所述多肽的任何地方,包括肽骨架、氨基酸側(cè)鏈和氨基端或者羧基端。可以理解,相同類型的修飾可以在已知的多肽中以相同的或者不同的水平在幾個(gè)位點(diǎn)處發(fā)生。一個(gè)給定的多肽也可以具有很多類型的修飾。一5方面,修飾包括乙?;?、?;饔?、ADP-核糖基化作用、酰胺化作用、共價(jià)連接核黃素、共價(jià)連接血紅素組分、共價(jià)連接核苷酸或核苷酸衍生物、共價(jià)連接脂質(zhì)或脂質(zhì)衍生物、共價(jià)連接磷脂酰肌醇、交聯(lián)的環(huán)化作用、形成二硫鍵、去甲基作用、形成共價(jià)交聯(lián)、形成半胱氨酸、形成焦谷氨酸、甲?;饔?、,羧化作用、糖基化作用、形成GPI錨、羥基化作用、碘化作用、甲基化作用、肉豆蔻?;?0作用、氧化作用、聚乙二醇化、蛋白水解處理、磷酸化作用、異戊烯作用、外消旋作用、硒化作用、硫酸鹽化作用,和轉(zhuǎn)移RNA介導(dǎo)氨基酸添加到蛋白質(zhì)中,如精氨酰化。參見,如,Creighton,T.E.,Proteins-StructureandMolecularProperties2ndEd.,W.H.Freeman禾口Company,NewYork(1993);PosttranslationalCovalentModificationofProteins,B.C.Johnson,Ed.,AcademicPress,NewYork,11-12頁15(1983)。固相化學(xué)肽合成方法也可以用于合成本發(fā)明的多肽或者片段。這樣的方法自二十世紀(jì)六十年代早期起就是本領(lǐng)域已知的方法(Merrifield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)(也參見Stewart,J.M.和Young,J.D.,SolidPhasePeptideSynthesis,第二版,PierceChemicalCo.,Rockford,III,11-12頁),并且這些方20法近來已經(jīng)可以通過商業(yè)上可獲得的實(shí)驗(yàn)室肽設(shè)計(jì)和合成試劑盒(CambridgeResearchBiochemicals)而被應(yīng)用。這樣的商業(yè)上可獲得的實(shí)驗(yàn)室試劑盒一般是利用H.M.Geysen等,Proc.Natl.Acad.Sci.,USA,81:3998(1984)的方法,它們讓肽合成在多個(gè)"桿(rods)"或者"釘(pins)"的頂端進(jìn)行,而所有的"桿"或者"釘"都被連接到一塊板上。當(dāng)使用這樣的系統(tǒng)時(shí),一個(gè)板的桿或者釘被倒轉(zhuǎn)并插入到25另一個(gè)板的相應(yīng)孔或者貯存器中,所述孔或者貯存器含有用于將一種適合的氨基酸附著或固定在桿或釘?shù)捻敹说娜芤?。通過重復(fù)這樣的處理步驟,即是,反轉(zhuǎn)和插入所述桿和釘?shù)捻敹酥吝m當(dāng)?shù)娜芤褐?,將氨基酸?gòu)建成所要的肽。此外,大量的可利用的FMOC肽合成系統(tǒng)是可利用的。例如,應(yīng)用AppliedBiosystems,Inc.的Model431A自動(dòng)肽合成儀可以在固體支持物上裝配多肽或者片段。這些設(shè)備30使得本發(fā)明的肽容易獲得,或者通過直接的合成或者通過用其它已知的技術(shù)將一系列片段偶聯(lián)起來的合成。本發(fā)明的多肽包括活性或非活性形式的纖維素酶,例如,內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶。例如,本發(fā)明的多肽包括在"成熟"或例如通過蛋白原加工酶如蛋白原轉(zhuǎn)化酶來產(chǎn)生"活性"的成熟蛋白來加工35前原序列之前的蛋白原。本發(fā)明的多肽包括由于其它原因而不具有活性的纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,所述其它原因例如在通過翻譯后加工事件諸如內(nèi)切或外切肽酶或蛋白酶作用、磷酸化事件、酰胺化、糖基化或硫酸化或二聚化事件等等進(jìn)行"活化"之前。本發(fā)明的多肽包括所有的活性形式,包括酶的活性子序列,例如,催化結(jié)構(gòu)域或活性位點(diǎn)。本發(fā)明包括固定化的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚5糖酶和/或P-葡糖苷酶,抗纖維素酶抗體如抗內(nèi)切葡聚糖酶抗體、抗纖維二糖水解酶抗體、抗甘露聚糖酶抗體和/或抗P-葡糖苷酶抗體及其片段。本發(fā)明提供了抑制纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的方法,例如使用本發(fā)明的顯性負(fù)突變體或抗纖維素酶抗體,如抗內(nèi)切葡聚糖酶抗體、抗纖維二糖水解酶抗體、抗甘露聚糖酶抗體和/或抗卩-葡糖苷酶抗體。本發(fā)明10包括含有本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的雜合物(異源復(fù)合物),例如融合蛋白、異二聚體等等。本發(fā)明的多肽可以在多種不同的條件下具有纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,例如極端pH和/或溫度、氧化劑以及類似的條件。本發(fā)明提供了產(chǎn)生可供選擇的纖維素酶如內(nèi)切葡聚糖酶、纖15維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶制劑的方法,所述制劑具有不同的催化效率和穩(wěn)定性,例如針對(duì)溫度、氧化劑和改變洗滌條件。一方面,纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶變異體可以使用定點(diǎn)誘變和/或隨機(jī)誘變的技術(shù)來產(chǎn)生。一方面,定向進(jìn)化可以被用來產(chǎn)生大量不同的具有可供選擇的特異性和穩(wěn)定性的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、20甘露聚糖酶和/或P-葡糖苷酶變異體。本發(fā)明的蛋白也可用作研究試劑,以鑒定纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的調(diào)節(jié)物,例如纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的激活劑或抑制劑。簡單的說,將測試樣品(化合物、培養(yǎng)液、提取物和類似物)加入到纖維素酶如內(nèi)切25葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶測定中,以確定它們抑制底物切割的能力。用該方式鑒定的抑制劑可用于工業(yè)和研究中,以減少或阻止不期望的蛋白水解。如同纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的情況,抑制劑可以被組合以增加活性譜。本發(fā)明的酶也可用作消化蛋白質(zhì)的研究試劑或用在蛋白測序中。例如,為30了使用例如自動(dòng)測序儀進(jìn)行測序,可以使用纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶將多肽破碎成更小的片段。本發(fā)明的另一個(gè)方面是用于鑒定本發(fā)明的片段或變異體的分析方法,所述本發(fā)明的片段或變異體保留了本發(fā)明的的多肽的酶功能。例如,所述多肽的片段20或變異體可用來催化生物化學(xué)反應(yīng),這樣的反應(yīng)表明所述片段或變異體保留了本發(fā)明的多肽的酶活性。確定變體或片段是否保留本發(fā)明的多肽的酶活性的示例性測定方法包括下面的步驟將多肽片段或變異體與底物分子在允許該多肽片段或變異體發(fā)揮作用的條件下接觸,并檢測底物水平的降低或該多肽和底物之間反應(yīng)的特異反應(yīng)產(chǎn)物水平的增加。25本發(fā)明開發(fā)了酶的獨(dú)特的催化性質(zhì)。鑒于生物催化劑(即,純化的或者粗制的酶,非存活的或者存活的細(xì)胞)在化學(xué)轉(zhuǎn)化中的應(yīng)用一般需要確定與特定的起始化合物反應(yīng)的特定的生物催化劑,本發(fā)明應(yīng)用的經(jīng)選擇的生物催化劑和反應(yīng)條件是對(duì)于存在于很多起始化合物如小分子中的功能基團(tuán)具有特異性的。每種生物催化劑對(duì)于一種功能基團(tuán)或者幾種相關(guān)的功能基團(tuán)是特異的,并且可以和含有30這一功能基團(tuán)的許多起始化合物反應(yīng)。生物催化反應(yīng)可以從單一的起始化合物生產(chǎn)出一個(gè)群體的衍生物。這些衍生物可以進(jìn)行另一輪的生物催化反應(yīng)來產(chǎn)生又一個(gè)群體的衍生化合物。通過生物催化的衍生作用的每一次迭代可以產(chǎn)生起始化合物的數(shù)千種變化。酶可以在起始化合物的特定位點(diǎn)發(fā)生反應(yīng)而不影響分子的其它部分,該過35程通過傳統(tǒng)的化學(xué)方法很難實(shí)現(xiàn)。這種高度的生物催化特異性提供了用于在文庫中鑒定單個(gè)活性化合物的方法。該文庫是通過用于產(chǎn)生該文庫的一系列生物催化反應(yīng)來表征,這也稱為"生物合成歷史"。對(duì)該文庫的生物活性的篩選和對(duì)生物合成歷史的追蹤確定出產(chǎn)生活性化合物的特定反應(yīng)順序。重復(fù)該反應(yīng)順序,并確認(rèn)合成出的化合物的結(jié)構(gòu)。這種確認(rèn)方式,不同于其它的合成和篩選方法,并不需要固定化技術(shù),化合物可以利用實(shí)際上任何類型的篩選分析在溶液中自由合成和5測試。重要的是,注意到酶反應(yīng)在功能基團(tuán)上的高度特異性允許"追蹤"特定的酶促反應(yīng),由所述酶促反應(yīng)制備出了生物催化產(chǎn)生的文庫。—方面,許多程序化的步驟可使用自動(dòng)化機(jī)器人來實(shí)施,這使得每天可執(zhí)行數(shù)千個(gè)生物催化反應(yīng)和篩選分析,并保證高水平的準(zhǔn)確性和可重復(fù)性。自動(dòng)化機(jī)器人也可用于篩選纖維素酶活性,以確定多肽是否在本發(fā)明的范圍內(nèi)。結(jié)果,10—方面,在幾周內(nèi)便產(chǎn)生了衍生化合物的文庫,而采用"傳統(tǒng)"的化學(xué)或酶促篩選方法則需要幾年的時(shí)間。在一個(gè)特定的方面,本發(fā)明提供了修飾小分子的方法,包括將在此所述的由多核苷酸編碼的多肽或其酶活性片段與小分子接觸,產(chǎn)生修飾的小分子。檢測被修飾的小分子的文庫以確定顯示出所需活性的修飾小分子是否存在于文庫內(nèi)。15產(chǎn)生具有所需活性的修飾小分子的特異性生物催化反應(yīng)的鑒定可通過系統(tǒng)性地去除用來產(chǎn)生一部分文庫的每個(gè)生物催化反應(yīng),然后檢測在這一部分文庫中產(chǎn)生的小分子是否存在具有所需活性的修飾小分子。產(chǎn)生具有所需活性的修飾小分子的特異生物催化反應(yīng)可任選地被重復(fù)。生物催化反應(yīng)可用一組生物催化劑來進(jìn)行,它們可與在小分子的結(jié)構(gòu)中發(fā)現(xiàn)的各種不同結(jié)構(gòu)部分反應(yīng),每個(gè)生物催化劑對(duì)一20個(gè)結(jié)構(gòu)部分或一組相關(guān)的結(jié)構(gòu)部分是特異的;每個(gè)生物催化劑可與含有各種不同的結(jié)構(gòu)部分的許多不同的小分子反應(yīng)。勞録艨射娜覆総雜二蘑蕭麟/雞薪薪雜虔號(hào)艦歸翁鄉(xiāng)雌眾薪雌25本發(fā)明提供了纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶信號(hào)序列(例如信號(hào)肽(SPs))、前原(prepro)結(jié)構(gòu)域和催化結(jié)構(gòu)域(CDs)。本發(fā)明的SPs、前原結(jié)構(gòu)域和/或CDs可以是分離的或重組的肽或可以是融合蛋白的一部分,例如作為嵌合蛋白中的異源結(jié)構(gòu)域。本發(fā)明提供了編碼這些催化結(jié)構(gòu)域(CDs)、前原結(jié)構(gòu)域和信號(hào)序列(SPs,例如具有包括本發(fā)明的多肽30的氨基末端殘基或由本發(fā)明的多肽的氨基末端殘基組成的序列的肽)的核酸。本發(fā)明提供了分離或重組的信號(hào)序列(例如,信號(hào)肽),該信號(hào)序列包括下列序列或由下列序列組成,所述序列如本發(fā)明的多肽的殘基1到14、1到15、1到16、1到17、1到18、1到19、1到20、1到21、1到22、1到23、1到24、1到25、l至lj26、1到27、1到28、1到28、1到30、1到31、1到32、1到33、135到34、1到35、1到36、1到37、1到38、1到39、1到40、1到41、1到42、1到43、1到44、1到45、1到46或1到47或更多殘基所示的序列,本發(fā)明多肽例如,本發(fā)明的示例性多肽,也參見表3、下面的實(shí)施例1和4以及序列表。例如,上面的表3示出了本發(fā)明的示例性信號(hào)(前導(dǎo))序列,例如,對(duì)于具有如SEQIDNO:164所示序列的多肽——其例如由SEQIDNO:163編碼,具有的信號(hào)序列含有氨基末端30個(gè)殘基(或由氨基末端30個(gè)殘基組成)或者具有下列序列或由下列5序列組成MSCRTLMSRRVGWGLLLWGGLFLRTGSVTG。其它的信號(hào)序列同樣列在表3中。—方面,本發(fā)明提供了信號(hào)序列,其包括本發(fā)明的多肽的前14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、1053、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多個(gè)氨基末端殘基。本發(fā)明包括具有和沒有信號(hào)序列和/或前原序列的多肽。本發(fā)明包括具有異源信號(hào)序列和/或原前序列的多肽。前原序列(包括用作異源前原結(jié)構(gòu)域的本發(fā)明序列)可以位于蛋白質(zhì)的氨基末端或羧基末端。本發(fā)明還包括分離或重組的含有15本發(fā)明序列的信號(hào)序列、前原序列和催化結(jié)構(gòu)域(例如,活性位點(diǎn))。所述含有本發(fā)明的信號(hào)序列的多肽可以是本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶,或另一種纖維素酶,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,或另一種或其它多肽。鑒定"前原"結(jié)構(gòu)域和信號(hào)序列的方法在本領(lǐng)域是熟知的,例如VandeVen(1993)Crit.Rev.20Oncog.4(2):115-136。例如,為了鑒定前原序列,從胞外空間純化出蛋白質(zhì),確定其N末端蛋白序列,并將其與未加工的形式進(jìn)行比較。本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶信號(hào)序列(SP)和/或前原序列可以是分離的或重組的肽,或與另一種纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶或非纖維25素酶如非內(nèi)切葡聚糖酶、非纖維二糖水解酶、非甘露聚糖酶和/或非P-葡糖苷酶多肽連接的序列,例如形成融合(嵌合)蛋白。在一個(gè)方面,本發(fā)明提供了含有本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶信號(hào)序列的多肽。在一個(gè)方面,含有本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶信號(hào)序列SP和/或前原序列的多肽包含與30本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶異源的序列(例如,含有本發(fā)明的SP和/或前原序列和來自另一種纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶或非纖維素酶如非內(nèi)切葡聚糖酶、非纖維二糖水解酶、非甘露聚糖酶和/或非P-葡糖苷酶蛋白的序列的融合蛋白)。在一個(gè)方面,本發(fā)明提供了具有異源SP和/或前原序列的本發(fā)明的纖35維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶,例如具有酵母信號(hào)序列的序列。本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶可以含有存在于載體例如pPIC系列載體(Invitrogen,Carlsbad,CA)中的異源SP和/或前原序列。在一個(gè)方面,本發(fā)明的SP和/或前原序列在鑒定出新的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶之后被鑒定出來。蛋白被5分選和轉(zhuǎn)運(yùn)至其正確的細(xì)胞位置的通路通常被稱為蛋白靶向通路(proteintargetingpathways)。在所有這些靶向系統(tǒng)中最重要的元件之一是新合成的多肽的氨基末端上的短的氨基酸序列,稱為信號(hào)序列。這種信號(hào)序列可指引蛋白至其在細(xì)胞中的適合位置,并在轉(zhuǎn)運(yùn)過程中或在蛋白到達(dá)其最終目的地時(shí)被去除。大多數(shù)的溶酶體蛋白、膜蛋白或分泌蛋白都具有氨基末端信號(hào)序列,這些信號(hào)序列標(biāo)示著它們10將轉(zhuǎn)位至內(nèi)質(zhì)網(wǎng)腔內(nèi)。信號(hào)序列的長度可以為從10至65或更多個(gè)氨基酸殘基。識(shí)別信號(hào)序列的各種方法對(duì)于本領(lǐng)域技術(shù)人員是已知的。例如,在一個(gè)方面,新的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的信號(hào)肽可通過稱為SignalP的方法來鑒定。SignalP應(yīng)用了既可識(shí)別信號(hào)肽,又可識(shí)別其裂解位點(diǎn)的組合神經(jīng)網(wǎng)絡(luò)。(Nielsen(l997),"Indentificationofprokaryoticand15eukaryoticsignalpeptidesandpredictionoftheircleavagesites"ProteinEngineering,巻10,1,1-6頁)。在一些方面,本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶沒有SP和/或前原序列,或"結(jié)構(gòu)域"。在一個(gè)方面,本發(fā)明提供了缺少所有或部分的SP和/或前原結(jié)構(gòu)域的本發(fā)明的纖維素酶如內(nèi)切葡聚20糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶。在一個(gè)方面,本發(fā)明提供了編碼來自一種纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶的信號(hào)序列(SP)和/或前原序列的核酸序列,其可操作地連接于一種不同的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸序列,或者,可選擇地,來自非纖維素酶如非內(nèi)切葡聚糖酶、非纖維二糖水25解酶、非甘露聚糖酶和/或非J3-葡糖苷酶蛋白的信號(hào)序列(SP)和/或前原結(jié)構(gòu)域可以是期望的。本發(fā)明也提供了分離出的或重組的多肽,其含有本發(fā)明的信號(hào)序列(SP)、前原結(jié)構(gòu)域和/或催化結(jié)構(gòu)域(CD)和異源序列。所述異源序列是與SP、前原結(jié)構(gòu)域和/或CD天然不相關(guān)的序列。與SP、前原結(jié)構(gòu)域和/或CD天然不相關(guān)的序列30可以在SP、前原結(jié)構(gòu)域和/或CD的氨基末端、羧基末端,和/或SP和/或CD的兩個(gè)末端上。在一個(gè)方面,本發(fā)明提供了分離出的或重組的多肽,其包括(或構(gòu)成于)含有本發(fā)明的信號(hào)序列(SP)、前原結(jié)構(gòu)域和/或催化結(jié)構(gòu)域(CD)的多肽,條件是它同與其天然相關(guān)的任何序列(例如,纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶序列)是不連接的。同樣,在一個(gè)方面,35本發(fā)明提供了編碼這些多肽的分離出的或重組的核酸。因此,在一個(gè)方面,本發(fā)明的分離出的或重組的核酸包括本發(fā)明的信號(hào)序列(SP)、前原結(jié)構(gòu)域和/或催化結(jié)構(gòu)域(CD)的編碼序列和異源序列(即,與信號(hào)序列(SP)、前原結(jié)構(gòu)域和/或催化結(jié)構(gòu)域(CD)天然不相關(guān)的序列)。異源序列可在SP、前原結(jié)構(gòu)域和/或CD編碼序列的3'末端、5'末端和/或兩個(gè)末端上。5染爻f詼^)^T^牽^^fii7^坊薪Jlg^艨、好鍵二薪j(luò)麻錄浙/或A-薪凝存艨浙嚴(yán)文庫—方面,本發(fā)明提供了包含本發(fā)明的序列的雜合纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶和融合蛋白,包括肽庫。本發(fā)明的肽庫可以用于分離目標(biāo)的肽調(diào)節(jié)物(如,激活物或者抑制物),如纖維素酶如10內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶底物、受體、酶。本發(fā)明的肽庫可以用于鑒定目標(biāo)的結(jié)合配偶,如,配體,例如,細(xì)胞因子、激素以及類似物。一方面,本發(fā)明提供了含有本發(fā)明的信號(hào)序列(SP)、前原序列和/或催化結(jié)構(gòu)域(CD)或其組合以及異源序列的嵌合蛋白質(zhì)(見上)?!矫?,本發(fā)明的融合蛋白(如,肽部分)是構(gòu)象穩(wěn)定的(相對(duì)于線形肽),15對(duì)靶標(biāo)具有更高的結(jié)合親和性。本發(fā)明提供了本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶與其它肽的融合,所述其它肽包括已知的肽和隨機(jī)的肽。它們可以以這樣一種方式融合,使得所述纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶的結(jié)構(gòu)沒有明顯地被擾舌L,并且該肽在代謝上或者結(jié)構(gòu)構(gòu)象上是穩(wěn)定的。這樣便允許獲得這樣的肽庫,20其在細(xì)胞內(nèi)的存在及其數(shù)量都是容易監(jiān)測的。本發(fā)明的氨基酸序列變異體可以通過該變異的預(yù)先確定的性質(zhì)來表征,所述的預(yù)先確定的性質(zhì)也就是將它們與天然發(fā)生的形式區(qū)分開的特征,所述的天然發(fā)生的形式例如纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶序列的等位基因的或者種間的變異。一方面,本發(fā)明的變異體表現(xiàn)出與25天然發(fā)生的類似物相同性質(zhì)的生物活性??蛇x擇地,可以選擇具有改變的特征的變異體。一方面,盡管引入氨基酸序列變化的位點(diǎn)或區(qū)域是預(yù)先決定的,但突變本身并不需要預(yù)先決定。例如,為了優(yōu)化在一個(gè)給定位點(diǎn)出現(xiàn)的突變所帶來的性能,可以在目標(biāo)密碼子或者區(qū)域進(jìn)行隨機(jī)誘變,并篩選被表達(dá)的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶變異體,以尋找所需活30性的優(yōu)化組合。在具有已知序列的DNA的預(yù)先決定的位點(diǎn)產(chǎn)生取代突變的技術(shù)是己熟知的,正如在此討論的,例如,M13引物誘變和PCR誘變。突變體的篩選可以通過應(yīng)用例如葡聚糖水解分析來進(jìn)行。在可供選擇的方面,氨基酸取代可以是單個(gè)殘基;插入可以是大約1到20個(gè)氨基酸的水平,盡管可以插入相當(dāng)大的片段。缺失的范圍可以是大約1到大約20、30、40、50、60、70個(gè)殘基或者更多。為了35得到具有優(yōu)化性質(zhì)的最終衍生物,替代、缺失、插入或者它們的任何組合都可以被應(yīng)用。一般地,這些變化是在為數(shù)不多的氨基酸上進(jìn)行,以使分子的改變最小化。然而,在某些情況下,可以容忍更大的改變。本發(fā)明提供了纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,其中多肽骨架的結(jié)構(gòu)、二級(jí)結(jié)構(gòu)或三級(jí)結(jié)構(gòu),例如,a螺旋或P折疊結(jié)構(gòu),已被修飾。一方面,電荷或疏水性已被修飾。一方面,側(cè)鏈基團(tuán)已被5修飾。通過選擇較不保守的取代來產(chǎn)生功能或免疫性的實(shí)質(zhì)變化。例如,可以進(jìn)行這樣的取代,它們將更加顯著地影響發(fā)生變化的區(qū)域的多肽骨架的結(jié)構(gòu),例如a螺旋或(3折疊結(jié)構(gòu);分子的電荷或疏水位點(diǎn),其可以是活性位點(diǎn);或側(cè)鏈。本發(fā)明提供在本發(fā)明的多肽中的取代,其中(a)親水殘基,例如絲氨?;蛱K氨酰,被疏水殘基例如亮氨酰、異亮氨酰、苯基丙氨酰、纈氨?;虮滨H〈蛘呦?0反;(b)半胱氨酸或脯氨酸被任何別的殘基取代,或者相反;(C)具有正電性側(cè)鏈的殘基,例如賴氨酰、精氨?;蚪M氨酰被帶負(fù)電的殘基例如谷氨?;蛱於滨H〈蛘呦喾?;或者(d)具有大體積側(cè)鏈的基團(tuán),例如苯丙氨酸,被不具側(cè)鏈的氨基酸例如甘氨酸取代,或者相反。所述變異體可以表現(xiàn)出相同性質(zhì)的生物學(xué)活性(即,纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖15苷酶活性),盡管變異體可經(jīng)選擇來按需改變纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的特征?!矫?,本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或j3-葡糖苷酶包括表位(epitopes)或者純化標(biāo)記、信號(hào)序列或其它的融合序歹ij,等。在一方面,本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露20聚糖酶和/或p-葡糖苷酶可以與隨機(jī)的肽融合,形成融合多肽。"融合"或者"可操作地連接"在此是指隨機(jī)肽和纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶連接在一起,其連接方式最小化了對(duì)纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的結(jié)構(gòu)的穩(wěn)定性的破壞,例如,其仍保持纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡25糖苷酶活性。所述的融合多肽(或者編碼該融合多肽的融合多核苷酸)還可以包含進(jìn)一歩的成分,包括在多個(gè)環(huán)(multipleloops)處的多個(gè)肽?!矫妫鲭暮途幋a它們的核酸被隨機(jī)化,或者是被完全隨機(jī)化的,或者是在它們的隨機(jī)化中有偏向,例如,在核苷酸/殘基的總的頻率或者每個(gè)位置處的頻率方面有偏向。"隨機(jī)化"是指每一核酸和肽分別由實(shí)質(zhì)上隨機(jī)的核苷酸和氨30基酸組成。一方面,產(chǎn)生所述肽的所述核酸可以化學(xué)合成,從而可以在任何位置整合進(jìn)任何核苷酸。因此,當(dāng)所述核酸被表達(dá)而形成肽時(shí),任何氨基酸殘基可以整合進(jìn)任何位置??梢栽O(shè)計(jì)合成過程來產(chǎn)生隨機(jī)化的核酸,從而允許在所述核酸的長度范圍內(nèi)形成所有的或大多數(shù)的可能組合,由此形成隨機(jī)核酸文庫。該文庫可以提供足量的結(jié)構(gòu)多樣的隨機(jī)化表達(dá)產(chǎn)物群體,可以獲得概率上充分的細(xì)胞響35應(yīng)范圍,從而可以提供一種或多種表現(xiàn)出所需響應(yīng)的細(xì)胞。因此,本發(fā)明提供了一個(gè)足夠大的相互作用文庫,這樣,其成員中的至少一個(gè)將具有使其對(duì)于一些分子、蛋白或者其他因子具有親和性的結(jié)構(gòu)?!矫妫景l(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶是多結(jié)構(gòu)域的酶,其包括信號(hào)肽、糖類結(jié)合模塊(module)、纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶催化結(jié)構(gòu)5域、連接子(linker)和/或另一個(gè)催化結(jié)構(gòu)域。本發(fā)明提供了產(chǎn)生可以編碼生物學(xué)活性雜合多肽(例如,雜合纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酵)的嵌合多肽的方法和序列。在一個(gè)方面,原始的多核苷酸(例如,本發(fā)明的示例性核酸)編碼生物學(xué)活性的多肽。一方面,本發(fā)明的方法通過利用細(xì)胞內(nèi)過程產(chǎn)生了新的雜合多10肽,所述的細(xì)胞內(nèi)過程可整合原始多核苷酸序列,這樣,得到的雜合多核苷酸編碼證明具有源自但不同于原始生物學(xué)活性多肽的活性的多肽(例如,本發(fā)明的纖維素酶或抗體)。例如,原始的多核苷酸可以編碼來自或發(fā)現(xiàn)于不同微生物的特定酶(例如,纖維素酶)。由來自一個(gè)生物體或變異體的第一多核苷酸編碼的酶可以,例如,在特殊的環(huán)境條件下,例如,高鹽條件下,有效地發(fā)揮功能。來自不同生15物體或變異體的第二多核苷酸編碼的酶可在不同的環(huán)境條件下,如超高溫條件下,有效地發(fā)揮功能。含有來自第一和第二原始多核苷酸的序列的雜合多核苷酸編碼的酶可以顯示了原始多核苷酸編碼的兩種酶的特性。因此,本發(fā)明的雜合多核苷酸編碼的酶可在第一和第二多核苷酸編碼的酶所共有的環(huán)境條件下,例如高鹽和極端溫度下,有效地發(fā)揮功能。20—方面,由本發(fā)明的方法得到的雜合多肽可顯示出在原始酶中不具有的特殊酶活性。例如,在編碼纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的多核苷酸重組和/或進(jìn)行還原性重配后,從得到的由雜合多核苷酸編碼的雜合多肽中可篩選出由各個(gè)原始酶獲得的特異非纖維素酶例如非內(nèi)切葡聚糖酶、非纖維二糖水解酶、非甘露聚糖酶和/或非P-葡糖苷酶活性,例如,水25解酶、肽酶、磷酸化酶等活性。一方面,雜合多肽被篩選以確定那些可區(qū)分雜合多肽和原始親本多肽的化學(xué)功能性,如雜合多肽發(fā)揮作用的溫度、pH或鹽濃度?!矫?,本發(fā)明涉及一種用于產(chǎn)生具有生物活性的雜合多肽以及篩選具有更高活性的多肽的方法,通過1)以可操縱的連接導(dǎo)入至少第一多聚核苷酸和以可操縱的連接導(dǎo)入至少第二30多聚核苷酸到合適的宿主細(xì)胞,所述的至少第一多聚核苷酸和第二多聚核苷酸共有具有部分的序列同源性的至少一個(gè)區(qū)域;2)在促進(jìn)序列再組織的條件下培養(yǎng)宿主細(xì)胞,得到可操縱連接的雜合多核苷酸;3)表達(dá)由所述雜合多核苷酸編碼的雜合多肽;354)在有利于鑒定增強(qiáng)的生物活性的條件下篩選所述的雜合多肽;和5)分離編碼該雜合多肽的多核苷酸。分離和發(fā)現(xiàn)纖維素酶本發(fā)明提供了分離和發(fā)現(xiàn)纖維素酶例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶以及編碼它們的核酸的方法。多核苷酸或酶可以分離5自個(gè)體生物體("分離物")、己經(jīng)生長在成分確定的培養(yǎng)基中的生物體收集物("富集培養(yǎng)物"),或者未經(jīng)培養(yǎng)的生物體("環(huán)境樣品")。生物體可以通過例如體內(nèi)生物淘選進(jìn)行分離(參見下面的討論)。應(yīng)用不依賴于培養(yǎng)物的方法從環(huán)境樣品獲得編碼新的生物活性的多核苷酸是最優(yōu)選的,因?yàn)檫@樣便可接觸到具有生物多樣性的原始來源。多核苷酸或酶也可以分離自許多生物體的任何一種,例如細(xì)菌。除10了全細(xì)胞之外,多核苷酸或酶也可以分離自來源于這些生物體例如細(xì)菌的培養(yǎng)物的粗酶制劑。"環(huán)境文庫"可以從環(huán)境樣品中獲得,其代表天然發(fā)生的生物體的基因組集合,這些"環(huán)境文庫"可以用克隆載體完成,所述克隆載體可以在適合的原核宿主中擴(kuò)增繁殖。因?yàn)楸豢寺〉腄NA起初是直接從環(huán)境樣品中提取的,所以所述15文庫并不限于可以在純培養(yǎng)物中生長的小部分原核生物。另外,存在于這些樣品中的來自環(huán)境的DNA的標(biāo)準(zhǔn)化使其可以更加公正地代表存在于原始樣品的所有物種的DNA。這可以大大增加從所述樣品的次要組成中發(fā)現(xiàn)令人感興趣的基因的效率,所述次要組成與優(yōu)勢種相比,其所占的量可能小幾個(gè)數(shù)量級(jí)?!矫?,從一個(gè)或者多個(gè)未經(jīng)培養(yǎng)的微生物中獲得的基因文庫被篩選以發(fā)20現(xiàn)感興趣的活性。編碼感興趣的生物活性分子的潛在途徑首先在原核細(xì)胞中以基因表達(dá)文庫的形式捕獲。一方面,編碼令人感興趣的活性的多核苷酸從這樣的文庫中分離出來并導(dǎo)入到宿主細(xì)胞中。該宿主細(xì)胞在促進(jìn)重組和/或還原性重配的條件下生長,產(chǎn)生潛在的具有新的或者增強(qiáng)的活性的生物分子??衫没贔ACS和基于非光學(xué)(例如,磁性)的儀器進(jìn)行體內(nèi)生物淘選。25—方面,用載體構(gòu)建復(fù)雜基因文庫,所述載體含有穩(wěn)定轉(zhuǎn)錄的RNA的元件。例如,含有這樣的序列將用于增強(qiáng)RNA的穩(wěn)定性,從而增加它們?cè)诩?xì)胞中的半衰期,所述序列形成二級(jí)結(jié)構(gòu),例如發(fā)夾結(jié)構(gòu),其被設(shè)計(jì)來位于轉(zhuǎn)錄的RNA區(qū)的側(cè)翼。用于生物淘選過程中的探針分子由用報(bào)告分子標(biāo)記的寡核苷酸組成,所述報(bào)告分子僅在探針與靶分子結(jié)合后發(fā)熒光。使用幾種轉(zhuǎn)化技術(shù)的一種,這些探針被引入文30庫中的重組細(xì)胞。所述探針分子結(jié)合到轉(zhuǎn)錄的靶mRNA,得到DNA/RNA異源雙鏈體分子。探針與靶標(biāo)結(jié)合將產(chǎn)生熒光信號(hào),該信號(hào)在篩選過程期間用FACS儀器檢測和分選?!矫妫蛇M(jìn)行亞克隆以進(jìn)一步分離感興趣的序列。在亞克隆中,DNA的一部分被擴(kuò)增、消化——通常是通過限制性酶——以剪切所需的序列,所需的35序列被連接進(jìn)接受載體中,并被擴(kuò)增。在亞克隆的每個(gè)步驟中,該部分被檢測感興趣的活性,以保證編碼結(jié)構(gòu)蛋白的DNA不被排除。插入物可在亞克隆的任何步驟中被純化,例如在連接入載體之前通過凝膠電泳,或在含有接受載體的細(xì)胞和不含有接受載體的細(xì)胞被置于選擇性培養(yǎng)基中時(shí),所述培養(yǎng)基含有例如抗生素,其可殺死不含有接受載體的細(xì)胞。將cDNA插入物亞克隆進(jìn)載體中的具體方法在本領(lǐng)域中是為人所熟知的(Sambrook等人,MolecularCloning:ALaboratory5Mannual,第二版,ColdSpringHarborLaboratoryPress(1989))。在另一個(gè)方面,本發(fā)明的酶是亞克隆。這種亞克隆與親代克隆的差別在于,例如,長度、突變、標(biāo)志物(tag)或標(biāo)記(label)??梢园l(fā)現(xiàn)、分離或制備所述多核苷酸的微生物包括原核微生物如真細(xì)菌和古細(xì)菌,低等真核微生物如真菌、一些藻和原生動(dòng)物。多核苷酸可以是發(fā)現(xiàn)于、10分離自或制備于環(huán)境樣品,在這種情況下,核酸被回收而不需培養(yǎng)某一種生物體,或者是從一種或者多種培養(yǎng)的生物中回收。在一方面,這樣的微生物可以是適于極端環(huán)境的,如,嗜高溫的、嗜冷的、冷育的、嗜鹽的、嗜壓的和嗜酸的。編碼從極端微生物中分離出來的酶的多核苷酸可以被應(yīng)用。本發(fā)明的酶可以超過100'C的溫度有作用,例如在地表溫泉和深海的熱火山口發(fā)現(xiàn)的那些,或者在低于O'C的15溫度有作用,例如在北極水域中發(fā)現(xiàn)的那些,在飽和的鹽環(huán)境下有作用,例如在死海中發(fā)現(xiàn)的那些,在pH值在0附近起作用,例如在煤層沉積物和地?zé)岣涣虻V泉中發(fā)現(xiàn)的那些,或者在pH值超過11下起作用,例如在污水污泥中發(fā)現(xiàn)的那些。一方面,本發(fā)明的酶在很寬的溫度和pH范圍內(nèi)表現(xiàn)出高活性。如上所述的選擇和分離的多核苷酸被導(dǎo)入進(jìn)合適的宿主細(xì)胞中。合適的宿20主細(xì)胞是能夠促進(jìn)重組和/或還原性重配的任何細(xì)胞。被選擇的多核苷酸一方面已經(jīng)在包括有合適的控制序列的載體中。宿主細(xì)胞可以是高等的真核細(xì)胞,如哺乳動(dòng)物細(xì)胞,或低等真核細(xì)胞,如酵母細(xì)胞,或一方面,宿主細(xì)胞可以是原核細(xì)胞,如細(xì)菌細(xì)胞。將構(gòu)建物導(dǎo)入宿主細(xì)胞可通過磷酸鈣轉(zhuǎn)染、DEAE-葡聚糖介導(dǎo)的轉(zhuǎn)染,或電穿孔來實(shí)現(xiàn)。25示例性的宿主包括細(xì)菌細(xì)胞,如大腸桿菌、鏈霉菌、鼠傷寒沙門氏菌;真菌細(xì)胞,如酵母;昆蟲細(xì)胞如果蠅S2和草地夜蛾Sy9;動(dòng)物細(xì)胞如CHO、COS或者黑色素瘤細(xì)胞;腺病毒和植物細(xì)胞;參見上面的討論。通過本文的教導(dǎo),選擇適合的宿主被認(rèn)為是在本領(lǐng)域技術(shù)人員已知的范圍內(nèi)。各種哺乳動(dòng)物細(xì)胞培養(yǎng)系統(tǒng)可以用于表達(dá)重組蛋白;哺乳動(dòng)物表達(dá)系統(tǒng)的30例子包括猴腎纖維原細(xì)胞的COS-7細(xì)胞系,其在"SV40-transformedsimiancellss叩portthereplicationofearlySV40mutants"(Gluzman,1981)中有說明,禾卩其它的可以表達(dá)相容性載體的細(xì)胞系,例如,C127、3T3、CHO、HeLa和BHK細(xì)胞系。哺乳動(dòng)物表達(dá)載體將包括復(fù)制起點(diǎn)、合適的啟動(dòng)子和增強(qiáng)子,以及任何必要的核糖體結(jié)合位點(diǎn)、多聚腺苷酸化的位點(diǎn)、剪接供體和受體位點(diǎn)、轉(zhuǎn)錄終止序列,35以及5'側(cè)翼的非轉(zhuǎn)錄序列。源于SV40剪接的DNA序列和多聚腺苷酸化的位點(diǎn)可以用于提供所需的非轉(zhuǎn)錄的遺傳學(xué)元件。另一方面,本發(fā)明的核酸、多肽和方法可以用于生物化學(xué)途徑中,或用于產(chǎn)生編碼來自一個(gè)或者多個(gè)操縱子或者基因簇或者其中的部分的生物化學(xué)途徑的新的多核苷酸。例如,細(xì)菌和很多真核生物具有用于調(diào)控基因的協(xié)作機(jī)制,所述基因的產(chǎn)物涉及相關(guān)的過程?;虺纱嘏帕性趩我蝗旧w上,在結(jié)構(gòu)上稱為"基5因簇",它們?cè)趩蝹€(gè)調(diào)控序列的控制下一起轉(zhuǎn)錄,所述調(diào)控序列包括起始整個(gè)簇的轉(zhuǎn)錄的單個(gè)啟動(dòng)子。因此,基因簇是指一組或者相同或者相關(guān)的相鄰基因,一般是指功能上相關(guān)的鄰近的基因(通過基因簇編碼的生物化學(xué)途徑的一個(gè)例子是聚酮化合物(polyketides))。—方面,基因簇DNA可以從不同的生物體中分離出來并且連接到載體中,10尤其是含有表達(dá)調(diào)控序列的載體,所述表達(dá)控制序列可以控制和調(diào)控可檢測蛋白或者來自連接在一起的基因簇的蛋白相關(guān)系列活性的產(chǎn)生。對(duì)于外源DNA引入具有非常大的容量的載體特別適合用于這樣的基因簇的情況,在這里通過括大腸桿菌的f-因子(或者致育因子)的例子加以說明。大腸桿菌的f-因子是一種質(zhì)粒,在接合過程中它能實(shí)現(xiàn)自身的高頻率轉(zhuǎn)移,f-因子對(duì)于獲得和穩(wěn)定擴(kuò)增大DNA片段,15如來自混合的微生物樣品的基因簇是理想的。一個(gè)發(fā)明是使用被稱作"fos-質(zhì)粒"的克隆載體,或者細(xì)菌人工染色體(BAC)載體。它們是源于大腸桿菌f因子,可以穩(wěn)定地整合大的基因組DNA片段。當(dāng)整合來自混合的未經(jīng)過培養(yǎng)的環(huán)境樣品的DNA時(shí),這就有可能得到以穩(wěn)定的"環(huán)境DNA文庫"形式存在的大的基因組片段。用于本發(fā)明的另一類型的載體是黏粒載體。黏粒載體最初是設(shè)計(jì)用來克隆20和擴(kuò)增基因組DNA的大片段。應(yīng)用黏粒載體的克隆在Sambrook等,MolecularCloning:ALaboratoryMannual,第二版,ColdSpringHarborLaboratoryPress(1989)中有詳細(xì)說明。一旦連接到適當(dāng)?shù)妮d體,含有不同的聚酮化合物合成酶基因簇的兩個(gè)或者更多個(gè)載體可以引入到適合的宿主細(xì)胞中。這些基因簇所共有的具有部分序列同源性的區(qū)域?qū)⒋龠M(jìn)導(dǎo)致序列重新組織為雜合基因簇的過程。然后可以對(duì)25新的雜合基因簇進(jìn)行篩選,以尋找在起初的基因簇沒有發(fā)現(xiàn)的活性。篩選各種酶活性的方法對(duì)于本領(lǐng)域技術(shù)人員是已知的,并在本說明書中通篇進(jìn)行討論,參見,例如下面的實(shí)施例l、2和3。當(dāng)分離本發(fā)明的多肽和多核苷酸時(shí),可以使用這樣的方法?!矫?,本發(fā)明提供了發(fā)現(xiàn)和分離纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水30解酶、甘露聚糖酶和/或P-葡糖苷酶的方法,或者使用全細(xì)胞方法修飾這些酶的活性的化合物(參見下面的討論)??梢詮幕蚪MDNA文庫篩選編碼纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的推定克隆。篩選方法和"在線"監(jiān)控設(shè)備35在實(shí)踐本發(fā)明的方法時(shí),多種儀器和方法可以與本發(fā)明的多肽和核酸一起使用,例如,用來篩選多肽的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,用來篩選作為纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的潛在調(diào)節(jié)劑的化合物,諸如激活劑或抑制劑,還可以用來篩選與本發(fā)明的多肽結(jié)合的抗體、與本發(fā)明的核酸雜交的核酸,用來篩選表達(dá)本發(fā)明的多肽的細(xì)胞,等等。除了下面詳細(xì)描述的用于篩選樣5品的陣列形式以外,也可使用別的形式來實(shí)施本發(fā)明的方法。這樣的形式包括,例如質(zhì)譜儀、色譜儀,例如,高通量HPLC和其它形式的液相色譜,和更小的形式,如1536-孔板、384-孔板等等。高通量篩選儀器可被改裝并用來實(shí)施本發(fā)明的方法,見,例如美國專利申請(qǐng)20020001809;20050272044。10毛潘,厙^本發(fā)明的核酸或多肽可被固定或應(yīng)用于陣列上。陣列可用來篩選或監(jiān)測組合物(例如,小分子、抗體、核酸等)的文庫,以發(fā)現(xiàn)它們結(jié)合本發(fā)明的核酸或多肽或者調(diào)節(jié)本發(fā)明的核酸或多肽的活性的能力。毛細(xì)管陣列,如GIGAMATRIXTM,戴弗薩公司(DiversaCorporation),SanDiego,CA;和描述在例如美國專利申請(qǐng)1520020080350Al;WO0231203A;WO0244336A中的陣列,提供了容納和篩選樣品的可供選擇的裝置。在一個(gè)方面,毛細(xì)管陣列包括多個(gè)毛細(xì)管,它們形成具有相互鄰接的毛細(xì)管的陣列,其中所述的每個(gè)毛細(xì)管含有至少一個(gè)壁,其限定了一個(gè)用以保留樣品的內(nèi)腔。這個(gè)內(nèi)腔可以是圓柱形的、正方形的、六邊形的或其它任何幾何形狀,只要其壁能夠形成內(nèi)腔以保留液體或樣品。毛細(xì)管陣列的毛細(xì)管20可相互靠近聯(lián)合在一起形成一個(gè)面狀的構(gòu)造。毛細(xì)管可通過融合(例如,當(dāng)毛細(xì)管由玻璃制成時(shí))、粘合、鍵合或面對(duì)面的夾合而結(jié)合在一起。此外,毛細(xì)管陣列可以包括在陣列中相鄰毛細(xì)管之間放置的間質(zhì)材料(interstitialmaterial),從而形成含有多個(gè)穿通孔(through-holes)的固體平面裝置。毛細(xì)管陣列可由任何數(shù)量的毛細(xì)管形成,例如,100至4,000,000個(gè)毛細(xì)管。25進(jìn)一步,具有大約IOO,OOO或更多個(gè)單個(gè)毛細(xì)管的毛細(xì)管陣列可形成標(biāo)準(zhǔn)大小和形狀的Microtiter⑧板,其適合于標(biāo)準(zhǔn)的實(shí)驗(yàn)室設(shè)備。通過毛細(xì)作用或使用細(xì)針的微注射,人工或自動(dòng)地將腔充滿。隨后可以從毛細(xì)管中移出感興趣的樣品以進(jìn)行進(jìn)一步的分析或定性。例如,安置細(xì)針樣的探頭,使其與選擇的毛細(xì)管能夠液體連通,從而可以向腔內(nèi)加入材料或移走材料。30在單區(qū)篩選分析(single-potscreeningassay)中,分析組分在插入到毛細(xì)管陣列中之前被混合在一起,產(chǎn)生目的溶液。當(dāng)至少一部分陣列被浸入目標(biāo)溶液中時(shí),通過毛細(xì)作用充滿內(nèi)腔。在每個(gè)毛細(xì)管中的化學(xué)或生物學(xué)反應(yīng)和/或活性被監(jiān)測,以發(fā)現(xiàn)可檢測事件。所述的可檢測事件常常被稱為"命中事件(hit)",其常??梢酝ㄟ^光學(xué)檢測與產(chǎn)生"非命中事件(non-hit)"的毛細(xì)管區(qū)分開來。因此,35毛細(xì)管陣列可整體地并行檢測"命中事件"。在多區(qū)篩選分析(multi-potscreeningassay)中,多肽或核酸,例如,配體可被導(dǎo)入進(jìn)第一組分中,該組分被導(dǎo)入進(jìn)毛細(xì)管陣列的至少一部分毛細(xì)管中。然后將氣泡導(dǎo)入進(jìn)第一組分后面的毛細(xì)管中。然后將第二組分導(dǎo)入進(jìn)毛細(xì)管內(nèi),其中所述的第二組分與第一組分通過氣泡相隔。通過在毛細(xì)管陣列的兩側(cè)施加靜水壓擠破氣泡將第一和第二組分混合在一起。然后監(jiān)測毛細(xì)管陣列中由兩個(gè)組分的5反應(yīng)或非反應(yīng)而發(fā)生的可檢測事件。在結(jié)合篩選分析(bindingscreeningassay)中,目標(biāo)樣品可作為用可檢測顆粒標(biāo)記的第一液體導(dǎo)入進(jìn)毛細(xì)管陣列的毛細(xì)管中,其中為了使可檢測顆粒與內(nèi)腔結(jié)合,毛細(xì)管的內(nèi)腔包被了一種結(jié)合材料。然后第一液體可從毛細(xì)管中移去,其中結(jié)合的可檢測顆粒仍保留在毛細(xì)管內(nèi),可以將第二液體導(dǎo)入進(jìn)毛細(xì)管內(nèi)。然10后監(jiān)測毛細(xì)管中由顆粒與第二液體的反應(yīng)或非反應(yīng)而發(fā)生的可檢測事件。艦或"生激芯/f"本發(fā)明的核酸或者多肽可以固定于或者應(yīng)用于陣列??梢詰?yīng)用陣列來篩選或者監(jiān)測化合物(例如,小分子、抗體、核酸等等)的文庫,所述篩選或者監(jiān)測15是針對(duì)它們結(jié)合本發(fā)明的核酸或多肽或者調(diào)控本發(fā)明的核酸或多肽的活性的能力。例如,在本發(fā)明的一方面,一個(gè)被監(jiān)測的參數(shù)是纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶基因的轉(zhuǎn)錄表達(dá)。細(xì)胞的一種或多種或所有的轉(zhuǎn)錄物可以通過陣列或"生物芯片"上的固定化核酸與包含細(xì)胞轉(zhuǎn)錄物、或代表細(xì)胞轉(zhuǎn)錄物的核酸、或與細(xì)胞轉(zhuǎn)錄物互補(bǔ)的核酸的樣品的雜交來測定。20通過在微型芯片上應(yīng)用核酸"陣列",細(xì)胞的一些或所有的轉(zhuǎn)錄物可以同時(shí)被定量。可選擇地,包含基因組核酸的陣列也可以用于確定通過本發(fā)明的方法制造的新的工程菌株的基因型。"多肽陣列"也可以用于同時(shí)定量多種蛋白。本發(fā)明可以用任何已知的"陣列"進(jìn)行實(shí)踐,所述"陣列"也指"微陣列"或"核酸陣列"或"多肽陣列"或"抗體陣列"或"生物芯片",或者它們的變體。陣列一般是多個(gè)"點(diǎn)"25或者"靶元素",每一個(gè)靶元素包括確定數(shù)量的一種或多種生物分子,例如,固定于基材表面的確定區(qū)域、用于特異結(jié)合樣品分子如mRNA轉(zhuǎn)錄物的寡核苷酸。在此使用的術(shù)語"陣列"或"微陣列"或"生物芯片"或"芯片"是多個(gè)靶元素,每個(gè)靶元素包括固定在基材表面的確定區(qū)域上的確定量的一種或多種多肽(包括抗體)或核酸,以下進(jìn)一步詳細(xì)討論。30在實(shí)踐本發(fā)明的方法時(shí),任何已知的陣列和/或制備和應(yīng)用陣列的方法都可以被全部或者部分地并入,或者引入它們的變體,例如在下列文獻(xiàn)中說明的美國專利6,277,628;6,277,489;6,261,776;6,258,606;6,054,270;6,048,695;6,045,9%;6,022,963;6,013,440;5,%5,452;5,959,098;5,856,174;5,830,645;5,770,456;5,632,957;5,556,752;5,143,854;5,807,522;5,800,992;5,744,305;5,700,637;355,556,752;5,434,049;還參見,例如,WO99/51773:WO99/09217;WO97/46313;WO96/17958;還參見,例如,Johnston(1998)Curr.Biol.8:R171-R174;Schummer(1997)Biotechinques23:1087-1092;Kern(1997)Biotechniques23:120-124;Solinas-Toldo(1997)Genes,Chromosomes&Cancer20:399-407;Bowtell(1999)NatureGeneticsSupp.21:25-32。也參見公布的美國專利申請(qǐng)20010018642;20010019827;20010016322;20010014449;20010014448;20010012537;520010008765。抗體和基于抗體的篩選方法術(shù)語"抗體"包括來源于(derivedfrom)、出自于(modeledafter)或大體20上編碼于(substantiallyencodedby)—個(gè)免疫球蛋白基因或多個(gè)免疫球蛋白基因的肽或多肽或者其片段,它們能特異地結(jié)合于抗原或表位,見例如,F(xiàn)undamentalImmunology,第三版,W.E.Paul,ed.,RavenPress,N.Y.(1993);Wilson(1994)J.Immunol.Methods175:267-273;Yarmush(1992)J.Biochem.Biophys.Methods25:85-97。術(shù)語抗體包括結(jié)合抗原的部分,即,具有與抗原結(jié)合的能力的"抗原結(jié)25合位點(diǎn)"(例如,片段、子序列、互補(bǔ)決定區(qū)(CDRs)),包括(i)Fab片段,由VL、VH、CL和CHI結(jié)構(gòu)域組成的單價(jià)片段;(ii)F(ab')2片段,包括在鉸鏈區(qū)由二硫鍵連接的兩個(gè)Fab片段的二價(jià)片段;(iii)由VH和CHI結(jié)構(gòu)域組成的Fd片段;(iv)由抗體單臂(asinglearm)的VL和VH結(jié)構(gòu)域組成的Fv片段;(v)由VH結(jié)構(gòu)域組成的dAb片段(Ward等,(1989)Nature341:544-546),和(vi)30分離出的互補(bǔ)決定區(qū)(CDR)。單鏈抗體也被包括在術(shù)語"抗體"中。本發(fā)明提供了本發(fā)明的酶(例如肽)的片段,包括本發(fā)明的多肽的免疫原性片段(例如,子序列)。本發(fā)明提供了含有本發(fā)明的多肽或肽和佐劑或載體以及類似物的組合物。所述抗體可以在免疫沉淀、染色、免疫親合柱等等中被應(yīng)用。如果需要的35話,編碼特異抗原的核酸序列可以通過免疫方法獲得,隨后分離出多肽或者核酸,進(jìn)行擴(kuò)增或者克隆,將多肽固定在本發(fā)明的陣列上??晒┻x擇的,本發(fā)明的方法可以用于修飾由細(xì)胞產(chǎn)生的待修飾的抗體的結(jié)構(gòu),如,抗體的親和性可以增加或者降低。而且,制備或者修飾抗體的能力可以是通過本發(fā)明的方法設(shè)計(jì)細(xì)胞表型。免疫、產(chǎn)生和分離抗體(多克隆的或者單克隆的)的方法是本領(lǐng)域技術(shù)人員所了解的,并且在科學(xué)和專利文獻(xiàn)中有描述,參見,如,Coligan,CURRENT5PROTOCOLSINIMMUNOLOGY,Wiley/Greene,NY(1991);Stites(eds.)BASICANDCLINICALIMMUNOLOGY(第7版)LangeMedicalPublications,LosAltos,CA("Stites");Goding,MONOCLONALANTIBODIES:PRINCIPLESANDPRACTICE(第2版)AcademicPress,NewYork,NY(1986);Kohler(1975)Nature256:495;Harlow(1988)ANTIBODIES,ALABORATORYMANUAL,ColdSpring10HarborPublications,NewYork。除了使用動(dòng)物的傳統(tǒng)的體內(nèi)方法外,抗體也可以在體外產(chǎn)生,例如,應(yīng)用表達(dá)重組抗體結(jié)合位點(diǎn)的噬菌體展示文庫。參見如,Hoogenboom(1997)TrendsBiotechnol.15:62-70;Katz(1997)A皿u.Rev.Biophys.Biomol.Struct.26:27-45。本發(fā)明的多肽或者含有其至少5、10、15、20、25、30、35、40、50、75、15100或150個(gè)連續(xù)氨基酸的片段,也可用來產(chǎn)生與所述多肽或片段特異結(jié)合的抗體。得到的抗體可應(yīng)用于免疫親和層析程序,以分離或純化多肽,或確定多肽是否存在于生物樣品中。在這樣的程序中,蛋白制備物,如提取物,或生物樣品與能夠同本發(fā)明的多肽或者含有其至少5、10、15、20、25、30、35、40、50、75、100或150個(gè)連續(xù)氨基酸的片段特異結(jié)合的抗體接觸。20在免疫親和程序中,所述抗體附著于固體支持物上,如珠子或者其它的柱基質(zhì)。在所述抗體可以特異地與本發(fā)明的多肽或其片段結(jié)合的條件下,將所述蛋白制備物與所述抗體接觸。當(dāng)通過清洗去除非特異結(jié)合的蛋白后,特異性結(jié)合的多肽被洗脫下來。在生物樣品中蛋白結(jié)合所述抗體的能力可以通過使用本領(lǐng)域技術(shù)人員所25熟悉的各種方法來確定。例如,結(jié)合可以通過用例如熒光試劑、酶標(biāo)記或者放射性同位素的可檢測標(biāo)記物來標(biāo)記所述抗體來確定??蛇x擇地,所述抗體與所述樣品的結(jié)合可以通過應(yīng)用具有這樣的可檢測標(biāo)記的二抗來檢測。特定的分析包括ELISA分析、夾心分析、放射免疫分析以及Western印跡。針對(duì)本發(fā)明的多肽或含有其至少5、10、15、20、25、30、35、40、50、3075、100或150個(gè)連續(xù)氨基酸的片段產(chǎn)生的多克隆抗體可通過直接將多肽注射進(jìn)動(dòng)物中或通過將多肽給予動(dòng)物,例如非人動(dòng)物而獲得。這樣獲得的抗體可與多肽本身結(jié)合。以這種方式,甚至僅編碼多肽的一個(gè)片段的序列也可用來產(chǎn)生可與整個(gè)天然多肽結(jié)合的抗體。這種抗體然后可用來從表達(dá)所述多肽的細(xì)胞中分離多肽。為了制備單克隆抗體,可使用可通過連續(xù)細(xì)胞系培養(yǎng)來產(chǎn)生抗體的任何技35術(shù)。實(shí)例包括雜交瘤技術(shù)(Kohler和Milstein,Nature,256:495-497,1975)、三體瘤技術(shù)、人B-細(xì)胞雜交瘤技術(shù)(Kozbor等人,ImmunologyToday4:72,1983)和EBV-雜交瘤技術(shù)(Cole等人,1985,inMonoclonalAntibodiesandCancerTherapy,AlanR.Liss,Inc.,pp.77-96)。用于產(chǎn)生單鏈抗體的技術(shù)(美國專利4,946,778)可被改動(dòng),以使之適于產(chǎn)生本發(fā)明的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或5150個(gè)連續(xù)氨基酸的片段的單鏈抗體??蛇x擇地是,轉(zhuǎn)基因小鼠可用來表達(dá)這些多肽或其片段的人源化抗體。產(chǎn)生的針對(duì)本發(fā)明的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150個(gè)連續(xù)氨基酸的片段的抗體可用于篩選來自其它生物體和樣品的類似多肽。在這些技術(shù)中,來自生物體的多肽與抗體接觸,檢測可與抗體特異10結(jié)合的多肽。上述的任何程序可用來檢測抗體的結(jié)合。一種這樣的篩選分析描述在"MethodsforMeasuringCellulaseActivities",M"/iocfa&£"2>wo/ogy,Vol160,87-116頁中。試劑盒15本發(fā)明提供了試劑盒,其包括組合物,例如本發(fā)明的核酸、表達(dá)序列盒、載體、細(xì)胞、轉(zhuǎn)基因種子或者植物或者植物的一部分、多肽(如纖維素酶)和/或者抗體。所述試劑盒也可以包括如在此所述的用于教導(dǎo)本發(fā)明的方法學(xué)以及工業(yè)、醫(yī)療和飲食應(yīng)用的指導(dǎo)性材料。20全細(xì)胞工程和測定代謝參數(shù)本發(fā)明的方法提供了細(xì)胞的全細(xì)胞進(jìn)化或全細(xì)胞工程,其通過修飾細(xì)胞的遺傳組成開發(fā)出具有新的表型,例如,新的或修飾的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的新細(xì)胞株。參見美國專利申請(qǐng)20040033975。25可以通過向細(xì)胞中加入本發(fā)明的核酸,例如本發(fā)明的酶的編碼序列而修飾遺傳組成。見,例如,WO022卯32;WO0196551。為了探測新的表型,在"實(shí)時(shí)"或者"在線"的時(shí)間范圍內(nèi)監(jiān)測被修飾的細(xì)胞的至少一種代謝參數(shù)。一發(fā)面,多個(gè)細(xì)胞,如培養(yǎng)細(xì)胞物被"實(shí)時(shí)"或者"在線"監(jiān)測。一方面,"實(shí)時(shí)"或者"在線"監(jiān)測多個(gè)代謝參數(shù)。代謝參數(shù)可以應(yīng)用30本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶進(jìn)行監(jiān)測。代謝流分析(MFA)是以已知的生物化學(xué)框架為基礎(chǔ)。以質(zhì)量守恒定律和細(xì)胞內(nèi)代謝的假穩(wěn)態(tài)假說(PSSH)為基礎(chǔ),構(gòu)建線性獨(dú)立代謝矩陣。在實(shí)踐本發(fā)明的方法時(shí),建立代謝網(wǎng)絡(luò),包括35所有途徑底物、產(chǎn)物和中間代謝物的特性,使途徑代謝物互變的所有化學(xué)反應(yīng)的特性,途徑反應(yīng)的化學(xué)計(jì)量學(xué),催化反應(yīng)的所有酶的特性,酶反應(yīng)動(dòng)力學(xué),途徑組分之間的調(diào)控性相互作用;如變構(gòu)效應(yīng)相互作用,酶-酶相互作用等,酶或者酶的任何其它超大分子組織在細(xì)胞內(nèi)的區(qū)室化,以及,任何濃度梯度的代謝物、酶或者效應(yīng)分子的存在,或者它們運(yùn)動(dòng)的擴(kuò)散障礙。5—旦針對(duì)給定的細(xì)胞株建立了代謝網(wǎng)絡(luò),如果在線代謝數(shù)據(jù)可用,那么可以通過矩陣概念引入數(shù)學(xué)表達(dá)來評(píng)估細(xì)胞內(nèi)的代謝流。代謝表型依賴于細(xì)胞內(nèi)整個(gè)代謝網(wǎng)絡(luò)的變化。代謝表型依賴于途徑利用對(duì)環(huán)境條件、遺傳調(diào)控、發(fā)育狀態(tài)和基因型等等作出的變化。在本發(fā)明方法的一個(gè)方面,當(dāng)計(jì)算了在線MFA之后,通過研究所述的途徑利用來分析細(xì)胞的動(dòng)力學(xué)行為、它們的表型和其它性質(zhì)。例10如,在酵母發(fā)酵中,如果葡萄糖供應(yīng)增加,氧氣減少,呼吸途徑的利用將會(huì)降低和/或者停止,而發(fā)酵途徑的利用將占優(yōu)勢。在所述的途徑分析之后,細(xì)胞培養(yǎng)物的生理狀態(tài)的控制將成為可能。通過確定如何改變底物供給、溫度、誘導(dǎo)物的使用等來控制細(xì)胞的生理狀態(tài)朝著所需的方向進(jìn)行,本發(fā)明的方法可以有助于確定如何操縱發(fā)酵。在實(shí)踐本發(fā)明的方法時(shí),MFA的結(jié)果也可以與轉(zhuǎn)錄物組15(transcriptome)和蛋白質(zhì)組(proteome)的數(shù)據(jù)比較,設(shè)計(jì)實(shí)驗(yàn)和方案用于代謝工程或者基因重排等等。在實(shí)踐本發(fā)明的方法時(shí),可以產(chǎn)生和檢測到任何經(jīng)修飾改變的或者新的表型,包括在細(xì)胞中新的或者改進(jìn)的特征。可以監(jiān)測代謝或者生長的任何方面。20蕭w腦録赫教在本發(fā)明的一方面,工程化的表型包括增加或者降低mRNA轉(zhuǎn)錄物(如,纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶信息)的表達(dá)或者在細(xì)胞中產(chǎn)生新的(如,纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶)轉(zhuǎn)錄物。這一增加或者減少的表達(dá)可以通過測25定本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的存在,或者通過纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性分析來跟蹤。mRNA轉(zhuǎn)錄物或者信息也可以通過本領(lǐng)域已知的任何方法來檢測或者定量,包括,例如,Northern印跡、定量擴(kuò)增反應(yīng)、陣列雜交以及類似的方法。定量擴(kuò)增反應(yīng)包括,如,定量PCR,包括,如,定量反轉(zhuǎn)錄30聚合酶鏈?zhǔn)椒磻?yīng),或者RT-PCR;定量實(shí)時(shí)RT-PCR,或者"實(shí)時(shí)動(dòng)力學(xué)RT-PCR"(參見,如,Kreuzer(2001)Br.J.Haematol.114:313-318;Xia(2001)Transplantation72:907-914)。在本發(fā)明的一方面,工程化的表型是通過敲除同源基因的表達(dá)產(chǎn)生??梢郧贸龌虻木幋a序列或者一個(gè)或多個(gè)轉(zhuǎn)錄控制元件,如啟動(dòng)子或者增強(qiáng)子。35這樣,轉(zhuǎn)錄物的表達(dá)可以完全去除或者僅被降低。在本發(fā)明的一方面,所述工程化的表型包括增加同源基因的表達(dá)。這可以通過敲除負(fù)調(diào)控元件或者誘變正調(diào)控元件而實(shí)現(xiàn),負(fù)調(diào)控元件包括以順式或者反式起作用的轉(zhuǎn)錄調(diào)控元件。細(xì)胞的一種或者多種或者所有的轉(zhuǎn)錄物可以通過陣列上的固定化核酸與包含細(xì)胞轉(zhuǎn)錄物的樣品,或者與代表細(xì)胞轉(zhuǎn)錄物或和細(xì)胞轉(zhuǎn)錄物互補(bǔ)的核酸的雜交來測定。層微、靡錢廳表這在本發(fā)明的一方面,工程化的表型包括增加或者降低多肽(如纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶)的表達(dá)或者在細(xì)胞內(nèi)產(chǎn)生新的多肽。這一增加或者減少的表達(dá)可以通過確定存在的纖維素酶如10內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的量或者通過纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性分析來跟蹤。也可以通過本領(lǐng)域任何已知的方法來檢測并定量多肽、肽和氨基酸,所述方法包括,如,核磁共振(NMR)、分光光度測定法、射線照像術(shù)(蛋白放射性標(biāo)記)、電泳、毛細(xì)管電泳、高效液相色譜(HPLC)、薄層色譜(TLC)、超擴(kuò)散色15譜,各種免疫學(xué)方法,如,免疫沉淀、免疫擴(kuò)散、免疫電泳、放射性免疫分析(RIAs)、酶聯(lián)免疫吸附分析(ELISAs)、免疫熒光分析,凝膠電泳(如,SDS-PAGE)、用抗體染色、熒光激活的細(xì)胞分選器(FACS)、熱分解質(zhì)譜、傅立葉變換紅外光譜測定、拉曼光譜、GC-MS和LC-電噴以及cap-LC-串聯(lián)-電噴質(zhì)譜,已經(jīng)類似的方法。應(yīng)用這些方法或者它們的變體也可以篩選新的生物活性,在美國專利6,057,103中有20說明。而且,正如以下詳細(xì)討論的,可以應(yīng)用蛋白陣列測定細(xì)胞的一種或者多種或者所有的多肽。工業(yè)、能源、藥物和其它應(yīng)用本發(fā)明的多肽(例如,具有纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、25甘露聚糖酶和/或(3-葡糖苷酶活性的多肽)可以催化纖維素的降解。本發(fā)明的酶是高度選擇性的催化劑。本發(fā)明提供了利用本發(fā)明的酶的工業(yè)方法,例如,在制藥或營養(yǎng)(飲食)補(bǔ)充劑行業(yè)、能源工業(yè)(例如,制造"清潔"生物燃料)中,在食品和飼料工業(yè)中,例如在制造食品和詞料產(chǎn)品以及食品和飼料添加劑的方法中利用本發(fā)明的酶。一方面,本發(fā)明提供了在醫(yī)藥工業(yè)中利用本發(fā)明的酶的工藝,30例如,以制備藥物或飲食助劑或補(bǔ)充物,或食物補(bǔ)充物和添加劑。此外,本發(fā)明提供了在生物乙醇——包括"清潔"燃料——的生產(chǎn)中使用本發(fā)明的酶的方法。本發(fā)明的酶可以催化具有強(qiáng)烈的立體選擇性、區(qū)域選擇性和化學(xué)選擇性的反應(yīng)。本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶可被工程化,以在各種溶劑中發(fā)揮功能,可在極端pH(例如,高pH和35低pH)和極端溫度(例如,高溫和低溫)、極端的鹽度水平(例如,高鹽度和低鹽度)下工作,并可催化同與其天然的生理底物結(jié)構(gòu)上不相關(guān)的化合物的反應(yīng)。生激激處靴贈(zèng)措生娜備主產(chǎn)本發(fā)明提供了生物質(zhì)(biomass)(例如,木質(zhì)纖維素材料)轉(zhuǎn)化成燃料(例如生物醇)和化學(xué)品的酶和方法。因此,本發(fā)明的組合物和方法提供了使用基于5石油的產(chǎn)品的有效的和持續(xù)的可替代選擇。本發(fā)明提供了表達(dá)本發(fā)明的酶的生物體,可用于參與涉及天然生物質(zhì)轉(zhuǎn)化的化學(xué)循環(huán)。一方面,用于轉(zhuǎn)化的酶和方法可用在酶整體(enzymeensembles)中,用于將纖維素和半纖維素聚合物解聚成可代謝的碳部分。如上所討論,本發(fā)明提供了發(fā)現(xiàn)和實(shí)施最有效的酶的方法,使這些重要的新的"生物質(zhì)轉(zhuǎn)化"和可選擇的能源工藝可行。10—方面,本發(fā)明的多肽,例如,具有纖維素酶活性,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶活性的蛋白質(zhì),被用在將木質(zhì)纖維素生物質(zhì)轉(zhuǎn)化成醇例如乙醇的方法中。本發(fā)明還提供了由含有木質(zhì)纖維素生物質(zhì)的組合物生產(chǎn)醇("生物醇")的方法。木質(zhì)纖維素生物質(zhì)材料可以從農(nóng)作物獲得,以食品或飼料生產(chǎn)的副產(chǎn)物獲得,或以木質(zhì)纖維素廢品獲得,例如植物殘余和廢15紙。用本發(fā)明的多肽處理的合適的植物殘余的例子包括莖、葉、殼、皮、穗軸(cob)和類似物,以及木材、木屑、木質(zhì)紙漿和鋸屑。適合用本發(fā)明的多肽處理的紙廢品的例子包括廢棄的復(fù)印紙、計(jì)算機(jī)打印紙、筆記本紙、記事本紙、打字機(jī)用紙等等,以及報(bào)紙、雜志、紙板和基于紙的包裝材料?!矫?,本發(fā)明的酶和方法可與從生物質(zhì)制備醇的更"傳統(tǒng)的"方法一起20使用,例如,這樣的方法,包括通過使干燥過的木質(zhì)纖維素材料在反應(yīng)器中與由強(qiáng)酸和金屬鹽的稀釋溶液組成的催化劑接觸而水解木質(zhì)纖維素材料;這可以降低纖維素水解的活化能或溫度,以獲得更高的糖產(chǎn)率;參見,例如,美國專利6,660,506;6,423,145。使用本發(fā)明的酶的另一種示例性方法包括通過使木質(zhì)素纖維素材料在一25定的溫度和壓力下在含水介質(zhì)中經(jīng)受第一階段的水解步驟而水解含有半纖維素、纖維素和木素的木質(zhì)纖維素材料,所述溫度和壓力被選擇來實(shí)現(xiàn)半纖維素的初步解聚而不將纖維素大部分解聚成葡萄糖。該步驟得到一種漿,其中含水液相含有從半纖維素解聚得到的溶解的單糖,而固相含有纖維素和木素。第二階段水解步驟可以包括使得至少大部分纖維素被解聚的條件,該步驟產(chǎn)生含有溶解的/可溶的30纖維素解聚產(chǎn)物的含水液相。參見,例如,美國專利5,536,325。本發(fā)明的酶可以在該示例性方法中的任何階段加入。使用本發(fā)明的酶的另一種示例性方法包括通過一個(gè)或多個(gè)用大約0.4%至2%的強(qiáng)酸進(jìn)行稀釋酸水解的階段來處理含木質(zhì)纖維素的生物質(zhì)材料;以及通過堿性去木質(zhì)作用來處理酸水解的生物質(zhì)材料的未反應(yīng)的固體木質(zhì)纖維素成分,以35產(chǎn)生可生物降解的熱塑塑料和衍生產(chǎn)品的前體。參見,例如,美國專利6,409,841。本發(fā)明的酶可以在該示例性方法中的任何階段加入。使用本發(fā)明的酶的另一種示例性方法包括在預(yù)水解反應(yīng)器中預(yù)水解木質(zhì)纖維素材料;向該固體木質(zhì)纖維素材料加入酸性液體,制備混合物;將該混合物加熱至反應(yīng)溫度;維持反應(yīng)足夠的時(shí)間,以將木質(zhì)纖維素材料分餾成含有至少大約20%的來自木質(zhì)纖維素材料的木質(zhì)素的溶解部分以及含有纖維素的固體部分;5當(dāng)處于或接近其中固體部分中的纖維素變得更易于進(jìn)行酶促降解的反應(yīng)溫度時(shí),從固體部分除去溶解部分;以及回收溶解部分。參見,例如,美國專利5,705,369。本發(fā)明的酶可以在該示例性方法中的任何階段加入。本發(fā)明提供了制備基于液體烴的發(fā)動(dòng)機(jī)燃料組合物(例如,用于火花點(diǎn)火發(fā)動(dòng)機(jī))的方法,所述液體烴摻混有利用本發(fā)明的酶或方法制備的燃料級(jí)醇。一10方面,利用本發(fā)明的酶生產(chǎn)的燃料包括,例如液體煤氣-醇混合物或液體天然氣-醇混合物。一方面,共溶劑是生物質(zhì)衍生的2-甲基四氫呋喃(MTHF)。參見,例如,美國專利6,712,866。用于木質(zhì)纖維素的酶促降解的方法,例如,用于從木質(zhì)纖維素材料生產(chǎn)乙醇的方法,還可以包括生物質(zhì)材料的超聲處理;參見,例如,美國專利6,333,181。15使用本發(fā)明的酶制備含有乙醇的生物燃料的另一個(gè)示例性方法包括預(yù)處理含有木質(zhì)纖維素給料的原材料,所述木質(zhì)纖維素給料至少包括半纖維素和纖維素。一方面,所述原材料包括馬鈴薯、大豆(油菜籽)、大麥、黑麥、玉米、燕麥、小麥、甜菜或甘蔗或成分或廢物或食物或飼料生產(chǎn)副產(chǎn)物。原材料("給料")在破壞植物纖維結(jié)構(gòu)的條件下發(fā)生反應(yīng),以實(shí)現(xiàn)半纖維素和纖維素的至少部分水解。20破壞性條件可以包括,例如使原材料在pH0.5至2.5經(jīng)受18(TC至27(TC的平均溫度大約5秒至60分鐘的時(shí)間;或,在pH0.5至2.5經(jīng)受22(TC至270'C的溫度大約5秒至120秒的時(shí)間,或同等條件。這增加了的給料的可利用性,該給料有待本發(fā)明的酶例如纖維素酶消化。美國專利6,090,595。用于木質(zhì)纖維素材料的纖維素酶水解的示例性條件包括在大約30'C至4825'C之間的溫度下和/或大約4.0和6.0之間的pH下反應(yīng)。其它示例性條件包括在大約30'C至6(TC之間的溫度下和/或大約4.0和8.0之間的pH。動(dòng)激銜柳會(huì)激或麟添雄除了提供用于人類使用的飲食助劑或添加劑、或食物補(bǔ)充物和添加劑,本30發(fā)明還提供了使用本發(fā)明的多肽和/或本發(fā)明的抗體處理動(dòng)物飼料和食物和食物或飼料添加劑的方法,所述多肽例如具有纖維素酶活性如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的蛋白質(zhì)。本發(fā)明提供了含有本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶和/或本發(fā)明的抗體的動(dòng)物飼料、食物和添加劑。動(dòng)物可以是任何農(nóng)場動(dòng)物或任何動(dòng)物。35本發(fā)明的動(dòng)物飼料添加劑可以是顆粒狀的酶產(chǎn)品,其可以很容易與飼料成分混合??蛇x擇地是,本發(fā)明的飼料添加劑可形成一種預(yù)混合組分。本發(fā)明的顆粒狀酶產(chǎn)品可被包被或不包被。酶顆粒的粒徑可與飼料和預(yù)混合組分的大小相容。這為將酶整合進(jìn)飼料中提供了一種安全和方便的手段??蛇x擇地,本發(fā)明的動(dòng)物飼料添加劑可以是一種穩(wěn)定過的液體組合物。它可以是水基或油基的漿液。見,例如美國專利6,245,546。5在動(dòng)物飼料或食物的改善(或者修飾)中,本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶可以在體外(通過改變飼料或食物的成分)或在體內(nèi)加工食物或飼料。本發(fā)明的多肽可被加入動(dòng)物飼料或食物組合物中。—方面,本發(fā)明的酶與另一種酶一起加入,例如,P-半乳糖苷酶、過氧化10氫酶、漆酶、其它纖維素酶、內(nèi)切糖苷酶、內(nèi)切-p-l,4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖異構(gòu)酶、糖基轉(zhuǎn)移酶、脂酶、磷脂酶、脂氧化酶、卩-漆酶、內(nèi)切-(3-1,3(4)-漆酶、角質(zhì)酶、過氧化物酶、淀粉酶、葡糖淀粉酶、果膠酶、還原酶、氧化酶、脫羧酶、酚氧化酶、木質(zhì)素酶、支鏈淀粉酶、阿拉伯聚糖酶、半纖維素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果膠乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯15酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果膠裂解酶、轉(zhuǎn)谷氨酰胺酶、果膠甲基酯酶、其它纖維二糖水解酶和/或轉(zhuǎn)谷氨酰胺酶。這些酶消化產(chǎn)物更容易被動(dòng)物消化。因此,本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶有助于飼料或食物的能量的有效利用,或者通過降解纖維素,有助于食物或飼料的消化性。20在另一個(gè)方面,本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶通過直接在轉(zhuǎn)基因飼料作物(如,例如轉(zhuǎn)基因植物、種子以及類似物)中表達(dá)酶而被供給,所述轉(zhuǎn)基因作物如谷粒、谷類、玉米、大豆、油菜籽、羽扇豆以及類似物。如在上面所討論的,本發(fā)明提供了轉(zhuǎn)基因的植物、植物部分和植物細(xì)胞,其含有編碼本發(fā)明多肽的核酸序列。在一個(gè)方面,核酸被25表達(dá),這樣,本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶以可回收的量被產(chǎn)生。纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶可從任何植物或植物部分中被回收??蛇x擇的是,含有重組多肽的植物或植物部分可用來改善食物或飼料的性質(zhì),例如,改善營養(yǎng)價(jià)值、可口性等等。30—方面,本發(fā)明的酶輸送基質(zhì)是以分散的多個(gè)微粒、小丸或顆粒形式存在。"顆粒"的含義是被壓扁或壓緊的微粒,如通過制丸、擠壓或類似的壓制過程從基質(zhì)中去除水分。微粒的這種壓縮或壓緊也可促進(jìn)微粒的微粒內(nèi)粘聚性。例如,通過在制丸機(jī)中將基于谷物的基質(zhì)制丸來制備顆粒。由此制備的丸被研磨或粉碎成適合用作動(dòng)物飼料輔料的顆粒大小。由于基質(zhì)本身被批準(zhǔn)用于動(dòng)物飼料,所以35在動(dòng)物飼料中它可用作輸送酶的稀釋劑。—方面,包含在本發(fā)明酶輸送基質(zhì)和方法中的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶是熱穩(wěn)定的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,如在本文中所述,以便在升高的溫度和/或蒸汽可能用來制備丸化的酶輸送基質(zhì)的生產(chǎn)期間抵抗纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的滅活。在消化含有5本發(fā)明的酶輸送基質(zhì)的飼料的過程中,水相消化液將引起活性酶的釋放。其它類型的熱穩(wěn)定酶和熱穩(wěn)定的營養(yǎng)添加劑也可被摻入輸送基質(zhì)中,其可在任何類型的含水條件下釋放。—方面,出于許多不同的目的,可以對(duì)本發(fā)明的酶基質(zhì)微粒應(yīng)用包衣,如為了向動(dòng)物詞料中添加調(diào)味劑或營養(yǎng)補(bǔ)充劑,為了在胃內(nèi)條件下延緩動(dòng)物飼料補(bǔ)10充劑和酶的釋放,以及類似的目的。一方面,可應(yīng)用包衣來實(shí)現(xiàn)功能性的目的,例如在需要延緩酶從基質(zhì)微粒中釋放或控制酶將被釋放的條件時(shí)。包衣材料的組分可以是這樣的,其可選擇性地被其敏感的試劑(如熱、酸或堿、酶或其它化學(xué)物質(zhì))分解??蛇x擇地是,對(duì)不同的這樣的分解劑敏感的兩種或更多種包衣可被連續(xù)地應(yīng)用于基質(zhì)微粒。15本發(fā)明也涉及制備酶釋放基質(zhì)的方法。根據(jù)本發(fā)明,該過程包括提供基于谷粒的基材的多個(gè)分散顆粒,其顆粒大小適合用作酶釋放基質(zhì),其中所述的顆粒包括由本發(fā)明的氨基酸序列編碼的纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶。一方面,該方法包括將酶釋放基質(zhì)的顆粒壓制或壓縮成微粒,在一個(gè)方面是通過制丸來完成。防霉劑和粘聚劑,當(dāng)被應(yīng)用時(shí),可在20任何適合的時(shí)間被加入,并且在一方面,與基于谷粒的基材以所需的比例在將基于谷粒的基材制丸之前混合。制丸機(jī)進(jìn)料中的含水量在一個(gè)方面是上面所示的與最終產(chǎn)物含水量對(duì)應(yīng)的范圍,在一個(gè)方面是大約14-15%。一方面,水分以酶的含水制劑形式加入至給料中,使該給料達(dá)到此含水量。在制丸機(jī)中的溫度在一個(gè)方面用蒸汽達(dá)到大約82°C。制丸機(jī)可在任何條件下進(jìn)行操作,對(duì)給料進(jìn)行足夠的操25作以提供小丸。對(duì)于從含酶組合物中去除水分來說,制丸方法本身是一個(gè)很經(jīng)濟(jì)的方法。本發(fā)明的組合物和方法可以結(jié)合施用益生素進(jìn)行實(shí)踐,益生素是高分子量糖類,如低聚果糖(FOS);低聚半乳糖(GOS)、GRAS(通常認(rèn)為安全的(GenerallyRecognizedAsSafe))材料。這些益生素可以通過一些益生乳酸菌(LAB)進(jìn)行代謝。30它們對(duì)于大多數(shù)小腸微生物是不可消化的。必潘會(huì)激微工本發(fā)明提供了包含本發(fā)明的酶的食物和飼料以及使用本發(fā)明的酶處理食物和飼料的方法。本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚35糖酶和/或p-葡糖苷酶在食品加工工業(yè)中具有大量的應(yīng)用。本發(fā)明提供了水解含纖維素的組合物的方法,所述含纖維素的組合物包括植物細(xì)胞、細(xì)菌細(xì)胞、酵母細(xì)胞、昆蟲細(xì)胞或動(dòng)物細(xì)胞、或任何植物或植物部分、或任何食物或飼料、廢品等等。例如,本發(fā)明提供了含有纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的飼料或食物,例如,在飼料、液體諸如飲料(如果汁5或啤酒)、面包、面團(tuán)或面包產(chǎn)品、或飲品(如啤酒)或飲料前體(如,麥芽汁)中。本發(fā)明的食物處理工藝還可以包括使用其它酶的任何組合,其它酶例如色氨酸酶或酪氨酸脫羧酶、漆酶、過氧化氫酶、漆酶、其它纖維素酶、內(nèi)切糖苷酶、內(nèi)切-P-l,4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖異構(gòu)酶、糖基轉(zhuǎn)移酶、脂10酶、磷脂酶、脂氧化酶、p-漆酶、內(nèi)切-p-l,3(4)-漆酶、角質(zhì)酶、過氧化物酶、淀粉酶、葡糖淀粉酶、果膠酶、還原酶、氧化酶、脫羧酶、酚氧化酶、木質(zhì)素酶、支鏈淀粉酶、阿拉伯聚糖酶、半纖維素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果膠乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果膠裂解酶、轉(zhuǎn)谷氨酰胺酶、15果膠甲基酯酶、其它纖維二糖水解酶和/或轉(zhuǎn)谷氨酰胺酶?!矫?,本發(fā)明提供了用于水解液體(液化的)和顆粒淀粉的酶和方法。這樣的淀粉可以來源于任何來源,例如甜菜、甘蔗、馬鈴薯、玉米、小麥、蜀黍、高梁、黑麥或bulgher。本發(fā)明適合于在液化(例如,為了生產(chǎn)生物乙醇)中有用的任何植物淀粉來源如谷物淀粉來源,包括己知可產(chǎn)生適合于液化的淀粉的任何20其它谷物或蔬菜來源。本發(fā)明的方法包括液化來自任何天然材料的淀粉(例如,制造生物乙醇),所述的天然材料例如稻、發(fā)芽水稻、玉米、大麥、蜀黍、小麥、高梁、馬鈴薯、甜菜、甘蔗和甘薯。液化過程可以充分地水解淀粉以產(chǎn)生糖漿。液化的溫度范圍可以是已知在液化淀粉中有效的任何液化溫度。例如,淀粉的溫度可以在大約8(TC到大約115'C之間,在大約100'C到大約110'C之間,以及大約25105。C到大約108'C之間。除了用于(或用于生產(chǎn))食物和飼料包括酒精飲料,使用本發(fā)明的酶和方法生產(chǎn)的生物乙醇可用作燃料或用于燃料中(例如,汽車燃料),例如,如下所討論。廢欽必潘30本發(fā)明提供了用在廢物處理中的酶。本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶可用于各種廢物處理或相關(guān)的工業(yè)應(yīng)用中,例如用在與生物質(zhì)轉(zhuǎn)化產(chǎn)生燃料相關(guān)的廢物處理中。例如,在一個(gè)方面,本發(fā)明提供了使用本發(fā)明的纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的固體和/或液體廢物消化方法。該法可以包括減少基本上未35處理的固體廢物的量和體積。固體廢物可在酶溶液(包括本發(fā)明的纖維素酶,如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶)存在的情況下用酶促消化過程在控制的溫度下進(jìn)行處理。這種反應(yīng)不需要添加微生物形成明顯的細(xì)菌發(fā)酵。固體廢物被轉(zhuǎn)變?yōu)橐夯膹U物和任何殘余的固體廢物。得到的液化廢物可與所述的任何殘余的固化廢物分離。見,例如美國專利5,709,796。—方面,本發(fā)明的組合物和方法被用于去除、預(yù)防或減少例如動(dòng)物廢物池5如養(yǎng)豬農(nóng)場的動(dòng)物廢物池中、其它動(dòng)物廢物管理系統(tǒng)中或任何工業(yè)或食品加工應(yīng)用中的氣味。用于生物質(zhì)(例如,木質(zhì)纖維素材料)轉(zhuǎn)化成燃料(例如,生物乙醇)的酶和方法可以結(jié)合城市固體廢物材料的處理/再循環(huán),所述城市固體廢物材料包括從城市直接獲得的廢物或者先前填埋隨后回收的城市固體廢物,或者下水道淤泥,10例如含有明顯量的纖維素材料的下水道淤泥塊形式的下水道淤泥。由于下水道淤泥塊通常不含有明顯量的可再循環(huán)材料(鋁、玻璃、塑料等等),它們可以用濃硫酸直接處理(以降低廢物的纖維素成分的重金屬含量),并在乙醇生產(chǎn)系統(tǒng)中進(jìn)行處理。參見,美國專利6,267,309;5,975,439。使用本發(fā)明的酶從廢物材料回收有機(jī)物質(zhì)和無機(jī)物質(zhì)的另一種示例性方15法包括通過使之經(jīng)受熱和壓來對(duì)固體有機(jī)物質(zhì)進(jìn)行滅菌并使之軟化。該示例性方法可以通過首先攪拌廢物材料,然后使之經(jīng)受熱和壓而進(jìn)行,熱和壓對(duì)其進(jìn)行滅菌并使其中包含的有機(jī)物質(zhì)軟化。一方面,在壓力下加熱之后,壓力可以從多孔室突然釋放,以向外推動(dòng)經(jīng)軟化的有機(jī)物質(zhì)通過容器的孔,從而從固體無機(jī)物質(zhì)分離出有機(jī)物質(zhì)。然后,經(jīng)軟化的無菌有機(jī)物質(zhì)在發(fā)酵室中進(jìn)行發(fā)酵,例如使用20本發(fā)明的酶,例如,以形成發(fā)酵漿。該發(fā)酵槳可通過離心、蒸餾柱和/或厭氧蒸煮器進(jìn)行進(jìn)一步加工,以回收燃料如乙醇和甲烷、以及動(dòng)物飼料補(bǔ)充物。參見,例如美國專利6,251,643。本發(fā)明的酶還可以用于降低工業(yè)廢物或從畜牧業(yè)設(shè)備產(chǎn)生的廢物以及類似廢物的氣味的工藝,例如預(yù)處理。例如,本發(fā)明的酶可用于處理廢物存儲(chǔ)設(shè)備25中的動(dòng)物廢物,以增強(qiáng)大量的有機(jī)物質(zhì)的有效降解,同時(shí)氣味減少。該方法還可以包括接種利用硫化物的細(xì)菌和消化有機(jī)物的細(xì)菌以及裂解酶(除了本發(fā)明的酶之外)。參見,例如美國專利5,958,758。本發(fā)明的酶還可用在移動(dòng)系統(tǒng)(mobilesystem)例如間歇式反應(yīng)器(batchtypereactors)中,用于含水有害廢物的生物再補(bǔ)救,例如,如在美國專利5,833,85730中所描述的。間歇式反應(yīng)器可以是具有循環(huán)能力的大的容器,其中通過將營養(yǎng)物輸入反應(yīng)器中將細(xì)菌(例如,表達(dá)本發(fā)明的酶的細(xì)菌)維持在有效的狀態(tài)。當(dāng)流出物可以被輸入反應(yīng)器中或者反應(yīng)器被建成為廢水處理系統(tǒng)時(shí),可以采用這樣的系統(tǒng)。本發(fā)明的酶還可以用在這樣的處理系統(tǒng)中,該處理系統(tǒng)在小的或臨時(shí)的遙遠(yuǎn)場所使用,例如,移動(dòng)式的、大容量、高效的多功能廢水處理系統(tǒng)。35本發(fā)明的廢物處理方法可以包括使用其它酶的任何組合,其它酶例如其它纖維素酶如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶、過氧化氫酶、漆酶、其它纖維素酶、內(nèi)切糖苷酶、內(nèi)切-p-l,4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖異構(gòu)酶、糖基轉(zhuǎn)移酶、脂酶、磷脂酶、脂氧化酶、P-漆酶、內(nèi)切-(3-l,3(4)-漆酶、角質(zhì)酶、過氧化物酶、淀粉酶、葡糖淀粉酶、果膠酶、還原酶、氧化酶、脫羧酶、酚氧化酶、木質(zhì)素酶、支鏈淀粉酶、肌醇六磷酸酶、阿拉伯聚5糖酶、半纖維素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果膠乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果膠裂解酶、轉(zhuǎn)谷氨酰胺酶、果膠甲基酯酶、其它纖維二糖水解酶和/或轉(zhuǎn)谷氨酰胺酶。10去薪微合激本發(fā)明提供了含有本發(fā)明的一種或多種多肽(例如,具有纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的酶)的去垢劑組合物,以及制備和使用這些組合物的方法。本發(fā)明包括了制備和使用去垢劑組合物的所有方法,見,例如美國專利6,413,928;6,399,561;6,365,561;6,380,147。去垢15劑組合物可以是一個(gè)部分和兩個(gè)部分的含水組合物、不含水的液體組合物、鑄型固體、顆粒形式、微粒形式、壓縮片劑、凝膠和/或糊劑和漿液的形式。本發(fā)明還提供了能夠使用這些去垢劑組合物快速除去總食物類污垢、或食物殘留的膜以及其它少量食物組分的方法。本發(fā)明的酶通過淀粉多糖的催化水解可以促進(jìn)淀粉染污的去除。本發(fā)明的酶可用于洗碟用去垢劑、紡織品洗滌去垢劑中。20實(shí)際的活性酶含量依賴于制造去垢劑組合物的方法,這不是很嚴(yán)格的,只要去垢劑溶液具有所需的酶活性。在一個(gè)方面,存在于最終溶液中的葡糖苷酶的量的范圍為每克去垢劑組合物大約0.001mg至0.5mg。選擇用于本發(fā)明的方法和產(chǎn)品中的特定酶依賴于最終應(yīng)用的條件,包括產(chǎn)品的物理形式、應(yīng)用時(shí)的pH、應(yīng)用時(shí)的溫度和要被降解或改變的污垢類型。對(duì)于指定的任何一組應(yīng)用條件,可以25選擇酶以提供最佳的活性和穩(wěn)定性。在一個(gè)方面,本發(fā)明的多肽在大約4至大約12的pH范圍內(nèi),大約20。C至大約95。C的溫度范圍內(nèi)是有活性的。本發(fā)明的去垢劑可以包括陽離子表面活性劑、半極性的非離子表面活性劑或兩性離子表面活性劑;或其混合物。本發(fā)明的酶(例如,具有纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘30露聚糖酶和/或P-葡糖苷酶活性的酶)可被制成粉末狀和液體的去垢劑,具有的pH在4.0和12.0之間,按重量計(jì)為大約0.01%至大約5%(優(yōu)選0.1%至0.5%)的水平。這些去垢劑組合物也可以包括其它的酶如己知的蛋白水解酶、纖維素酶、脂酶或糖苷內(nèi)切酶,以及助洗劑和穩(wěn)定劑。向傳統(tǒng)的洗滌組合物中添加本發(fā)明的酶不會(huì)造成任何特殊的應(yīng)用限制。換句話說,適合去垢劑的任何溫度和pH也適用于35本發(fā)明的組合物,只要pH在上述范圍內(nèi),而溫度在所描述的酶變性溫度之下。另夕卜,本發(fā)明的多肽可用于不需要去垢劑的洗滌組合物中,再單獨(dú)應(yīng)用或與助洗劑和穩(wěn)定劑聯(lián)合應(yīng)用。本發(fā)明提供了清潔組合物,包括清潔硬表面的去垢劑組合物、清潔織物的去垢劑組合物、洗碟用組合物、口腔清潔組合物、假牙清潔組合物和隱形眼鏡清潔液。5在一個(gè)方面,本發(fā)明提供了清洗物體的方法,包括將物體與本發(fā)明的多肽在可充分清洗的條件下接觸。本發(fā)明的多肽可以作為去垢劑添加劑而被加入。本發(fā)明的去垢劑組合物,例如可被配制為含有本發(fā)明多肽的手工或機(jī)器洗衣的去垢劑組合物。適合用于預(yù)處理污染織物的洗衣添加劑可含有本發(fā)明的多肽??椢锶彳泟┙M合物可含有本發(fā)明的多肽。可選擇的是,本發(fā)明的多肽可被制成去垢劑組10合物,用于通常的家庭硬表面清洗工作中。在可選擇的方面,本發(fā)明的去垢劑添加劑和去垢劑組合物可以包含一種或多種其它的酶,例如蛋白水解酶、脂酶、角質(zhì)酶、另一種葡糖苷酵、糖酶、另一種纖維素酶、果膠酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶,例如,乳糖酶和/或過氧化物酶。所選擇的本發(fā)明的酶的特性可與所選擇的去垢劑相容(即,最佳pH,與其它的酶或非酶15成分相容,等),并且,酶是以有效量存在。在一個(gè)方面,本發(fā)明的酶用來從織物中去掉有惡臭的材料。在實(shí)施本發(fā)明中可使用的各種去垢劑組合物和制備它們的方法描述在,例如美國專利6,333,301;6,329,333;6,326,341;6,297,038;6,309,871;6,204,232;6,197,070;5,856,164。本發(fā)明的去垢劑和相關(guān)的方法還可以包括使用其它酶的任何組合,其它酶20例如色氨酸酶或酪氨酸脫羧酶、過氧化氫酶、漆酶、其它纖維素酶、內(nèi)切糖苷酶、內(nèi)切-P-l,4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖異構(gòu)酶、糖基轉(zhuǎn)移酶、脂酶、磷脂酶、脂氧化酶、(3-漆酶、內(nèi)切-P-l,3(4)-漆酶、角質(zhì)酶、過氧化物酶、淀粉酶、葡糖淀粉酶、果膠酶、還原酶、氧化酶、脫羧酶、酚氧化酶、木質(zhì)素酶、支鏈淀粉酶、阿拉伯聚糖酶、半纖維素酶、甘露聚糖酶、木糖漆酶、木聚糖酶、果25膠乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果膠裂解酶、轉(zhuǎn)谷氨酰胺酶、果膠甲基酯酶、其它纖維二糖水解酶和/或轉(zhuǎn)谷氨酰胺酶。必鄉(xiāng)激微鄉(xiāng)30本發(fā)明提供了使用本發(fā)明的一種或多種多肽處理織物和紡織品的方法,所述多肽例如具有纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的酶。本發(fā)明的多ftk可以在任何織物處理方法中使用,這些方法在本
技術(shù)領(lǐng)域
是已知的,例如參見美國專利6,077,316。例如,一方面,織物的手感和外觀通過包括用本發(fā)明的酶在溶液中接觸織物的方法得到改進(jìn)。一方面,用溶35液在壓力下處理織物。—方面,本發(fā)明的酶在織物的編織過程中或之后應(yīng)用,或在脫漿階段應(yīng)用,或在一個(gè)或多個(gè)其它的織物處理歩驟中應(yīng)用。在織物的編織過程中,線被施加相當(dāng)大的機(jī)械張力。在機(jī)械織布機(jī)上進(jìn)行編織之前,經(jīng)紗通常用上漿淀粉或淀粉衍生物涂覆,以便提高它們的拉伸強(qiáng)度并防止斷裂。本發(fā)明的酶可用于去除這些上漿淀粉或淀粉衍生物。在紡織品已經(jīng)編織好之后,織物可以繼續(xù)進(jìn)行到脫漿階段。5隨后可以是一個(gè)或多個(gè)額外的織物加工步驟。脫漿是從紡織品中去除"漿料"的作用過程。在編織之后和進(jìn)一步加工織物之前,必須去除漿料涂層,以便確保均勻且耐水的效果。本發(fā)明提供了一種脫漿方法,包括通過本發(fā)明酶的作用對(duì)"漿料"進(jìn)行酶促水解。本發(fā)明的酶(如具有纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚10糖酶和/或卩-葡糖苷酶活性的酶)可作為去污劑添加劑對(duì)織物進(jìn)行脫漿,所述織物包括含棉織物,所述酶可以例如在含水組合物中。本發(fā)明提供了在靛類染色的粗斜紋棉布織物和衣服上產(chǎn)生砂洗外觀的方法。對(duì)于服裝制造,織物可以被剪裁并縫紉為衣料或服裝,這些在后來被整理。尤其是,對(duì)于粗斜紋布牛仔褲的制造,已經(jīng)開發(fā)了不同的酶促加工方法。粗斜紋棉布服裝的整理(finishing)通常從酶脫15漿步驟開始,在該步驟中服裝經(jīng)受淀粉分解酶的作用,以便給織物提供柔軟性,使得棉織物更易于進(jìn)行后面的酶促整理步驟。本發(fā)明提供了使用本發(fā)明的酶加工(finishing)粗斜紋棉布服裝(例如"生物-石磨方法(bio-stoningprocess)")、酶促脫漿并給織物提供柔軟性的方法。本發(fā)明提供了在脫漿和/或整理過程中快速軟化粗斜紋棉布服裝的方法。20本發(fā)明還提供了含有本發(fā)明的酶(如具有纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的酶)的消毒劑。本發(fā)明的織物或紡織品處理方法還可以包括使用其它酶的任何組合,其它酶例如色氨酸酶或酪氨酸脫羧酶、漆酶、過氧化氫酶、漆酶、其它纖維素酶、內(nèi)切糖苷酶、內(nèi)切-P-l,4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖異構(gòu)酶、糖基25轉(zhuǎn)移酶、脂酶、磷脂酶、脂氧化酶、P-漆酶、內(nèi)切-P-l,3(4)-漆酶、角質(zhì)酶、過氧化物酶、淀粉酶、葡糖淀粉酶、果膠酶、還原酶、氧化酶、脫羧酶、酚氧化酶、木質(zhì)素酶、支鏈淀粉酶、阿拉伯聚糖酶、半纖維素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果膠乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果膠裂解酶、轉(zhuǎn)30谷氨酰胺酶、果膠甲基酯酶、其它纖維二糖水解酶和/或轉(zhuǎn)谷氨酰胺酶。一銜或一欲炎必湮本發(fā)明的酶(如具有纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的酶)可以在紙或紙漿處理或紙脫墨中使用。例如,一35方面,本發(fā)明提供了使用本發(fā)明的酶的紙?zhí)幚矸椒?。一方面,本發(fā)明的酶可以被用來修飾紙中的淀粉,從而將其轉(zhuǎn)化為液化形式。另一方面,在化學(xué)和酶促脫墨過程中處理再循環(huán)影印紙的紙成分。一方面,本發(fā)明的酶可以與其它酶一起使用,包括其它纖維素酶(包括其它內(nèi)切葡聚糖酶、纖維二糖水解酶和/或(3-葡糖苷酶)。木材、紙、紙產(chǎn)品或紙漿可以通過如下三種方法來處理1)在存在本發(fā)明的酶的情況下進(jìn)行離解;2)用脫墨化學(xué)品和本發(fā)明的酶進(jìn)行離解,和/或3)在用本發(fā)明5的酶浸透后進(jìn)行離解。與僅僅用纖維素酶處理的紙相比,用本發(fā)明的酶處理的循環(huán)紙可以具有更高的亮度,這是由于去除了墨粉顆粒。盡管本發(fā)明不受任何特定機(jī)理的限制,但本發(fā)明的酶的效果可能是由于其在紙漿懸浮物中作為表面活性劑的結(jié)果。本發(fā)明提供了使用本發(fā)明的一種或多種多肽處理紙和紙漿的方法。本發(fā)明10的多肽可以在任何紙?zhí)幚砘蚣垵{處理方法中使用,這些方法在本
技術(shù)領(lǐng)域
是熟知的,例如參見美國專利6,241,849;6,066,233;5,582,681。例如,一方面,本發(fā)明提供了對(duì)含有染料的印刷過的紙進(jìn)行脫墨和脫色的方法,包括使印刷過的紙變成漿狀物,以得到紙漿,并在存在本發(fā)明的酶(也可以加入其它酶)的情況下從紙漿中移去油墨。另一方面,本發(fā)明提供了增加紙漿的打漿度的方法,所述紙漿例15如由再生纖維制成的紙漿,這可以通過將含有本發(fā)明的酶的酶促混合物(也可以含有其它酶,例如果膠酶)加入到紙漿中,在可引起反應(yīng)的條件下進(jìn)行處理,以產(chǎn)生酶促處理的紙漿。酶促處理的紙漿的打漿度相對(duì)于再生纖維紙漿的初始打漿度有所增加,光度沒有損失。本發(fā)明的紙、木材或紙漿處理或再循環(huán)工藝還可以包括使用其它酶的任何20組合,其它酶例如色氨酸酶或酪氨酸脫羧酶、漆酶、過氧化氫酶、漆酶、其它纖維素酶、內(nèi)切糖苷酶、內(nèi)切-P-l,4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖異構(gòu)酶、糖基轉(zhuǎn)移酶、脂酶、磷脂酶、脂氧化酶、P-漆酶、內(nèi)切-p-l,3(4)-漆酶、角質(zhì)酶、過氧化物酶、淀粉酶、葡糖淀粉酶、果膠酶、還原酶、氧化酶、脫羧酶、酚氧化酶、木質(zhì)素酶、支鏈淀粉酶、阿拉伯聚糖酶、半纖維素酶、甘露聚糖酶、25xylolaccases、木聚糖酶、果膠乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果膠裂解酶、轉(zhuǎn)谷氨酰胺酶、果膠甲基酯酶、其它纖維二糖水解酶和/或轉(zhuǎn)谷氨酰胺酶。30微総.術(shù)質(zhì)纖絕素柳艦湮本發(fā)明也提供了用于處理木質(zhì)纖維素纖維的方法,其中所述纖維用本發(fā)明的多肽(如具有纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶活性的酶)處理,所述多肽以足以改進(jìn)纖維特性的量被使用。本發(fā)明的酶也可以在由淀粉強(qiáng)化廢紙和紙板生產(chǎn)或再循環(huán)木質(zhì)纖維素材料如紙漿、紙和紙35板的過程中被使用,尤其是在再次制漿或再循環(huán)發(fā)生在pH高于7的場合,以及本發(fā)明的酶可以通過降解強(qiáng)化淀粉來促進(jìn)廢品離解的場合。本發(fā)明的酶可以在由淀粉涂覆的印刷過的紙制備造紙紙槳的過程中有用。該過程可以按照例如WO95/14807中的描述進(jìn)行。一個(gè)示例性的方法包括分解紙以產(chǎn)生紙漿,在所述分解之前、分解過程中或分解之后用淀粉降解酶進(jìn)行處理,并在分解和酶處理之后從紙漿中分離出油墨顆粒。也參見美國專利6,309,871和本文引述的其它美國專利。5因此,本發(fā)明包括用于再循環(huán)紙漿的酶促脫墨的方法,其中多肽以足以有效地對(duì)纖維表面進(jìn)行脫墨的量使用。游造微辭本發(fā)明提供了包含本發(fā)明的酶的啤酒釀造(例如發(fā)酵)方法,所述酶例如10具有纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的酶。在一個(gè)示例性的方法中,含淀粉的原料被離解,并被加工以形成麥芽。本發(fā)明的酶可以在發(fā)酵過程中的任意階段使用。例如,本發(fā)明的酶可以在大麥麥芽的加工中使用。啤酒釀造的主要原料是大麥麥芽。這可以是一個(gè)三階段過程。首先,大麥谷物被浸漬以增加水含量,例如增加到大約40%左右。第二,所述谷15物可以在15-25'C的溫度孵育3到6天以便發(fā)芽,此時(shí)酶合成在赤霉素的控制下被刺激。酶水平在此期間顯著上升。一方面,本發(fā)明的酶在該過程的這個(gè)(或任意其它)階段加入。酶的作用導(dǎo)致可發(fā)酵的還原糖有所增加。這可以被表示為糖化力(diastaticpower),DP,在12'C糖化力可以在5天內(nèi)從大約80上升到190。本發(fā)明的酶可以在任何啤酒生產(chǎn)方法中使用,例如美國專利5,762,991;205,536,650;5,405,624;5,021,246;4,788,066中所描述的。潛》/7來房邀7"形成欽游主產(chǎn)流沐游流動(dòng)本發(fā)明也包括使用本發(fā)明的酶(如具有纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的酶)的方法,其中所述方法通過除25去在生產(chǎn)作業(yè)過程中形成的粘性的、含淀粉的、破壞性流體來增加來自地下形成物(subterraneanformation)的生產(chǎn)流體(productionfluids)的流動(dòng);這些流體可以在地下形成物中找到,所述地下形成物包圍著整個(gè)井孔。因此,本發(fā)明的方法導(dǎo)致生產(chǎn)液體可以從井孔流出。本發(fā)明的方法還著眼于破壞性流體的問題,該破壞性流體將來自形成物的生產(chǎn)流體的流動(dòng)降低到預(yù)期流速之下。一方面,本發(fā)明30通過將含水流體和本發(fā)明的多肽混合在一起配制成酶處理物(使用本發(fā)明的酶);將酶處理物泵入到井孔內(nèi)的期望位置;允許酶處理物降解粘性、含淀粉的、破壞性流體,從而將流體從地下形成物中移出至井筒的表面;以及其中酶處理物可以有效地攻擊含淀粉流體中的ct葡糖苷鍵。本發(fā)明的地下形成物酶處理方法還可以包括使用其它酶的任何組合,其它35酶例如色氨酸酶或酪氨酸脫羧酶、漆酶、過氧化氫酶、漆酶、其它纖維素酶、內(nèi)切糖苷酶、內(nèi)切-(3-l,4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖異構(gòu)酶、糖基轉(zhuǎn)移酶、脂酶、磷脂酶、脂氧化酶、(3-漆酶、內(nèi)切-(3-l,3(4)-漆酶、角質(zhì)酶、過氧化物酶、淀粉酶、葡糖淀粉酶、果膠酶、還原酶、氧化酶、脫羧酶、酚氧化酶、木質(zhì)素酶、支鏈淀粉酶、阿拉伯聚糖酶、半纖維素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果膠乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋5白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果膠裂解酶、轉(zhuǎn)谷氨酰胺酶、果膠甲基酯酶、其它纖維二糖水解酶和/或轉(zhuǎn)谷氨酰胺酶。1#^組合#^7汰貪#充欽本發(fā)明還提供了含有本發(fā)明的纖維素酶(例如,具有纖維素酶、內(nèi)切葡聚10糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的酶)的藥物組合物和飲食補(bǔ)充物(例如,膳食助劑)。纖維素酶活性包括內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶活性。一方面,藥物組合物和飲食補(bǔ)充物(例如,飲食助劑)被配制用于經(jīng)口攝取,例如,可以提高具有高纖維素或木質(zhì)纖維素成分的食物和飼料的可消化性。15牙周治療化合物可以包括本發(fā)明的酶,例如,如在美國專利6,776,979所述。用于治療或預(yù)防酸性腸道綜合癥的組合物和方法可以包括本發(fā)明的酶,例如,如美國專利6,468,964所述。另一方面,創(chuàng)傷敷料、植入物和類似物包括抗微生物(如,抗生素-作用)酶,包括本發(fā)明的酶(包括,例如,本發(fā)明的示例性序列)。本發(fā)明的酶也可用于20藻酸鹽敷料、抗菌防護(hù)敷料、燒傷敷料、壓迫繃帶、診斷工具、凝膠敷料、透水性敷料(hydro-selectivedressings)、吸水(泡沫)敷料(hydrocellular(foam)dressings)、水膠敷料、I.V敷料、開刀防護(hù)巾(incisedrapes)、低附著敷料(lowadherentdressings)、氣味吸收敷料、石膏繃帶(pastebandages)、術(shù)后敷料、傷疤控制、皮膚護(hù)理、透明膜敷料和/或傷口閉合。本發(fā)明的酶可用于傷口清潔、創(chuàng)面床準(zhǔn)備,25以治療壓迫性潰瘍、腿部潰瘍、燒傷、糖尿病足潰瘍、傷疤、IV固定、手術(shù)創(chuàng)傷和微創(chuàng)。本發(fā)明的酶可用于無菌酶促清創(chuàng)組合物如軟膏中。在各個(gè)方面,纖維素酶被配制成片劑、凝膠、藥丸、植入物、液體、噴劑、粉末、食物、飼料球或配制成膠囊化的制劑。30生激欽激鄉(xiāng)在其它方面,本發(fā)明的纖維素酶(例如,具有內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶活性的酶)可用于生物防御(例如,破壞含有木質(zhì)纖維素材料的孢子或細(xì)菌)。在生物防御應(yīng)用中使用本發(fā)明的纖維素酶提供了顯著的益處,因?yàn)樗鼈兛梢员环浅Q杆俚亻_發(fā),對(duì)抗任何目前未知的或未來的生35物戰(zhàn)劑。此外,本發(fā)明的纖維素酶可用于受侵襲環(huán)境的凈化。一方面,本發(fā)明提供了含有具有纖維素酶活性的多肽的生物防御劑或生物解毒劑,其中所述多肽包括本發(fā)明的序列(包括,例如,本發(fā)明的示例性序列),或者由本發(fā)明的核酸(包括,例如,本發(fā)明的示例性序列)編碼的多肽,其中,任選地,所述多肽具有活性,包括切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶活性。5參考資料列表1.S咖brook^J.andRu幼ell,D.W.2001.MolecularCloning:ALaboratoryManual.ThirdEdition.CoWSpringHaiborLaboratoryPress,NewYork,2.Benhar,I.Biotechnologicalapplicationsofphageandcelldisplay.BiotechnologyAdvances19,1-13.篇.3.Coutinho,P,NLandHends賊B.Caiboliydrate-AcUveEnzymesserveratURL:http:〃afinb.cnrs-mra.fi/~cazy/CAZY/iiKiex.html.l卿,4.Felix;C.R.andLG.LjungdahL1993.Thecellulosome:the欲ocelMarorga加neofClostridium.Annu.Rov.M咖bioI47:791-819.:79l-819.5.Gray,A.,T.H.Ridhatds041CKrete,J.M.Short,F.Bartoefc^KnowlesIL,LKan>Sw助sonP.E,,andRdwrtsonD.B.2001.Rapidevolutionof.reveisibladenaturationandelevatedmeltingtenqwratureinamicrobialhkoalkanedehalogenase.AdvancedSynthesisandCatalysis343:607-617.6.Guttm旭,A.,F.T.Chen,ItA.Evangelist^andN.Cooke.1996,High-resolutioncapillarygelelectrophoresisofreducingoligosaccharideslabeledwith1-aminopyrene-3,6,8-trisulfonate.Anal.Biochem233:234-242.7.Haijunpaa,V.,A.Telema^A.Koivu^L.Ruohonen,T.T,Teeri,O.Te咖an,andT.Drafc幼be塔1996.Cdlo-oligosaccharidehydrolysisbyceUobiohydrolaseIIfromTridiodermareesei.Associationandrateconstantsderivedfiimananalysisofprogresscurves.Eur.JBiochem240:584-591.8.Himmel,M.E.,M.F.Ruth^andC.E.Wyman.1999.Cellukseforcommodityproductsfro邁cellulosicbiomass.Curr.Opin.Biotechnol10:358-364.9.Kerr,R.A.1998.GEOLOGY:TheNextOilCrisisLoomsLarge—andPerhapsClose.Science28i:1128.10.Kerr,R.A.2000.OILOUTLOOK:USGSOptimisticonWorldOilProspects.Science289:237.11.'King,R.W.,K.D.Lustig,P.T.SUikenberg,T.J.McGany,andM.W.Kirschner.1997.Expressioncloninginthetesttube.Science277:973-974.12.Kuritz,T.l卿.Aneasycolorimetricas幼yforscreeningandqualitativea站essmentofdeiodinationandddialogenationbybacterialcultures,Lett.ApplMicrobiol28:445-447.13.L加dberg,KL.S.,P.L,Krete>G.S.ProvostandJ.M.Short.1993.Theuseofselectioninrecoveryoftransgenictargetsformutationanalysis.Mutat.Res.301:99-105.14.MacBCenzic,L.F.,<3.Sukenbacher,C.Divne,T.A.Jtones,汰F.Woldike,M.Schu!eHS.G.Withers,andG.J.Davi饑l卿.CrystalstrucUireofthefamily7endoglucanaseI(Cel7B)fiotnH咖icolainsolensat2.5Aresolutionandidentificationofthecatalyticnucleophilebytrappingofthecovalentglycosyl-enzymeintermediate.Bioch咖J335:409掘.15.Richardson,T.H.,X.Tan,G.Frey,W.Callen,M.Cabell,D.LamJ.Maoomber,J.M.Short,D,E.Robertson^andC.Miller.2002.A加vel,highperformanceenzymeforstarchliquefactiottDiscoveryandoptimizationofalowpH,thermostablealpha-amylase.JBiolChan277:26501-26507.16.SakoAJ"D.Irwin,D.B.Wil幼n,andP.A.Kaiplus.1997.Structureandmechanismofendo/exocellulaseE4fromThermomonosporafGsca.Nat.Struct.Biol4:810-818.17.Short,J.M.,J,M.Fernandez,J.A.Sorge,andW.D.H咖.1988.LambdaZAP:abacteriophagelambdaexpressionvectorwilhinvivoexcisionproperties.NucleicAcidsRes,16:7583-7600.18.Snustad,D.P.,J.P.Hun^perger,B.MChereskinandJ.Messing.1988.MaizegiutaminesynthetasecDNAs:isolatio"ydirectgeneticselectioninBK:heiichiacoli.Genetics120:1111-1123.19.Varrot,A,,S,Hastrup,MSclmlein,andG.J.Davies.1999.Crystalstructureofthecatalyticcoredomainofthefemily6ceUobiohydrolaseH,CeWAfromHumicolainsol咖,at1.92Aresolution.BiochemJf337:297-304.20.Yano,T.,S.Ouc,and凡Kagamiyama.1998.Directedevolutionofanaspartateaminotransferasewithnewsubstratespecificities.Proc.Natl.Acad.SciU.S.A95:5511-5515.21.Zveriov,V.V.,G.A.Velikodvorskaya,andW,H.Schwann2002.Anowlydescribedceilulosomalcellobiohydrolase,CelO,fiomClostridiumtbennoceUum:inv加tigationoftheexo-modeofhydrolysis,andbindingcapacitytocrystaUinecellulose.Microbiology148:247-255.下面的實(shí)施例被提供來進(jìn)行舉例說明,但并不限制所要求保護(hù)的發(fā)明。實(shí)施例5實(shí)施例l:GIGAMATRIXTM篩選—方面,本發(fā)明的方法使用Diversa公司專有的GIGAMATRIxTM平臺(tái);參見PCT專利公布WO01/38583;美國專利申請(qǐng)20050046833;20020080350;美國專利6,918,738;設(shè)計(jì)專利D480,814。例如,一方面,GIGAMATRIX被用于確定多肽是否具有纖維素酶活性以及是否在本發(fā)明范圍內(nèi)的方法中、或者鑒定和分10離具有纖維素酶活性的多肽的方法中。GIGAMATRIX平臺(tái)可以包括基于100,000孔的微板的超高通量篩選,該微板具有常規(guī)96孔板的尺寸。在本實(shí)施例中,基于先前通過CBH示出的活性,使用2種底物,進(jìn)行GIGAMATRIX篩選。測試了甲基-傘形酮酰纖維二糖苷(MUC)和甲基傘形酮酰乳糖苷(MUL)。篩選了噬粒形式的不同克隆,因?yàn)榈?5物擴(kuò)散入細(xì)胞,并且熒光被認(rèn)為更容易檢測到。使用缺乏p-半乳糖苷酶的宿主株,以降低對(duì)乳糖苷底物的活性。乳糖苷底物產(chǎn)生更少的命中(hit),并且被認(rèn)為比纖維素底物更具有專一性。此外,乳糖苷底物產(chǎn)生更少的P-葡糖苷酶命中。為了測試在篩選中使用這些底物的可行性,選擇14個(gè)文庫,基于下列事實(shí)進(jìn)行篩選這些文庫通過先前的篩選程序產(chǎn)生了內(nèi)切葡聚糖酶命中。在受篩選的文庫中,存在20來自11個(gè)篩選文庫的共50個(gè)初步命中。二次篩選由在瓊脂板上植入克隆以及然后將菌落挑選入含有培養(yǎng)基和MUL的384孔板中組成。針對(duì)MUL有活性的克隆從非活性克隆的背景中區(qū)分開來。然后,各個(gè)單獨(dú)的克隆過夜生長,測量熒光,并挑選最具活性的命中物用于測序。對(duì)命中物的所有的基因組克隆插入物進(jìn)行測序??偟膩碚f,命中來自幾個(gè)25不同的糖基水解酶家族,包括家族l、2、5、6、10和16。發(fā)現(xiàn)了幾個(gè)其它命中,其中開放的閱讀框不同源于任何已知的糖基水解酶家族。此外,所述命中物的一些編碼GTP環(huán)化水解酶基因。表1.GIGAMATRIX侖中的概述<table>tableseeoriginaldocumentpage170</column></row><table><table>tableseeoriginaldocumentpage171</column></row><table><table>tableseeoriginaldocumentpage172</column></row><table>縮寫CBM—糖結(jié)合模塊(carbohydratebindingmodule)表征酶和底物活性在GIGAMATRIXTM篩選中發(fā)現(xiàn)的39個(gè)命中物(參見上面的表1)首先針5對(duì)纖維六糖進(jìn)行篩選,確定對(duì)纖維素寡聚體的作用模式?;蚪M克隆被定義為具有完整的DNA插入物的片段,所述DNA插入潛在地含有多個(gè)開放閱讀框。例如,在上面的表1,一個(gè)這樣的基因組克隆含有標(biāo)號(hào)為酶22和22a的兩個(gè)開放閱讀框,其中所述閱讀框分別具有如SEQIDNO:37和SEQIDNO:35所描述的序列。另一個(gè)這樣的基因組克隆含有三個(gè)開放閱讀框,其被標(biāo)號(hào)為酶27、27a和27b。亞克10隆衍生自基因組克隆并可以僅含有單個(gè)開放閱讀框。基因組克隆在含有抗生素的TB培養(yǎng)基中過夜生長,裂解細(xì)胞,通過離心澄清裂解液。用合適的誘導(dǎo)劑誘導(dǎo),使亞克隆生長至OD600=0.5,然后在裂解細(xì)胞并澄清裂解液之前生長額外的3小時(shí)?;蚪M克隆通常比亞克隆具有更低的活性,卻是在大范圍的克隆中評(píng)價(jià)活性的更方便的途徑。使用薄層色譜(TLC)進(jìn)行終點(diǎn)反應(yīng)的初步研究,通常進(jìn)行24h。還用磷酸溶脹纖維素(PASC)測試酶,磷酸溶脹纖維素是晶體纖維素,其通過酸處理來溶脹而更加不定形。許多從環(huán)境文庫克隆出的纖維素酶對(duì)PASC是具有活性的,但是釋放纖維5二糖以及纖維三糖和/或葡萄糖。來自GIGAMATRIX發(fā)現(xiàn)嘗試的基因組克隆也針對(duì)PASC以及針對(duì)纖維素底物例如纖維六糖(Seikagaku,Japan)進(jìn)行了測試。薄層色譜試驗(yàn)表明,一些基因組克隆能夠水解纖維六糖,如在圖6和7中所闡述。在這些克隆中,許多克隆能夠產(chǎn)生葡萄糖作為最終產(chǎn)物,這與這樣的事實(shí)一致它們與包括P-葡糖苷酶在內(nèi)的糖基水解家族1具有序列同一性。幾種酶產(chǎn)生纖維10二糖和/或更大的片段,但是產(chǎn)物模式的確切性質(zhì)還不能通過TLC試驗(yàn)認(rèn)識(shí)清楚,所以,開發(fā)了毛細(xì)管電泳(CE)方法。實(shí)施例2:毛細(xì)管電泳在一些方面,毛細(xì)管電泳(CE)被用在篩選酶活性的測定中,例如,CE15被用于確定多肽是否具有纖維素酶活性以及是否在本發(fā)明的范圍內(nèi)的方法中,或者用于鑒定和分離具有纖維素酶活性的多肽的方法中。毛細(xì)管電泳(CE)提供了快速的運(yùn)行時(shí)間和更高的測定靈敏度的優(yōu)勢。CE法使用l-氨基芘-3,6,8-三磺酸鹽(APTS)作為熒光團(tuán),并針對(duì)與糖類和糖寡聚體的應(yīng)用進(jìn)行優(yōu)化(Guttman(1996)High-resolutioncapillarygelelectrophoresisofreducingoligosaccharideslabeledwith20l-amino[rho]yrene-3,6,8-trisulfonate.Anal.Biochem233:234-242)。對(duì)纖維六糖顯示出活性的酶經(jīng)受對(duì)磷酸溶脹纖維素以及纖維六糖的測試?;虮粊喛寺 ⒈磉_(dá)和使用鎳-螯合柱進(jìn)行純化。酶與底物溫育lh,并使用10cm或48cm毛細(xì)管來分析產(chǎn)物。對(duì)于10cm或48cm的毛細(xì)管,纖維六糖分別在第2和9分鐘洗脫出。在存在低含量的糖的情況下或者如果在混合物中存在污染,48cm毛細(xì)管能夠更好地25分離產(chǎn)物。實(shí)施CE法,對(duì)來自GIGAMATRIX發(fā)現(xiàn)的酶進(jìn)行研究,所述酶在TLC檢測下對(duì)纖維六糖顯示出良好的活性。酶22/22a(參見上面的表1)顯示出對(duì)PASC的良好性能(數(shù)據(jù)總結(jié)于圖8圖中),主要釋放纖維二糖。此外,酶22/22a能夠從AVICELMicrocrystallineCellulose(MCC)(FMCCorporation,Philadelphia,PA)釋放纖維二糖(數(shù)據(jù)概述于圖309圖中)。序列分析顯示,酶22和酶21具有~92%的同一性,并且屬于糖基水解酶家族5。家族5主要含有內(nèi)切葡聚糖酶,但存在纖維二糖水解酶的例子。來自熱纖梭菌的CdO已經(jīng)基于從無定形和晶形纖維素僅釋放纖維二糖的活性被表征為纖維二糖水解酶(Zverlov(2002)Anewlydescribedcellulosomalcellobiohydrolase,CeIO,fromClostridiumthermocellum:investigationoftheexo-modeofhydrolysis,and35bindingcapacitytocrystallinecellulose.Microbiology148:247-255)。當(dāng)與來自解纖維素嗜酸耐熱菌UcWo/ZjmnMSce〃i//o/_y"cws)的內(nèi)切葡聚糖酶比較時(shí),所有這三種酶都具有緊鄰底物結(jié)合位點(diǎn)的插入。該插入能夠形成環(huán),其包住底物結(jié)合位點(diǎn),從而將該酶從內(nèi)切葡聚糖酶轉(zhuǎn)變?yōu)槔w維二糖水解酶。當(dāng)這些酶針對(duì)纖維六糖進(jìn)行測試時(shí),它們主要產(chǎn)生纖維二糖,伴隨更少量的纖維三糖。這些結(jié)果通過如下事實(shí)加以解釋纖維二糖水解酶具有從纖維六糖底物產(chǎn)生纖維5二糖和纖維三糖的能力(Harju叩aa(1996)Cello-oligosaccharidehydrolysisbycellobiohydrolaseIIfrom7WcAocfer附areese/.Associationandrateconstantsderivedfromananalysisofprogresscurves.Eur.JBiochem240:584-591)。實(shí)施例3:基于發(fā)現(xiàn)的序列10本發(fā)明提供了使用本發(fā)明的序列鑒定和分離纖維素酶例如纖維二糖水解酶的方法。在一個(gè)示例性的方法中,與含有纖維二糖水解酶的三個(gè)糖基水解酶家族的保守區(qū)同源的引物被用來篩選衍生自真菌樣品的多核苷酸文庫或DNA。針對(duì)家族48保守區(qū)設(shè)計(jì)引物,并篩選96個(gè)文庫,得到l個(gè)確認(rèn)的命中。此外,針對(duì)家族6和家族7設(shè)計(jì)引物。用這些引物篩選真菌文庫,對(duì)于家族6得到1個(gè)命中,15對(duì)于家族7得到56個(gè)命中。家族7的命中之一被選擇來進(jìn)行研究,以提取出全長序列。全長序列被成功獲得,并顯示出與微紫青霉素(i^"/a7/!'柳ya"/W"eZ/謂)的外切纖維二糖水解酶I具有73%的同一性。實(shí)施例4:具有纖維二糖水解酶活性的酶的遺傳工程化20本實(shí)施例描述了本發(fā)明的示例性酶的遺傳工程化。該酶可用于生物質(zhì)向燃料和化學(xué)品的轉(zhuǎn)化中,以及用于制造基于石油的產(chǎn)品的有效和可持續(xù)的可替代選擇。該酶可以在生物體(例如,微生物,如細(xì)菌)中表達(dá),以參與涉及天然生物質(zhì)轉(zhuǎn)化的化學(xué)循環(huán)。一方面,該酶以"酶裝配體"使用,用于將纖維素和半纖維素聚合物有效解聚成可代謝的碳部分。如上所討論,本發(fā)明提供了發(fā)現(xiàn)和執(zhí)行最25有效的酶的方法,以使這些重要的新的"生物質(zhì)轉(zhuǎn)化"和可選擇的能源工業(yè)工藝可行。使用宏基因組發(fā)現(xiàn)法(metagenomicdiscovery)和定向進(jìn)化的非隨機(jī)法(稱為DIRECTEVOLUTION,如在例如美國專利6,939,689所述,其包括基因位點(diǎn)飽和誘變(GSSM)(如上所討論,也參見美國專利6,171,820和6,579,258)以及可調(diào)基30因再裝配(TunableGeneReassembly(TGR)(參見,例如美國專利6,537,776)技術(shù)。該工作集中于發(fā)現(xiàn)和優(yōu)化用于將纖維素還原成葡萄糖的重要的酶成分——纖維二糖水解酶。使用Diversa公司的GIGAMATRIX高通量表達(dá)篩選平臺(tái)(如上討論),執(zhí)行酶發(fā)現(xiàn)篩選,以使用甲基傘形酮酰纖維二糖苷作為底物來鑒定纖維二糖水解35酶??偣埠Y選100個(gè)復(fù)雜的(復(fù)合)環(huán)境文庫,得到25個(gè)驗(yàn)證的纖維二糖水解酶命中,其主要來自糖基水解酶家族5和10。這些命中的活性通過AVICELMicrocrystallineCellulose(MCC)(FMCCorporation,Philadelphia,PA)力Q以表征。基于其性能特征,一個(gè)酶,SEQIDNO:162(由例如SEQIDNO:161編碼)被選擇作為候選,用于利用基于位點(diǎn)飽和誘變(GSSM)技術(shù)進(jìn)行優(yōu)化。然而,在進(jìn)行GSSM進(jìn)化之前,從SEQIDNO:162除去信號(hào)序列(氨基酸1到30),并且加入起始甲硫5氨酸。該無信號(hào)的序列——下文稱為"野生型"并由SEQIDNO:164(由例如SEQIDNO:163編碼)表示,是親本序列,對(duì)其使用GSSM技術(shù)進(jìn)行優(yōu)化。如上所討論,GSSM技術(shù)可以快速將蛋白質(zhì)中的所有氨基酸以順序方式突變成其它19種氨基酸。使用基于纖維的測定來篩選突變體,并鑒定出表現(xiàn)出單個(gè)氨基酸變化的潛在的上游突變型(upmutants)。這些上游突變型被組合成新的文庫,該新文庫代表10著上游突變型的組合。篩選該文庫,結(jié)果鑒定出幾種候選酶,可以用于商業(yè)化。研究總結(jié)GIGAMATRIX篩選GIGAMATRIX(GMx)篩選平臺(tái)是基于100,000孔的微板的超高通量方15法,該微板具有常規(guī)96孔板的尺寸(詳見階段II應(yīng)用)。該篩選采用熒光底物?;谙惹笆境龅睦w維素酶活性,使用2種底物,進(jìn)行GMx篩選。甲基-傘形酮酰纖維二糖苷(MUC)用作篩選底物。此外,試鹵靈-(3-吡喃葡萄糖苷也被包括在該篩選內(nèi),以消除對(duì)兩種底物都具有活性并假定為P-葡糖苷酶的克隆。篩選擴(kuò)增的噬菌體或噬粒形式的目標(biāo)文庫。使用兩種缺乏P-半乳糖苷酶基20因的宿主株(CEH6&GAL631),以降低對(duì)所述底物的內(nèi)源性宿主活性。選擇100個(gè)文庫,基于如下事實(shí)進(jìn)行篩選這些文庫通過以前的篩選程序產(chǎn)生了纖維素酶命中。在篩選的文庫中,在篩選文庫的69個(gè)文庫中總共有355個(gè)初步命中。二次篩選由在瓊脂板上鋪入克隆以及然后將菌落挑選入含有培養(yǎng)基和甲基傘形酮酰纖維二糖苷(MUC)的384孔板中組成,稱為"breakout"。圖10以顯25示典型的GIGAMATRIX(GMx)breakout的圖形數(shù)據(jù)加以舉例說明。為得到該數(shù)據(jù),針對(duì)MUC有活性的克隆(即,能夠水解甲基傘形酮酰纖維二糖苷)從非活性克隆的背景中區(qū)分開來。然后,各個(gè)單獨(dú)的克隆過夜生長,測量熒光,并挑選最具活性的命中物用于測序。在圖10中,X軸表示樣品名稱;Y軸是相對(duì)熒光單位。陽性"命中物"被鋪入瓊脂板上,然后將菌落挑選入含有LB+抗生素和50nM30MUC的384孔板中,并過夜生長。表2.GIGAMATRIX(GMx)命中概述酶編開放閱讀框SEOIDNO:克隆家族特征40SEQIDNO:104(由例如SEQIDNO:103編碼)家族5(纖維素酶)41SEQIDNO:108(由例如SEQIDNO:107編碼)家族5(纖維素酶)42SEQIDNO:112(由例如SEQIDNO:lll編碼)H7SEQIDNO:60(由例如SEQIDNO:59編碼)43SEQIDNO:82(由例如SEQIDNO:81編碼)44SEQIDNO:78(由例如SEQIDNO:77編碼)45SEQIDNO:68(由例如SEQIDNO:67編碼)45aSEQIDNO:70(由例如SEQIDNO:69編碼)46SEQIDNO:74(由例如SEQIDNO:73編碼)47SEQIDNO:110(由例如SEQIDNO:109編碼)48SEQIDNO:106(由例如SEQIDNO:106編碼)49SEQIDNO:66(由例如SEQIDNO:65編碼)50SEQIDNO:72(由例如SEQIDNO:71編碼)51SEQIDNO:80(由例如SEQIDNO:79編碼)H8SEQIDNO:62(由例如SEQIDNO:61編碼)H8aSEQIDNO:64(由例如SEQIDNO:63編碼)52SEQIDNO:76(由例如SEQIDNO:75編碼)53SEQIDNO:160(由例如SEQIDNO:159編碼)54SEQIDNO:88(由例如SEQIDNO:87編碼)55SEQIDNO:148(由例如SEQIDNO:147編碼)56SEQIDNO:90(由例如SEQIDNO:89編碼)57SEQIDNO:152(由例如SEQIDNO:151編碼)58SEQIDNO:150(由例如SEQIDNO:149編碼)59SEQIDNO:154(由例如SEQIDNO:153編碼)H6SEQIDNO:158(由例如SEQIDNO:157編碼)60SEQIDNO:156(由例如SEQIDNO:155編碼)家族5(纖維素酶)家族5(纖維素酶)家族5(纖維素酶)家族5(纖維素酶)家族5(纖維素酶)-ORF2家族26(甘露聚糖酶)-ORF4家族10(木聚糖酶)家族10(木聚糖酶)家族5(纖維素酶)家族10(木聚糖酶)家族5(纖維素酶)家族5(纖維素酶)家族5(纖維素酶)-ORF1家族5(纖維素酶)-ORF4家族5(纖維素酶)家族10(木聚糖酶)家族5(纖維素酶)家族10(木聚糖酶)家族5(纖維素酶)家族5(纖維素酶)家族5(纖維素酶)家族5(纖維素酶)家族5(纖維素酶)家族5(纖維素酶)對(duì)來自命中物的所有基因組克隆插入進(jìn)行測序。如同上面的表1,一些基因組克隆含有一個(gè)以上的開放閱讀框。例如,一個(gè)這樣的基因組克隆含有兩個(gè)開放閱讀框,其編號(hào)為酶H8和H8a,其中所述閱讀框分別具有如SEQIDNO:67和5SEQIDNO:69所描述的序列??偣泊嬖趤碜院Y選文庫的17文庫個(gè)中的25個(gè)糖基水解酶命中??偟膩碚f,命中來自幾個(gè)不同的糖基水解酶家族,包括家族5和10。表2(上面)列出了所述命中和它們的身份。發(fā)現(xiàn)了幾個(gè)其它命中,其中開放閱讀框不同源于任何已知的糖基水解酶家族。此外,所述命中的一些編碼GTP環(huán)化水解酶基因,它們?cè)谠撓到y(tǒng)中已知為假陽性,因?yàn)闊o論底物是否降解它們都產(chǎn)生熒光??傮w上,該篩選在鑒定對(duì)于MUC具有活性的酶中是成功的。魏對(duì)在GIGAMATRIXTM篩選中發(fā)現(xiàn)的基因進(jìn)行測序,并分析數(shù)據(jù)。使用軟5件系統(tǒng)標(biāo)注開放閱讀框(ORF)。ORF被亞克隆入合適的載體,其中導(dǎo)入有編碼C末端His標(biāo)簽的DNA。構(gòu)建物DNA被轉(zhuǎn)化入合適的大腸桿菌宿主中并表達(dá),用于特征研究。針對(duì)磷酸溶脹纖維素(PASC)篩選基因產(chǎn)物。PASC是通過酸處理溶脹而更加不定形的晶體纖維素。PASC由AVICELMicrocrystallineCellulose(MCC)制備。培養(yǎng)亞克隆,表達(dá)并裂解。裂解液與PASC—起溫育,使用二辛可寧10酸(bicinchoninicacid,BCA)還原糖測定法,分析反應(yīng)產(chǎn)物。選擇最具活性的亞克隆,用于大規(guī)模培養(yǎng)和純化。測定這些亞克隆對(duì)PASC的比活性。還通過毛細(xì)管電泳(CE)分析亞克隆。裂解液與底物溫育30小時(shí)。用熒光團(tuán)l-氨基芘-3,6,8-三磺酸鹽(APTS)衍生化反應(yīng)產(chǎn)物。使用48cm毛細(xì)管分析產(chǎn)物。在第6分鐘洗脫出纖維二糖。圖11以圖形數(shù)據(jù)進(jìn)行舉例說明,該數(shù)據(jù)示出15了通過毛細(xì)管電泳(CE)分析得到的所選擇的酶針對(duì)PASC的活性。樣品H9至Hl是單獨(dú)的克隆。在圖11中,許多樣品具有代表加工酶(processiveenzymes)的反應(yīng)產(chǎn)物特征。加工酶被定義為纖維二糖/(葡萄糖+纖維三糖)的比率為IO的酶。兩種最具活性的潛在加工酶對(duì)PASC分別具有0.35和0.04U/mg的比活性。20畢赤酵母中的真菌CBH〖0563]新發(fā)現(xiàn)的家族6&7真菌纖維二糖水解酶的基因被轉(zhuǎn)化入畢赤酵母中,并且在固體瓊脂板上鋪展轉(zhuǎn)化。對(duì)于每一個(gè)構(gòu)建物,選擇160個(gè)克隆。樣品被培養(yǎng)和誘導(dǎo),上清與PASC在存在p-葡糖苷酶的情況下一起溫育。使用葡萄糖-氧化酶測定法分析反應(yīng)產(chǎn)物。糖基水解酶家族6纖維二糖水解酶在畢赤酵母中成功地異源25表達(dá)。內(nèi)切-外切作用纖維素酶野生型酶,在酶篩選中發(fā)現(xiàn)的家族9糖基水解酶,是褐色熱單孢菌(7T^mo附o"o^ora/^ca)E4的同源物。E4已經(jīng)表現(xiàn)出具有內(nèi)切和外切活性。該30野生型酶的初步測試表明其對(duì)于PASC和AVICELMicrocrystallineCellulose(MCC)都具有活性。反應(yīng)產(chǎn)物的HPLC分析表明主要產(chǎn)物是葡萄糖和纖維二糖。該野生型酶是多結(jié)構(gòu)域蛋白,其包括糖基水解酶家族9催化結(jié)構(gòu)域、家族3纖維素結(jié)合結(jié)構(gòu)域以及被認(rèn)為參與細(xì)胞黏附的三個(gè)細(xì)菌Ig樣結(jié)構(gòu)域。測試該野生型酶的三個(gè)另外的亞克隆變體,以確定所述結(jié)構(gòu)域?qū)钚缘挠绊?。該野生型酶用下?5結(jié)構(gòu)域進(jìn)行亞克隆l)單獨(dú)的催化結(jié)構(gòu)域(CD);2)催化和糖結(jié)構(gòu)域(catalyticandcarbohydratedomain,CCD);和3)催化和糖結(jié)合結(jié)構(gòu)域加上11個(gè)下游氨基酸(CCD+11)。用AVICELMicrocrystallineCellulose(MCC)分析全長蛋白和3個(gè)亞克隆變體,反應(yīng)產(chǎn)物通過BCA還原糖測定法進(jìn)行分析,數(shù)據(jù)概述于圖12中的圖形中。圖12闡述的數(shù)據(jù)是通過野生型酶和截短突變體與AVICELMicrocrystallineCellulose(MCC)在37°C、pH5下溫育74小時(shí)的BCA而獲得。CBH1是陽性對(duì)照。5陰性對(duì)照是無插入物的宿主。該野生型酶,即全長蛋白(SEQIDNO:164,由例如SEQIDNO:163編碼),是最具活性的。該全長蛋白被選擇,用于GSSM進(jìn)化。催化域和糖結(jié)合域被進(jìn)化。GSSM篩選10GSSM技術(shù)(如上討論)被用于快速和順序地將靶蛋白的催化域和糖結(jié)合域的氨基酸突變成19種其它的氨基酸。GSSM篩選的目標(biāo)是鑒定增加對(duì)不溶微晶纖維素的水解程度的突變體。開發(fā)出機(jī)器人篩選方法,從而促進(jìn)GSSM篩選法。來自突變構(gòu)建物的DNA被轉(zhuǎn)化入DH10b宿主細(xì)胞。使用自動(dòng)菌落挑選系統(tǒng),將各個(gè)克隆挑選入含有150pLLB/氨芐青霉素的96孔(淺)板中。在37'C、15400rpm下溫育板24小時(shí)。從每個(gè)孔轉(zhuǎn)移出15的培養(yǎng)物到誘導(dǎo)板中。誘導(dǎo)板的每個(gè)孔含有135^LLB/氨芐青霉素,其中含有UmMIPTG。誘導(dǎo)板在37'C、400rpm下溫育24小時(shí)。離心該板,并丟棄上清。該測定法的自動(dòng)化部分在此時(shí)開始。細(xì)胞被機(jī)器人裂解和重懸。150nL的裂解緩沖液(125nL水加上25nL含有0.2mg/ml溶菌酶和20單位/mlDNaseI的20BPER)被加入到每一個(gè)孔中。從每個(gè)孔轉(zhuǎn)移出15^L裂解物到反應(yīng)板。反應(yīng)板的每個(gè)孔含有185nL反應(yīng)混合物(1%AVICELMicrocrystallineCellulose(MCC),50mM乙酸鈉緩沖液,pH5.0)。反應(yīng)板在37。C、95%的濕度下溫育30小時(shí)。在溫育后,離心該板,15nL的上清被轉(zhuǎn)移到BCA板。BCA板含有50nL試劑A、50^L試劑B和80nL400mM碳酸鹽緩沖液,每孔pH10。用橡膠封條覆蓋該板,25并在8(TC下溫育30分鐘,然后,通過離心冷卻,在A560處讀取吸光值。鐽至少80個(gè)隨機(jī)突變克隆針對(duì)每個(gè)氨基酸位點(diǎn)進(jìn)行篩選。初步GSSMTM篩選數(shù)據(jù)的例子在圖13中加以圖示闡述。欄6含有野生型樣品,而欄12含有宿主/30載體陰性對(duì)照。在與AVICELMicrocrystallineCellulose(MCC)溫育30小時(shí)后,從野生型樣品產(chǎn)生的信號(hào)為大約0.53,標(biāo)準(zhǔn)偏差為0.07。陰性對(duì)照具有0.29的平均信號(hào)。具有比陽性對(duì)照的平均值加上2倍標(biāo)準(zhǔn)偏差更高的信號(hào)的樣品被認(rèn)為是初步命中。通過該篩選板,大約十個(gè)初步命中被選擇用于二次確認(rèn)篩選。初步命中在二次測定法中被再確認(rèn)。該測定法與初步篩選相同。然而,樣35品以四份進(jìn)行試驗(yàn)。二次GSSM篩選的例子在圖14中圖示闡述??譋3-H3、A4-D4、A7-D7中的樣品平均而言具有比野生型更高的活性。這12個(gè)孔相應(yīng)于3個(gè)命中,因?yàn)樗鰳悠芬运姆葸M(jìn)行試驗(yàn)。這些樣品是圖13中孔E4、G2和H3中所示的初步命中(板2980-AA89BCA板)。從二次篩選得到77個(gè)命中。這些樣品被測序。所述樣品的三十五個(gè)具有氨基酸變化,22個(gè)具有轉(zhuǎn)座子插入,而其余是野生型或具有缺失。5進(jìn)一歩分析來自二次篩選的命中。將GSSM上游突變體(upmutants)作圖于褐色熱單孢菌E4的晶體結(jié)構(gòu)上。基于氨基酸位置、氨基酸變化和折疊改善分?jǐn)?shù)(foldimprovementscore),區(qū)分樣品的優(yōu)先次序。從GSSM篩選選出八個(gè)上游突變體,它們被選擇來進(jìn)行基因再裝配進(jìn)化,即可調(diào)基因再裝配(TGR),如上所討論的,也參見例如美國專利6,537,776。10表2.選擇用于點(diǎn)定誘變?cè)傺b配的上游突變型<table>tableseeoriginaldocumentpage179</column></row><table>上游突變型的摻混使用基因再裝配(可調(diào)基因再裝配(TGR))技術(shù),在上面的表2中示出15的上游突變型被摻混,以鑒定具有最佳活性的候選?;钚詼y定與GSSM篩選中的相同,只是反應(yīng)物被進(jìn)一步稀釋,以考慮到上游突變型相對(duì)于野生型酶具有增加的活性。圖15以圖形數(shù)據(jù)進(jìn)行舉例說明,該數(shù)據(jù)來自混合的或"摻混(blended)"的GSSMTM篩選測定。總之,本發(fā)明提供了具有纖維素酶活性的酶,其具有下面的基于SEQID20NO:164(由例如SEQIDNO:163編碼)的序列<table>tableseeoriginaldocumentpage180</column></row><table>已經(jīng)描述了本發(fā)明的許多方面。然而,應(yīng)該理解到可以進(jìn)行多種變化,而它們并不背離本發(fā)明的精神和范圍。因此,其它方面在權(quán)利要求的范圍內(nèi)。權(quán)利要求1.分離的或重組的核酸,其包括(a)與如下序列在至少大約20、30、40、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150或更多個(gè)殘基的區(qū)域內(nèi),具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的序列同一性的核酸序列SEQIDNO1、SEQIDNO3、SEQIDNO5、SEQIDNO7、SEQIDNO9、SEQIDNO11、SEQIDNO13、SEQIDNO15、SEQIDNO17、SEQIDNO19、SEQIDNO21、SEQIDNO23、SEQIDNO25、SEQIDNO27、SEQIDNO29、SEQIDNO31、SEQIDNO33、SEQIDNO35、SEQIDNO37、SEQIDNO39、SEQIDNO41、SEQIDNO43、SEQIDNO45、SEQIDNO47、SEQIDNO49、SEQIDNO51、SEQIDNO53、SEQIDNO55、SEQIDNO57、SEQIDNO59、SEQIDNO61、SEQIDNO63、SEQIDNO65、SEQIDNO67、SEQIDNO69、SEQIDNO71、SEQIDNO73、SEQIDNO75、SEQIDNO77、SEQIDNO79、SEQIDNO81、SEQIDNO83、SEQIDNO85、SEQIDNO87、SEQIDNO89、SEQIDNO91、SEQIDNO93、SEQIDNO95、SEQIDNO97、SEQIDNO99、SEQIDNO101、SEQIDNO103、SEQIDNO105、SEQIDNO107、SEQIDNO109、SEQIDNO111、SEQIDNO113、SEQIDNO115、SEQIDNO117、SEQIDNO119、SEQIDNO121、SEQIDNO.123、SEQIDNO125、SEQIDNO127、SEQIDNO129、SEQIDNO131、SEQIDNO133、SEQIDNO135、SEQIDNO137、SEQIDNO139、SEQIDNO141、SEQIDNO143、SEQIDNO145、SEQIDNO147、SEQIDNO149、SEQIDNO151、SEQIDNO153、SEQIDNO155、SEQIDNO157、SEQIDNO159、SEQIDNO161、SEQIDNO163或SEQIDNO165,其中所述核酸編碼至少一個(gè)具有纖維素酶活性的多肽,并且可選地,所述序列同一性通過運(yùn)用了序列比較算法的分析或通過視覺觀察來確定;或(b)在嚴(yán)緊條件下與包含下列序列的核酸雜交的核酸序列SEQIDNO1、SEQIDNO3、SEQIDNO5、SEQIDNO7、SEQIDNO9、SEQIDNO11、SEQIDNO13、SEQIDNO15、SEQIDNO17、SEQIDNO19、SEQIDNO21、SEQIDNO23、SEQIDNO25、SEQIDNO27、SEQIDNO29、SEQIDNO31、SEQIDNO33、SEQIDNO35、SEQIDNO37、SEQIDNO39、SEQIDNO41、SEQIDNO43、SEQIDNO45、SEQIDNO47、SEQIDNO49、SEQIDNO51、SEQIDNO53、SEQIDNO55、SEQIDNO57、SEQIDNO59、SEQIDNO61、SEQIDNO63、SEQIDNO65、SEQIDNO67、SEQIDNO69、SEQIDNO71、SEQIDNO73、SEQIDNO75、SEQIDNO77、SEQIDNO79、SEQIDNO81、SEQIDNO83、SEQIDNO85、SEQIDNO87、SEQIDNO89、SEQIDNO91、SEQIDNO93、SEQIDNO95、SEQIDNO97、SEQIDNO99、SEQIDNO101、SEQIDNO103、SEQIDNO105、SEQIDNO107、SEQIDNO109、SEQIDNO111、SEQIDNO113、SEQIDNO115、SEQIDNO117、SEQIDNO119、SEQIDNO121、SEQIDNO.123、SEQIDNO125、SEQIDNO127、SEQIDNO129、SEQIDNO131、SEQIDNO133、SEQIDNO135、SEQIDNO137、SEQIDNO139、SEQIDNO141、SEQIDNO143、SEQIDNO145、SEQIDNO147、SEQIDNO149、SEQIDNO151、SEQIDNO153、SEQIDNO155、SEQIDNO157、SEQIDNO159、SEQIDNO161、SEQIDNO163或SEQIDNO165,其中所述核酸編碼具有纖維素酶活性的多肽,并且所述嚴(yán)緊條件包括洗滌步驟,所述洗滌步驟包括在0.2XSSC中在大約65℃的溫度洗滌大約15分鐘,并且可選地,所述核酸的長度是至少大約20、30、40、50、60、75、100、150、200、300、400、500、600、700、800、900、1000或更多個(gè)殘基,或基因的全長或轉(zhuǎn)錄物的全長;(c)編碼具有如下所示序列的多肽的核酸序列SEQIDNO2、SEQIDNO4、SEQIDNO6、SEQIDNO8、SEQIDNO10、SEQIDNO12、SEQIDNO14、SEQIDNO16、SEQIDNO18、SEQIDNO20、SEQIDNO22、SEQIDNO24、SEQIDNO26、SEQIDNO28、SEQIDNO30、SEQIDNO32、SEQIDNO34、SEQIDNO36、SEQIDNO38、SEQIDNO40、SEQIDNO42、SEQIDNO44、SEQIDNO46、SEQIDNO48、SEQIDNO50、SEQIDNO52、SEQIDNO54、SEQIDNO56、SEQIDNO58、SEQIDNO60、SEQIDNO62、SEQIDNO64、SEQIDNO66、SEQIDNO68、SEQIDNO70、SEQIDNO72、SEQIDNO74、SEQIDNO76、SEQIDNO78、SEQIDNO80、SEQIDNO82、SEQIDNO84、SEQIDNO86、SEQIDNO88、SEQIDNO90、SEQIDNO92、SEQIDNO94、SEQIDNO96、SEQIDNO98、SEQIDNO100、SEQIDNO102、SEQIDNO104、SEQIDNO106、SEQIDNO108、SEQIDNO110、SEQIDNO112、SEQIDNO114、SEQIDNO116、SEQIDNO118、SEQIDNO120、SEQIDNO122、SEQIDNO124、SEQIDNO126、SEQIDNO128、SEQIDNO130、SEQIDNO132、SEQIDNO134、SEQIDNO136、SEQIDNO138、SEQIDNO140、SEQIDNO142、SEQIDNO144、SEQIDNO146、SEQIDNO148、SEQIDNO150、SEQIDNO152、SEQIDNO154、SEQIDNO156、SEQIDNO158、SEQIDNO160、SEQIDNO162、SEQIDNO164或SEQIDNO166;或(d)與(a)、(b)或(c)互補(bǔ)的核酸序列。2.權(quán)利要求1所述的分離的或重組的核酸,其中所述核酸序列包括如下所示的序列SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163或SEQIDNO:165。3.權(quán)利要求1所述的分離的或重組的核酸,其中所述序列比較算法是BLAST2.2.2版本算法,其中過濾設(shè)置被設(shè)置為blastall-pblastp^i"nrpataa"-FF,所有其它選項(xiàng)被設(shè)置為缺省。4.權(quán)利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括內(nèi)切葡25聚糖酶活性。5.權(quán)利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括纖維二糖水解酶活性。6.權(quán)利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括p-葡糖苷酶或甘露聚糖酶活性。7.權(quán)利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括內(nèi)切纖維素酶活性。8.權(quán)利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括水解葡聚糖,產(chǎn)生更小分子量的多糖或寡聚體。9.權(quán)利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化1,4-P-D-糖苷鍵的水解。10.權(quán)利要求9所述的分離的或重組的核酸,其中所述內(nèi)切纖維素酶活性包括內(nèi)切-l,4-P-內(nèi)纖維素酶活性。11.權(quán)利要求IO所述的分離的或重組的核酸,其中所述1,4-P-D-糖苷鍵活性包括10纖維素、纖維素衍生物、地衣聚糖或谷物中1,4-p-D-糖苷鍵的水解。12.權(quán)利要求11所述的分離的或重組的核酸,其中所述纖維素衍生物包括羧甲基纖維素或羥乙基纖維素。13.權(quán)利要求11所述的分離的或重組的核酸,其中所述谷物包含P-D-葡聚糖或木糖葡聚糖。14.權(quán)利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化葡聚糖酶鍵的水解。15.權(quán)利要求14所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化(3-l,4-和/或P-l,3-葡聚糖酶鍵的水解。16.權(quán)利要求14所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化25內(nèi)切-葡聚糖鍵的水解。17.權(quán)利要求16所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化水解內(nèi)-l,4-卩-D-葡聚糖4-葡聚糖水解酶活性。18.權(quán)利要求16所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化內(nèi)部的內(nèi)-p-l,4-葡聚糖酶鍵和/或P-l,3-葡聚糖酶鍵的水解。19.權(quán)利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化內(nèi)部卩-l,3-葡糖苷鍵的水解。20.權(quán)利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括水解含吡喃型葡萄糖的多糖。21.權(quán)利要求20所述的分離的或重組的核酸,其中纖維素酶活性包括水解含1,4-P-糖苷鍵連接的D-吡喃型葡萄糖的多糖。22.權(quán)利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括水解纖維素、纖維素衍生物或半纖維素。23.權(quán)利要求22所述的分離的或重組的核酸,其中所述纖維素酶活性包括水解10木材或紙漿或木材制品或紙制品中的纖維素或半纖維素。24.權(quán)利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化飼料、食品或飲料中葡聚糖的水解。25.權(quán)利要求24所述的分離的或重組的核酸,其中所述飼料、食品或飲料包括基于谷物的動(dòng)物飼料、麥芽汁或啤酒、面團(tuán)、水果或蔬菜。26.權(quán)利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化微生物細(xì)胞、真菌細(xì)胞、哺乳動(dòng)物細(xì)胞、植物細(xì)胞或任何含有纖維素部分的植物材料中葡聚糖的水解。27.權(quán)利要求l所述的分離的或重組的核酸,其中所述纖維素酶活性是熱穩(wěn)定的。28.權(quán)利要求27所述的分離的或重組的核酸,其中所述多肽在包括如下的溫度25范圍的條件下保持纖維素酶活性大約37'C到大約95'C之間;或大約55'C到大約85'C之間;或大約70'C到大約75'C之間;或大約70'C到大約95'C之間;或大約90°C到大約95t之間,或者在如下范圍內(nèi)的溫度下保持纖維素酶活性在大約rc到大約5'C之間,大約5'C到大約15'C之間,大約15'C到大約25'C之間,大約25'C到大約37。C之間,或大約37。C到大約95。C、96'C、97°C、98。C或99'C之間。29.權(quán)利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性是耐熱的。30.權(quán)利要求29所述的分離的或重組的核酸,其中所述多肽在暴露于如下范圍內(nèi)的溫度后保持纖維素酶活性37'C以上到大約95'C,55'C以上到大約85'C,或大約70'C到大約75'C之間,或90°C以上到大約95°C,或在暴露于如下范圍內(nèi)的溫度后保持纖維素酶活性在大約1'C到大約5'C之間,大約5'C到大約15'C之間,大約15'C到大約25'C之間,大約25'C到大約37"之間,或大約37。C到大約95°C、96'C、97°C、98。C或99。C之間。31.核酸探針,其用于鑒定編碼具有纖維素酶活性的多肽的核酸,其中所述探針包含權(quán)利要求1所述的序列的至少20、30、40、50、60、75、100或150或更多個(gè)連續(xù)堿基,其中所述探針通過結(jié)合或雜交鑒定所述核酸,其中,可選地,所述探針包括寡核苷酸,所述寡核苷酸含有至少大約10到50、大約20到60、大約30到70、大約40到80、大約60到100或大約50到150個(gè)連續(xù)堿基,其中,可選地,所述探針包括SEQIDNO:1、SEQIDN0:3、SEQIDN0:5、SEQIDN0:7、SEQIDN0:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15中所示的序列的連續(xù)堿基。32.擴(kuò)增引物對(duì),其用于擴(kuò)增編碼具有纖維素酶活性的多肽的核酸,其中所述擴(kuò)15增引物對(duì)(a)能夠擴(kuò)增包含權(quán)利要求l所述的序列或其子序列的核酸;或(b)包括第一成員和第二成員,所述第一成員具有SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:lOl、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163或SEQIDNO:165的大約前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多個(gè)殘基所示的序列,所述第二成員具有所述第一成員的互補(bǔ)鏈的大約前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多個(gè)殘基所示的序列,其中,可選地,所述擴(kuò)增引物對(duì)的成員包括寡核苷酸,所述寡核苷酸包括所述序列的至少大約10到50個(gè)連續(xù)堿基,或者包括所述序列的大約12、13、14、15、16、517、18、19、20、21、22、23、24、25、26、27、28、29、30或更多個(gè)連續(xù)堿基。33.編碼纖維素酶的核酸,其通過使用權(quán)利要求32所示的擴(kuò)增引物對(duì)擴(kuò)增多核苷酸而產(chǎn)生,其中可選地,所述擴(kuò)增通過聚合酶鏈反應(yīng)(PCR)進(jìn)行。34.權(quán)利要求33所述的編碼纖維素酶的核酸,其中所述核酸通過擴(kuò)增基因文庫產(chǎn)生,并且可選地,所述基因文庫是環(huán)境文庫。35.分離的或重組的纖維素酶,其由權(quán)利要求33所述的編碼纖維素酶的核酸編碼。36.擴(kuò)增編碼具有纖維素酶活性的多肽的核酸的方法,包括用權(quán)利要求32所述的擴(kuò)增引物對(duì)擴(kuò)增模板核酸。37.表達(dá)序列盒,其包含含有權(quán)利要求l所述序列的核酸。38.載體,所述載體包含含有權(quán)利要求1所述序列的核酸,其中可選地,所述載體包括表達(dá)載體。39.克隆載體,其包含含有權(quán)利要求l所述序列的核酸,其中,可選地,所述克隆載體包括病毒載體、質(zhì)粒、噬菌體、噬粒、黏粒、fos-質(zhì)粒、細(xì)菌噬菌體或人工染色體,并且可選地,所述病毒載體包括腺病毒載體、逆轉(zhuǎn)錄病毒載體或腺相關(guān)病毒載體,并且可選地,所述克隆載體包括細(xì)菌人工染色體(BAC)、質(zhì)粒、細(xì)菌噬菌體P1衍生載體(PAC)、酵母人工染色體(YAC)或哺乳動(dòng)物人工染色體(MAC)。40.轉(zhuǎn)化細(xì)胞,其包括含有權(quán)利要求1所述序列的核酸、或者權(quán)利要求37所述表達(dá)序列盒、權(quán)利要求38所述載體或權(quán)利要求39所述克隆載體,其中可選地,所述細(xì)胞是細(xì)菌細(xì)胞、哺乳動(dòng)物細(xì)胞、真菌細(xì)胞、酵母細(xì)胞、昆蟲細(xì)胞或植物細(xì)胞。41.轉(zhuǎn)基因非人動(dòng)物,其含有權(quán)利要求l所述序列,其中可選地,所述轉(zhuǎn)基因非人動(dòng)物是小鼠或大鼠。42.轉(zhuǎn)基因植物,其含有權(quán)利要求l所述序列,其中可選地,所述植物是玉米植物、高粱植物、馬鈴薯植物、番茄植物、小麥植5物、含油種子植物、油菜籽植物、大豆植物、水稻植物、大麥植物、草或煙草植物。43.轉(zhuǎn)基因種子,其含有權(quán)利要求1所述序列,其中可選地,所述種子是玉米種子、小麥粒、含油種子、油菜籽、大豆種子、棕櫚核、向日葵種子、芝麻種子、水稻、大麥、花生或煙草植物種子。44.反義寡核苷酸,其包括與權(quán)利要求1所述序列或其子序列互補(bǔ)的核酸序列或能與權(quán)利要求1所述序列或其子序列在嚴(yán)緊條件下雜交的核酸序列,其中可選地,所述反義寡核苷酸的長度在大約10到50、大約20到60、大約30到70、大約40到80或大約60到100個(gè)堿基之間。45.抑制纖維素酶信息在細(xì)胞中翻譯的方法,包括向所述細(xì)胞施用反義寡核苷酸或在所述細(xì)胞中表達(dá)反義寡核苷酸,所述反義寡核苷酸包括與權(quán)利要求1所述序列互補(bǔ)的核酸序列或能與權(quán)利要求1所述序列在嚴(yán)緊條件下雜交的核酸序列。46.雙鏈干擾RNA(RNAi)分子,其含有權(quán)利要求1所述序列的子序列,其中,可選地,所述RNAi包括siRNA或miRNA,并且可選地,所述RNAi分子的長度為大約ll、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26或更多個(gè)雙鏈核苷酸。47.抑制纖維素酶在細(xì)胞中表達(dá)的方法,包括向所述細(xì)胞施用權(quán)利要求46所述的雙鏈干擾RNA(RNAi)分子或在所述細(xì)胞中表達(dá)權(quán)利要求46所述的雙鏈干擾RNA(RNAi)分子。48.分離的或重組的多肽,(i)具有在至少大約20、25、30、35、40、45、50、55、60、75、100、150、200、250、300或更多個(gè)殘基的區(qū)域內(nèi),與SEQIDN0:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:亂SEQID5NO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:llO、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164或SEQIDNO:166具有至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、1592%、93%、94%、95%、96%、97%、98%、99%或更高或100%的序列同一性的氨基酸序列,其中,可選地,所述序列同一性通過運(yùn)用了序列比較算法的分析或通過視覺觀察來確定,以及可選地,所述序列比較算法是BLAST2.2.2版本算法,其中過濾設(shè)置被設(shè)置為blastall-pblastp"d"nrpataa"-FF,所有其它選項(xiàng)被設(shè)置為缺省;(ii)具有由權(quán)利要求1所述的核酸編碼的氨基酸序列,其中所述多肽具有纖維素酶活性或具有免疫原性活性,這在于它能夠產(chǎn)生特異性結(jié)合具有下列序列的多肽的抗體SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQDDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQID30NO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164或SEQIDNO:166;或(iii)具有(i)或(ii)所示氨基酸序列,或者由權(quán)利要求1所示核酸編碼的多肽,并且包含至少一個(gè)氨基酸殘基保守取代,其中,可選地,保守取代包括脂肪族氨基酸用另一個(gè)脂肪族氨基酸取代;絲氨酸用蘇氨酸取代,或蘇氨酸用絲氨酸取代;酸性殘基用另一個(gè)酸性殘基取代;具有酰胺基團(tuán)的殘基用另一個(gè)具有酰胺基團(tuán)的殘基取代;堿性殘基用另一個(gè)堿性殘基來交換;或芳香族殘基用另一個(gè)芳香族殘基取代,或其組合,并且可選地,所述脂肪族殘基包括丙氨酸、纈氨酸、亮氨酸、異亮氨酸或其合成等價(jià)物;所述酸性殘基包括天冬氨酸、谷氨酸或其合成等價(jià)物;所述包含酰胺基團(tuán)的殘基包括天冬酰胺、谷氨酰胺或其合成等價(jià)物所述堿性殘基包括賴氨酸、精氨酸或其合成等價(jià)物;或者,所述芳香族殘基包括苯丙氨酸、酪氨酸或其合成等價(jià)物。49.權(quán)利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括內(nèi)切葡聚糖酶活性。50.權(quán)利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括纖維二糖水解酶活性。51.權(quán)利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括(3-葡糖苷酶或甘露聚糖酶活性。52.權(quán)利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括內(nèi)切25纖維素酶活性。53.權(quán)利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括水解葡聚糖,產(chǎn)生更小分子量的多糖或寡聚體。54.權(quán)利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化1,4-P-D-糖苷鍵的水解。55.權(quán)利要求54所述的分離的或重組的多肽,其中所述內(nèi)切纖維素酶活性包括內(nèi)切-l,4-P-內(nèi)纖維素酶活性。56.權(quán)利要求54所述的分離的或重組的多肽,其中所述1,4-P-D-糖苷鍵活性包括纖維素、纖維素衍生物、地衣聚糖或谷物中1,4-P-D-糖苷鍵的水解。57.權(quán)利要求56所述的分離的或重組的多肽,其中所述纖維素衍生物包括羧甲基纖維素或羥乙基纖維素。58.權(quán)利要求56所述的分離的或重組的多肽,其中所述谷物包括j3-D-葡聚糖或木糖葡聚糖。59.權(quán)利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化0葡聚糖酶鍵的水解。60.權(quán)利要求59所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化p-l,4-和/或P-l,3-葡聚糖酶鍵的水解。61.權(quán)利要求59所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化內(nèi)切葡聚糖酶鍵的水解。62.權(quán)利要求61所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化水解內(nèi)-l,4-l3-D-葡聚糖4-葡聚糖水解酶活性。63.權(quán)利要求61所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化內(nèi)部的內(nèi)-P-l,4-葡聚糖酶鍵和/或P-l,3-葡聚糖酶鍵的水解。64.權(quán)利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化25內(nèi)部的P-l,3-葡糖苷鍵的水解。65.權(quán)利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括水解含吡喃型葡萄糖的多糖。66.權(quán)利要求65所述的分離的或重組的多肽,其中所述纖維素酶活性包括水解含1,4-|3-糖苷鍵連接的D-吡喃型葡萄糖的多糖。67.權(quán)利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括水解纖維素、纖維素衍生物或半纖維素。68.權(quán)利要求67所述的分離的或重組的多肽,其中所述纖維素酶活性包括水解木材或紙漿或木材制品或紙制品中的纖維素或半纖維素。69.權(quán)利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化飼料、食品或飲料中葡聚糖的水解。70.權(quán)利要求69所述的分離的或重組的多肽,其中所述飼料、食品或飲料包括基于谷物的動(dòng)物飼料、麥芽汁或啤酒、面團(tuán)、水果或蔬菜。71.權(quán)利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化10微生物細(xì)胞、真菌細(xì)胞、哺乳動(dòng)物細(xì)胞、植物細(xì)胞或任何含有纖維素部分的植物材料中葡聚糖的水解。72.權(quán)利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性是熱穩(wěn)定的。73.權(quán)利要求72所述的分離的或重組的多肽,其中所述多肽在包括如下的溫度范圍的條件下保持纖維素酶活性大約37'C到大約95'C之間;或大約55'C到大約85'C之間;或大約70'C到大約75。C之間;或大約7(TC到大約95'C之間;或大約到大約95'C之間,或者在如下范圍內(nèi)的溫度下保持纖維素酶活性在大約1'C到大約205'C之間,大約5'C到大約15。C之間,大約15。C到大約25'C之間,大約25'C到大約37'C之間,或大約37'C到大約95t:、96°C、97°C、98'C或99。C之間。74.權(quán)利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性是耐熱的。75.權(quán)利要求74所述的分離的或重組的多肽,其中所述多肽在暴露于如下范圍內(nèi)的溫度后保持纖維素酶活性37。C以上到大約95'C,或55'C以上到大約85。C,或大約7(TC到大約75'C,或90'C以上到大約95。C,或在暴露于如下范圍的溫度后保持纖維素酶活性在大約rC到大約5t:之間,大約5'C到大約15'C之間,大約15'C到大約25'C之間,大約25。C到大約37'C之間,或大約37'C到大約95°C、96'C、97°C、3098。C或99'C之間。76.分離的或重組的多肽,所述多肽包括在權(quán)利要求48中所述的多肽并且缺乏信號(hào)或前導(dǎo)序列或前原序列。77.分離的或重組的多肽,所述多肽包括在權(quán)利要求48中所述的多肽并且具有異源信號(hào)或前導(dǎo)序列或異源前原序列。78.權(quán)利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括,在大約37'C的比活性為每毫克蛋白大約100到大約1000單位,每毫克蛋白大約500到大約750單位,每毫克蛋白大約500到大約1200單位,或每亳克蛋白大約750到大約1000單位。79.權(quán)利要求48所述的分離的或重組的多肽,其中所述耐熱性包括在被加熱到升高的溫度后保留在37'C時(shí)纖維素酶比活性的至少一半的比活性,或者其中所述耐熱性包括在被加熱到升高的溫度后,保持在37'C的每毫克蛋白大約500到大約1200單位的范圍內(nèi)的比活性。80.權(quán)利要求48所述的的分離的或重組的多肽,其中所述多肽包括至少一個(gè)糖基化位點(diǎn),并且可選地,所述糖基化是N連接糖基化,并且可選地,所述多肽在畢赤酵母或裂變酵母中表達(dá)后被糖基化。81.權(quán)利要求48所述的的分離的或重組的多肽,其中所述多肽在包括大約pH6.5、pH6.0、pH5.5、5.0、pH4.5或4.0或更酸性的條件下或在暴露于包括大約pH6.5、pH6.0、pH5.5、5.0、pH4.5或4.0或更酸性的條件下保持纖維素酶活性。82.權(quán)利要求48所述的的分離的或重組的多肽,其中所述多肽在包括大約pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10或pH10.5或更堿性的條件下或在暴露于包括大約pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10或pH10.5或更堿性的條件下保持纖維素酶活性。83.蛋白制劑,所述蛋白制劑包含在權(quán)利要求48中所述的多肽,其中所述蛋白制劑包括液體、固體或凝膠。84.異源二聚體,所述異源二聚體包括在權(quán)利要求48中所述的多肽和第二結(jié)構(gòu)域,其中,可選地,所述第二結(jié)構(gòu)域是多肽,所述異源二聚體是融合蛋白,以及可選30地,所述第二結(jié)構(gòu)域包括表位、免疫原性肽或標(biāo)記物。85.同源二聚體,包括在權(quán)利要求48中所述的多肽。86.固定化多肽或固定化核酸,其中所述多肽包括在權(quán)利要求48中所述的序列,35或其子序列,或者,所述核酸包括權(quán)利要求1所述的核酸,或其子序列,或者權(quán)利要求31所述的探針,其中可選地,所述多肽或核酸被固定在細(xì)胞、金屬、樹脂、聚合物、陶瓷、玻璃、微電極、石墨顆粒、珠子、凝膠、平板、陣列或毛細(xì)管上。87.陣列,包括在權(quán)利要求86中所述的固定化多肽或者權(quán)利要求86中所述的固定化核酸。88.分離的或重組的抗體,其與權(quán)利要求48中所述的多肽特異性結(jié)合,其中可選地,所述抗體是單克隆或多克隆抗體。89.雜交瘤,含有與權(quán)利要求48中所述的多肽特異性結(jié)合的抗體。90.分離或鑒定具有纖維素酶活性的多肽的方法,包括如下步驟-(a)提供權(quán)利要求88中所述的抗體;(b)提供包含多肽的樣品;和(c)將步驟(b)的樣品與步驟(a)的抗體在所述抗體能與所述多肽特異性結(jié)15合的條件下接觸,從而分離或鑒定具有纖維素酶活性的多肽。91.制備抗纖維素酶抗體的方法,包括(a)以足夠的量向非人動(dòng)物施用在權(quán)利要求1中所述的核酸或其子序列,所述的量足以產(chǎn)生體液免疫應(yīng)答,從而產(chǎn)生抗纖維素酶抗體,或20(b)以足夠的量向非人動(dòng)物施用在權(quán)利要求48中所述的多肽或其子序列,所述的量足以產(chǎn)生體液免疫應(yīng)答,從而產(chǎn)生抗纖維素酶抗體。92.產(chǎn)生重組多肽的方法,包括如下步驟(a)提供與啟動(dòng)子可操縱地連接的核酸,其中所述核酸包含權(quán)利要求1所述的序列;和(b)在允許多肽表達(dá)的條件下表25達(dá)步驟(a)的核酸,從而產(chǎn)生重組多肽,其中可選地,所述方法進(jìn)一步包括用步驟(a)的核酸轉(zhuǎn)化宿主細(xì)胞,隨后表達(dá)步驟(a)的核酸,從而在轉(zhuǎn)化細(xì)胞中產(chǎn)生重組多肽。93.用于鑒定具有纖維素酶活性的多肽的方法,所述方法包括如下步驟30(a)提供在權(quán)利要求48中所述的多肽;(b)提供纖維素酶底物;和(c)用步驟(b)的底物接觸所述多肽,并檢測底物量的減少或反應(yīng)產(chǎn)物量的增加,其中所述底物量的減少或所述反應(yīng)產(chǎn)物量的增加檢測出具有纖維素酶活性的多肽。94.用于鑒定纖維素酶底物的方法,包括如下步驟-(a)提供在權(quán)利要求48中所述的多肽;(b)提供測試底物;和(c)用步驟(b)的測試底物接觸步驟(a)的多肽,并檢測底物量的減少或反應(yīng)產(chǎn)物量的增加,其中所述底物量的減少或所述反應(yīng)產(chǎn)物量的增加鑒定出作為纖維素酶底物的測試底物。95.確定測試化合物是否與多肽特異性結(jié)合的方法,所述方法包括如下步驟(a)在允許核酸翻譯為多肽的條件下表達(dá)所述核酸或包含所述核酸的載體,其中所述核酸具有在權(quán)利要求1中所述的序列;(b)提供測試化合物;(C)用所述測試化合物接觸所述多肽;和(d)確定步驟(b)的測試化合物是否與所述多肽特異性結(jié)合。96.確定測試化合物是否與多肽特異性結(jié)合的方法,所述方法包括如下步驟15(a)提供在權(quán)利要求48中所述的多肽;(b)提供測試化合物;(C)用所述測試化合物接觸所述多肽;和(d)確定步驟(b)的測試化合物是否與所述多肽特異性結(jié)合。97.鑒定纖維素酶活性的調(diào)節(jié)劑的方法,所述方法包括如下步驟(a)提供在權(quán)利要求48中所述的多肽;(b)提供測試化合物;(c)用步驟(b)的測試化合物接觸步驟(a)的多肽,并測定該葡聚糖酶的活性,其中在存在測試化合物的情況下測定的纖維素酶活性與不存在測試化合物的情25況下的活性相比的變化,提供了該測試化合物調(diào)節(jié)纖維素酶活性的確定方法。98.權(quán)利要求97所述的方法,其中所述纖維素酶活性通過提供纖維素酶底物并檢測所述底物量的減少或反應(yīng)產(chǎn)物量的增加,或所述底物量的增加或反應(yīng)產(chǎn)物量的減少來測量,30其中,可選地,與沒有所述測試化合物時(shí)底物或反應(yīng)產(chǎn)物的量相比,有測試化合物時(shí)所述底物量的減少或所述反應(yīng)產(chǎn)物量的增加鑒定出作為纖維素酶活性的激活劑的測試化合物,并且可選地,與沒有所述測試化合物時(shí)底物或反應(yīng)產(chǎn)物的量相比,有測試化合物時(shí)所述底物量的增加或所述反應(yīng)產(chǎn)物量的減少鑒定出作為纖維素酶活性的抑制劑的35測試化合物。99.計(jì)算機(jī)系統(tǒng),包括處理器和數(shù)據(jù)存儲(chǔ)設(shè)備,其中所述數(shù)據(jù)存儲(chǔ)設(shè)備上己經(jīng)存儲(chǔ)了多肽序列或核酸序列,其中所述多肽序列包括在權(quán)利要求48中所述的序列,由在權(quán)利要求1中所述的核酸編碼的多肽,5其中可選地,所述計(jì)算機(jī)系統(tǒng)進(jìn)一步包括序列比較算法和數(shù)據(jù)存儲(chǔ)設(shè)備,其中所述數(shù)據(jù)存儲(chǔ)設(shè)備上已經(jīng)存儲(chǔ)了至少一個(gè)參考序列,或者進(jìn)一步包括在所述序列中鑒定一個(gè)或多個(gè)特征的鑒定器,并且可選地,所述序列比較算法包括指明多態(tài)性的計(jì)算機(jī)程序。100.計(jì)算機(jī)可讀介質(zhì),其上已經(jīng)存儲(chǔ)了多肽序列或核酸序列,其中所述多肽序列包括在權(quán)利要求48中所述的多肽,或者由在權(quán)利要求1中所述的核酸編碼的多肽。101.用于鑒定序列中的特征的方法,所述方法包括如下步驟(a)使用可鑒定序列中的一個(gè)或多個(gè)特征的計(jì)算機(jī)程序讀取所述序列,其中所述序列包括多肽序列或15核酸序列,其中所述多肽序列包括在權(quán)利要求48中所述的多肽;由在權(quán)利要求l中所述的核酸編碼的多肽;和(b)用所述計(jì)算機(jī)程序鑒定序列中的一個(gè)或多個(gè)特征。102.用于將第一序列與第二序列進(jìn)行比較的方法,所述方法包括如下步驟(a)通過使用比較序列的計(jì)算機(jī)程序讀取所述第一序列和所述第二序列,其中所述第一序20列包括多肽序列或核酸序列,其中所述多肽序列包括在權(quán)利要求48中所述的多肽或由權(quán)利要求1中所述的核酸編碼的多肽;和(b)用所述計(jì)算機(jī)程序確定所述第一序列和所述第二序列之間的差異,其中可選地,所述方法進(jìn)一步包括確定所述第一序列和所述第二序列之間的差異的步驟,或者可選地,所述方法進(jìn)一步包括鑒定多態(tài)性的步驟,或者可選地,所述方25法進(jìn)一步包括使用鑒定序列中的一個(gè)或多個(gè)特征的鑒定器,或者可選地,所述方法包括使用計(jì)算機(jī)程序讀取所述第一序列,并鑒定該序列的一個(gè)或多個(gè)特征。103.用于從環(huán)境樣品中分離或回收核酸的方法,所述核酸編碼具有纖維素酶活30性的多肽,該方法包括如下步驟(a)提供了在權(quán)利要求32中所述的擴(kuò)增引物對(duì);(b)從所述環(huán)境樣品中分離核酸,或處理所述環(huán)境樣品以便所述樣品中的核酸易于與所述擴(kuò)增引物對(duì)雜交;和(c)將步驟(b)的核酸與步驟(a)的擴(kuò)增引物對(duì)結(jié)合,從所述環(huán)境樣品中35擴(kuò)增出核酸,從而從環(huán)境樣品中分離或回收編碼具有纖維素酶活性的多肽的核酸。104.從環(huán)境樣品中分離或回收核酸的方法,所述核酸編碼具有纖維素酶活性的多肽,該方法包括如下步驟(a)提供包含權(quán)利要求1所述的序列或其子序列的多核苷酸探針,或者權(quán)利要求31所述的探針;5(b)從所述環(huán)境樣品分離核酸,或處理所述環(huán)境樣品,以便所述樣品中的核酸易于與步驟(a)的多核苷酸探針雜交;(c)將步驟(a)的多核苷酸探針與步驟(b)的分離的核酸或處理的環(huán)境樣品結(jié)合;和(d)分離與步驟(a)的多核苷酸探針特異性雜交的核酸,從而從所述環(huán)境樣品10中分離或回收編碼具有纖維素酶活性的多肽的核酸。105.權(quán)利要求103或權(quán)利要求104所述的方法,其中所述環(huán)境樣品包括水樣品、液體樣品、土壤樣品、空氣樣品或生物樣品,并且可選地,所述生物樣品來源于細(xì)菌細(xì)胞、原生動(dòng)物細(xì)胞、昆蟲細(xì)胞、酵母細(xì)胞、植物細(xì)胞、真菌細(xì)胞或哺乳動(dòng)物細(xì)胞。15106.產(chǎn)生編碼具有纖維素酶活性的多肽的核酸變體的方法,包括如下步驟(a)提供包含權(quán)利要求l所述的序列的模板核酸;和(b)在所述模板序列中修飾、刪除或添加一個(gè)或多個(gè)核苷酸,或進(jìn)行修飾、刪除和添加的組合,以產(chǎn)生所述模板核酸的變體,20其中可選地,所述方法進(jìn)一步包括表達(dá)所述變體核酸,以產(chǎn)生變體纖維素酶多肽,以及可選地,所述的修飾、添加或刪除通過包括如下方法中的方法來引入易錯(cuò)PCR、改組、寡核苷酸誘導(dǎo)的定向突變、裝配PCR、有性PCR誘變、體內(nèi)誘變、盒式誘變、遞歸整體誘變、指數(shù)整體誘變、位點(diǎn)特異性誘變、基因再裝配、基因位點(diǎn)飽和誘變(GSSM)、合成連接重裝配(SLR)、重組、遞歸序列重組、硫代磷酸酯修飾25的DNA誘變、含尿嘧啶模板誘變、缺口雙鏈體誘變、點(diǎn)錯(cuò)配修復(fù)誘變、修復(fù)缺陷型宿主株誘變、化學(xué)誘變、放射誘變、缺失誘變、限制選擇誘變、限制純化誘變、人工基因合成、整體誘變、嵌合核酸多聚體生成及其組合,以及可選地,所述方法被迭代重復(fù),直到產(chǎn)生與所述模板核酸編碼的多肽相比具有改變的或不同的活性或者改變的或不同的穩(wěn)定性的纖維素酶。30107.權(quán)利要求106所述的方法,其中所述變體纖維素酶多肽(a)是耐熱的,在暴露于增高的溫度之后仍保持一些活性;(b)與模板核酸編碼的纖維素酶相比,具有增加的糖基化;或(c)在高溫下具有纖維素酶活性,其中由所述模板核酸編碼的纖維素酶在所述高溫下沒有活性。108.權(quán)利要求106所述的方法,其中所述方法被迭代重復(fù),直到(a)產(chǎn)生具有與所述模板核酸的密碼子使用有所不同的密碼子使用的纖維素酶編碼序列,或(b)產(chǎn)生具有比所述模板核酸的信息表達(dá)或穩(wěn)定性更高或更低水平的信息表達(dá)或穩(wěn)定性的纖維素酶基因。109.在編碼具有纖維素酶活性的多肽的核酸中修飾密碼子以增加其在宿主細(xì)胞中的表達(dá)的方法,所述方法包括如下步驟(a)提供編碼具有纖維素酶活性的多肽的核酸,所述核酸包含權(quán)利要求1中所述的序列;和10(b)鑒定步驟(a)的核酸中非優(yōu)選或較不優(yōu)選的密碼子,用優(yōu)選的或中度使用的密碼子來代替它,所述優(yōu)選或中度使用的密碼子編碼與被取代的密碼子相同的氨基酸,其中優(yōu)選密碼子是在宿主細(xì)胞的基因的編碼序列中過度表現(xiàn)的密碼子,非優(yōu)選或較不優(yōu)選密碼子是在宿主細(xì)胞的基因的編碼序列中表現(xiàn)不足的密碼子,從而修飾所述核酸以增加其在宿主細(xì)胞中的表達(dá)。110.在編碼纖維素酶多肽的核酸中修飾密碼子的方法,所述方法包括如下步驟(a)提供編碼具有纖維素酶活性的多肽的核酸,所述核酸包含權(quán)利要求1中所述的序列;和(b)鑒定步驟(a)的核酸中的密碼子,并用不同的密碼子來代替它,所述不20同的密碼子編碼與被取代的密碼子相同的氨基酸,從而修飾在編碼纖維素酶的核酸中的密碼子。111.在編碼纖維素酶多肽的核酸中修飾密碼子以增加其在宿主細(xì)胞中的表達(dá)的方法,該方法包括如下步驟25(a)提供編碼纖維素酶多肽的核酸,所述核酸包含權(quán)利要求1中所述的序列;和(b)鑒定步驟(a)的核酸中的非優(yōu)選或較不優(yōu)選的密碼子,并用優(yōu)選的或中度使用的密碼子來代替它,所述優(yōu)選或中度使用的密碼子編碼與被取代的密碼子相同的氨基酸,其中優(yōu)選密碼子是在宿主細(xì)胞的基因的編碼序列中過度表現(xiàn)的密碼子,非優(yōu)30選或較不優(yōu)選密碼子是在宿主細(xì)胞的基因的編碼序列中表現(xiàn)不足的密碼子,從而修飾所述核酸以增加其在宿主細(xì)胞中的表達(dá)。112.在編碼具有纖維素酶活性的多肽的核酸中修飾密碼子以降低其在宿主細(xì)胞中的表達(dá)的方法,該方法包括如下步驟-35(a)提供編碼纖維素酶多肽的的核酸,所述核酸包含在權(quán)利要求1中所述的序列;禾口(b)鑒定步驟(a)的核酸中的至少一個(gè)優(yōu)選密碼子,并用非優(yōu)選的或較不優(yōu)選的密碼子來代替它,所述非優(yōu)選或較不優(yōu)選的密碼子編碼與被取代的密碼子相同的氨基酸,其中優(yōu)選密碼子是在宿主細(xì)胞的基因的編碼序列中過度表現(xiàn)的密碼子,非優(yōu)選5或較不優(yōu)選的密碼子是在宿主細(xì)胞的基因的編碼序列中表現(xiàn)不足的密碼子,從而修飾所述核酸以降低其在宿主細(xì)胞中的表達(dá),其中可選地,所述宿主細(xì)胞是細(xì)菌細(xì)胞、真菌細(xì)胞、昆蟲細(xì)胞、酵母細(xì)胞、植物細(xì)胞或哺乳動(dòng)物細(xì)胞。113.用于產(chǎn)生核酸文庫的方法,所述核酸編碼多個(gè)被修飾的纖維素酶活性位點(diǎn)或底物結(jié)合位點(diǎn),其中所述被修飾的活性位點(diǎn)或底物結(jié)合位點(diǎn)來源于第一核酸,所述第一核酸包含編碼第一活性位點(diǎn)或第一底物結(jié)合位點(diǎn)的序列,該方法包括如下步驟-(a)提供第一核酸,其編碼第一活性位點(diǎn)或第一底物結(jié)合位點(diǎn),其中所述第一核酸序列包括在嚴(yán)緊條件下與如下所示序列雜交的序列SEQIDNO:l、SEQID15NO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQ20IDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQ翻0:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQID25NO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、30SEQIDNO:159、SEQIDNO:161、SEQIDNO:163或SEQIDNO:165或其子序列,并且所述核酸編碼纖維素酶活性位點(diǎn)或纖維素酶底物結(jié)合位點(diǎn);(b)提供一組誘變寡核苷酸,其在所述第一核酸的多個(gè)目標(biāo)密碼子處編碼天然發(fā)生的氨基酸變體;和(c)使用該組誘變寡核苷酸,產(chǎn)生一組編碼活性位點(diǎn)或編碼底物結(jié)合位點(diǎn)的變35體核酸,其在被誘變的每一氨基酸密碼子處編碼一定范圍的氨基酸變化,從而產(chǎn)生編碼多個(gè)被修飾的纖維素酶活性位點(diǎn)或底物結(jié)合位點(diǎn)的核酸文庫,其中可選地,誘變寡核苷酸或變體核酸通過如下方法中的方法產(chǎn)生優(yōu)化的定向進(jìn)化系統(tǒng)、基因位點(diǎn)飽和誘變(GSSM)或合成連接重裝配(SLR)、易錯(cuò)PCR、改組、寡核苷酸誘導(dǎo)的定向突變、裝配PCR、有性PCR誘變、體內(nèi)誘變、盒式誘變、5遞歸整體誘變、指數(shù)整體誘變、位點(diǎn)特異性誘變、基因再裝配、重組、遞歸序列重組、硫代磷酸酯修飾的DNA誘變、含尿嘧啶模板誘變、缺口雙鏈體誘變、點(diǎn)錯(cuò)配修復(fù)誘變、修復(fù)缺陷型宿主株誘變、化學(xué)誘變、放射誘變、缺失誘變、限制選擇誘變、限制純化誘變、人工基因合成、整體誘變、嵌合核酸多聚體生成及其組合。114.用于產(chǎn)生小分子的方法,包括如下步驟(a)提供多個(gè)能合成或修飾小分子的生物合成酶,其中所述酶中的一種酶包括由包含權(quán)利要求1所述序列的核酸編碼的纖維素酶;(b)為步驟(a)的至少一種酶提供底物;和(c)將步驟(b)的底物與所述酶在能促進(jìn)多個(gè)生物催化反應(yīng)的條件下通過一系15列生物催化反應(yīng)進(jìn)行反應(yīng),以產(chǎn)生小分子。115.用于修飾小分子的方法,所述方法包括如下步驟(a)提供纖維素酶,其中所述酶包括在權(quán)利要求48中所述的多肽,或由包含權(quán)利要求1所述核酸序列的核酸編碼的多肽;20(b)提供小分子;和(c)將步驟(b)的小分子與步驟(a)的酶在能促進(jìn)由所述纖維素酶催化的酶促反應(yīng)的條件下進(jìn)行反應(yīng),從而通過纖維素酶酶促反應(yīng)修飾小分子,其中可選地,步驟(b)包括為步驟(a)的酶提供多個(gè)小分子底物,從而產(chǎn)生由所述纖維素酶催化的至少一種酶促反應(yīng)產(chǎn)生的被修飾小分子的文庫;25并且可選地,所述方法進(jìn)一步包括提供多個(gè)其它的酶,在有助于所述酶介導(dǎo)的多個(gè)生物催化反應(yīng)的條件下使用這些酶,以形成由多個(gè)酶促反應(yīng)產(chǎn)生的被修飾小分子的文庫;并且可選地,所述方法進(jìn)一步包括測試所述文庫的步驟,以確定所述文庫中是否存在表現(xiàn)出期望活性的特定被修飾小分子,其中可選地,測試所述文庫的步驟進(jìn)一步30包括系統(tǒng)性地去除所有但保留一個(gè)用于產(chǎn)生在所述文庫中的多個(gè)被修飾小分子中的一部分小分子的生物催化反應(yīng),方法是通過測試被修飾小分子的所述部分中存在或不存在具有期望活性的特定被修飾小分子,鑒定產(chǎn)生具有期望活性的特定修飾小分子的至少一個(gè)特定生物催化反應(yīng)。116.用于確定纖維素酶的功能片段的方法,包括如下步驟(a)提供纖維素酶,其中該酶包括在權(quán)利要求48中所述的多肽、或由權(quán)利要求l所述的核酸編碼的多肽;和(b)從步驟(a)的序列刪除多個(gè)氨基酸殘基,并測試剩余的子序列的纖維素酶活性,從而確定纖維素酶的功能片段,5其中可選地,所述纖維素酶活性通過提供纖維素酶底物并檢測所述底物量的減少或反應(yīng)產(chǎn)物量的增加來測量。117.通過使用實(shí)時(shí)代謝流分析來獲得新的或修飾的表型的全細(xì)胞工程的方法,該方法包括如下步驟10(a)通過修飾細(xì)胞的遺傳組成來制備修飾的細(xì)胞,其中所述的遺傳組成通過將包含權(quán)利要求1所述序列的核酸加入到所述細(xì)胞中來修飾;(b)培養(yǎng)所述修飾的細(xì)胞以產(chǎn)生多個(gè)修飾細(xì)胞;(c)通過實(shí)時(shí)監(jiān)控步驟(b)的細(xì)胞培養(yǎng)物測量所述細(xì)胞的至少一個(gè)代謝參數(shù);和15(d)分析步驟(c)的數(shù)據(jù),以確定測量的參數(shù)是否與在類似條件下未修飾細(xì)胞中的參照測量值不同,從而使用實(shí)時(shí)代謝流分析鑒定細(xì)胞中的工程表現(xiàn)型,其中可選地,所述細(xì)胞的遺傳組成通過包括在所述細(xì)胞中刪除序列或修飾序列,或敲除基因的表達(dá)的方法來修飾,以及可選地,所述方法進(jìn)一步包括選擇含有新的工程表現(xiàn)型的細(xì)胞,20以及可選地,所述方法進(jìn)一步包括培養(yǎng)所選擇的細(xì)胞,從而產(chǎn)生包含新的工程表型的新細(xì)胞株。118.分離出的或重組的信號(hào)或前導(dǎo)序列,其由(a)權(quán)利要求48所述的氨基酸序列或(b)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:IO、25SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQID30NO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQ35IDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:1645或SEQIDNO:166所述的氨基酸序列的氨基末端殘基1至14、1至15、1至16、I至17、1至18、1至19、1至20、1至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1至29、1至30、1至31、1至32、1至33、1至34、1至35、1至36、1至37、1至38、1至40、1至41、1至42、1至43或1至44所示的氨基酸序列組成。119.嵌合多肽,其含有至少第一結(jié)構(gòu)域和至少第二結(jié)構(gòu)域,所述至少第一結(jié)構(gòu)域含有具有權(quán)利要求118所示氨基酸序列的信號(hào)肽(SP)或前導(dǎo)序列,所述至少第二結(jié)構(gòu)域含有異源的多肽或肽,其中所述異源多肽或肽與所述信號(hào)肽(SP)或前導(dǎo)序列不是天然相關(guān)的,15并且可選地,所述異源多肽或肽不是纖維素酶,以及可選地,所述異源多肽或肽是在所述信號(hào)肽(SP)或前導(dǎo)序列的氨基末端、羧基末端或兩個(gè)末端上。120.編碼嵌合多肽的分離出的或重組的核酸,其中所述嵌合多肽含有至少第一結(jié)構(gòu)域和至少第二結(jié)構(gòu)域,所述至少第一結(jié)構(gòu)域含有具有權(quán)利要求118所示氨基酸序20列的信號(hào)肽(SP)或前導(dǎo)序列,所述至少第二結(jié)構(gòu)域含有異源的多肽或肽,其中所述異源多肽或肽與所述信號(hào)肽(SP)或前導(dǎo)序列不是天然相關(guān)的。121.分離的或重組的核酸,其包含編碼具有纖維素酶活性的多肽和信號(hào)序列的序列,其中所述核酸包含權(quán)利要求l所述的序列。122.權(quán)利要求121所述的分離的或重組的核酸,其中所述信號(hào)序列來源于另一種纖維素酶或非纖維素酶。123.分離的或重組的核酸,其包含編碼具有纖維素酶活性的多肽的序列,其中30所述序列不含有信號(hào)序列,并且所述核酸包含權(quán)利要求l所述的序列。124.增加纖維素酶多肽的耐熱性或熱穩(wěn)定性的方法,所述方法包括對(duì)纖維素酶進(jìn)行糖基化,其中所述多肽包括在權(quán)利要求48中所示的多肽或由權(quán)利要求1所示核酸編碼的多肽的至少30個(gè)連續(xù)氨基酸,從而增加所述纖維素酶的耐熱性或熱穩(wěn)定性。125.在細(xì)胞中過表達(dá)重組纖維素酶的方法,包括表達(dá)含有權(quán)利要求1所示核酸序列的載體,其中所述過表達(dá)通過使用高活性的啟動(dòng)子、雙順反子載體或通過所述載體的基因擴(kuò)增來完成。126.制備轉(zhuǎn)基因植物的方法,所述方法包括如下步驟-5(a)將異源核酸序列導(dǎo)入細(xì)胞中,其中所述異源核酸序列包括權(quán)利要求1所述的序列,從而產(chǎn)生轉(zhuǎn)化的植物細(xì)胞;(b)從所述轉(zhuǎn)化的細(xì)胞產(chǎn)生轉(zhuǎn)基因植物,其中可選地,步驟(a)進(jìn)一步包括通過植物細(xì)胞原生質(zhì)體的電穿孔或顯微注射導(dǎo)入所述異源核酸序列,10以及可選地,步驟(a)包括通過DNA微粒轟擊或通過使用根瘤農(nóng)桿菌宿主將所述異源核酸序列直接導(dǎo)入植物組織中。127.在植物細(xì)胞中表達(dá)異源核酸序列的方法,所述方法包括如下步驟(a)用與啟動(dòng)子可操縱地連接的異源核酸序列轉(zhuǎn)化所述植物細(xì)胞,其中所述異15源核酸序列包括權(quán)利要求I所述的序列(b)在其中所述異源核酸序列在所述植物細(xì)胞中表達(dá)的條件下培養(yǎng)所述植物。128.水解、分解或破壞含葡聚糖或纖維素的組合物的方法,包括下面的步驟(a)提供權(quán)利要求48中所示的具有纖維素酶活性的多肽,或由權(quán)利要求1所示的20核酸編碼的多肽;(b)提供含有纖維素或葡聚糖的組合物;和(c)將步驟(a)的多肽與步驟(b)的組合物在一定條件下接觸,其中所述纖維素酶水解、分解或破壞所述含葡聚糖或纖維素的組合物,其中可選地,所述組合物包括植物細(xì)胞、細(xì)菌細(xì)胞、酵母細(xì)胞、昆蟲細(xì)胞或動(dòng)物25細(xì)胞,以及可選地,所述多肽具有內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶活性。129.面團(tuán)或面包產(chǎn)品,其含有權(quán)利要求48所示的多肽或權(quán)利要求1所示的核酸30編碼的多肽,其中可選地,所述多肽具有纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。130.改進(jìn)面團(tuán)的方法,包括將面團(tuán)或面包產(chǎn)品與權(quán)利要求48中所示的至少一種多肽或權(quán)利要求1所示的核酸編碼的多肽在足以改進(jìn)所述面團(tuán)的條件下接觸。131.飲料,其含有權(quán)利要求48所示的多肽或權(quán)利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。132.生產(chǎn)飲料的方法,其包括向飲料或飲料前體在足以降低所述飲料粘度的條5件下施用至少一種權(quán)利要求48所示的多肽或權(quán)利要求1所示的核酸編碼的多肽,其中可選地,所述飲料或飲料前體是麥芽汁或啤酒。133.食物、詞料或營養(yǎng)補(bǔ)充劑,其含有權(quán)利要求48所示的多肽或權(quán)利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。134.利用纖維素酶作為動(dòng)物飲食中的營養(yǎng)補(bǔ)充劑的方法,所述方法包括制備含有纖維素酶的營養(yǎng)補(bǔ)充劑,所述纖維素酶包含權(quán)利要求48所示多肽或者由權(quán)利要求1所示核酸編碼的多肽的至少三十個(gè)連續(xù)氨基酸;和15向動(dòng)物施用所述營養(yǎng)補(bǔ)充劑,以增加包含在被所述動(dòng)物消化的飼料或食物中的木聚糖的利用,其中,可選地,所述動(dòng)物是人,或者所述動(dòng)物是反芻動(dòng)物或單胃動(dòng)物,以及可選地,所述纖維素酶通過在選自細(xì)菌、酵母、植物、昆蟲、真菌和動(dòng)物的生物體中表達(dá)編碼所述纖維素酶的多核苷酸而制備出來,以及可選地,所述生物體選20自裂變酵母、釀酒酵母、畢赤酵母、大腸桿菌、鏈霉菌屬某種、桿菌屬某種和乳酸桿菌屬某種。135.可食用的酶輸送基質(zhì)或丸,其含有熱穩(wěn)定的重組纖維素酶,所述重組纖維素酶含有權(quán)利要求48所示的多肽或權(quán)利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。136.將纖維素酶補(bǔ)充物輸送至動(dòng)物的方法,所述方法包括制備可食用的酶輸送基質(zhì)或丸,所述基質(zhì)或丸包括顆粒狀的可食用載體和熱穩(wěn)定的重組纖維素酶,其中所述的丸容易將包含在其中的纖維素酶分散至含水介質(zhì)中,并且所述重組的纖維素酶含有權(quán)利要求48所示的多肽或權(quán)利要求1所示的核酸編碼的多肽;以及將所述可食用的酶輸送基質(zhì)或丸給予所述動(dòng)物,其中可選地,所述顆粒狀的可食用載體包括選自谷物胚芽、去油的谷物胚芽、干草、苜蓿、梯牧草、大豆殼、向日葵籽粉和小麥粗粉的載體,以及可選地,所述可食用載劑包括去油的谷物胚芽,以及可選地,所述纖維素酶被糖基化以便提供在制丸條件下的熱穩(wěn)定性,以及可選地,所述輸送基質(zhì)通過將含有谷物胚芽和纖維素酶的混合物制丸而形成,以及可選地,所述制丸條件包括應(yīng)用蒸汽,以及可選地,所述的制丸條件包括應(yīng)5用超過大約80°C的溫度大約5分鐘,所述酶保留每毫克酶至少350至大約900單位的比活性。137.纖維素組合物或纖維素衍生的組合物,其包含權(quán)利要求48所示的多肽或權(quán)利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。138.木材、紙漿或木制品,其含有權(quán)利要求48所示的纖維素酶或權(quán)利要求1所示的核酸編碼的纖維素酶,其中可選地,所述纖維素酶的活性包括內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。139.紙、紙漿或紙產(chǎn)品,其包含權(quán)利要求48所示的多肽或權(quán)利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。140.降低紙、木材或木制品中纖維素含量的方法,包括使所述紙、木材或木制品與權(quán)利要求48所示的纖維素酶或權(quán)利要求1所示的核酸編碼的纖維素酶接觸,其中可選地,所述纖維素酶的活性包括內(nèi)切葡聚糖酶;纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。141.去街劑組合物,其含有權(quán)利要求48所示的纖維素酶或權(quán)利要求1所示的核酸編碼的纖維素酶,其中可選地,所述多肽被配制成不含水的液體組合物、鑄型固體、顆粒形式、微粒形式、壓縮片劑、凝膠、糊劑或漿液的形式,以及可選地,所述纖維素酶的活性包括內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚30糖酶和/或(3-葡糖苷酶活性。142.藥物組合物或飲食補(bǔ)充物,其含有權(quán)利要求48所示的纖維素酶或權(quán)利要求1所示的核酸編碼的纖維素酶,其中可選地,所述纖維素酶被配制成片劑、凝膠、藥丸、植入物、液體、噴劑、35粉末、食物、飼料球或配制成膠囊化的制劑,以及可選地,所述纖維素酶的活性包括內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。143.燃料,其含有權(quán)利要求48所示的多肽或權(quán)利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有活性,包括纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、5甘露聚糖酶和/或P-葡糖苷酶活性,其中可選地,所述燃料來源于植物材料,其任選地包括馬鈴薯、大豆(油菜籽)、大麥、黑麥、玉米、燕麥、小麥、甜菜或甘蔗,以及可選地,所述燃料包括生物乙醇或汽油-乙醇混合物。144.制備燃料的方法,包括使含有纖維素或可發(fā)酵糖類的組合物與權(quán)利要求48所示的多肽或權(quán)利要求1所示的核酸編碼的多肽接觸,其中可選地,所述含有纖維素或可發(fā)酵糖類的組合物包括植物、植物產(chǎn)品或植物衍生物,以及可選地,所述植物或植物產(chǎn)品包括甘蔗植物或植物產(chǎn)品、甜菜或糖用甜菜、小麥、玉米、大豆、馬鈴薯、水稻或大麥,15其中可任選地,所述多肽具有活性,包括纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,以及可選地,所述燃料包括生物乙醇或汽油-乙醇混合物。145.制備生物乙醇的方法,包括使含有纖維素或可發(fā)酵糖類的組合物與權(quán)利要20求48所示的多肽或權(quán)利要求1所示的核酸編碼的多肽接觸,其中可選地,所述含有纖維素或可發(fā)酵糖類的組合物包括植物、植物產(chǎn)品或植物衍生物,以及可選地,所述植物或植物產(chǎn)品包括甘蔗植物或植物產(chǎn)品、甜菜或糖用甜菜、小麥、玉米、大豆、馬鈴薯、水稻或大麥,其中可選地,所述多肽具有活性,包括纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解25酶、甘露聚糖酶和/或P-葡糖苷酶活性。146.酶裝配體,其用于將纖維素和半纖維素聚合物解聚成可代謝的碳部分,包括權(quán)利要求48所示的多肽或權(quán)利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有活性,包括纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解30酶、甘露聚糖酶和/或|3-葡糖苷酶活性。147.加工含有木質(zhì)纖維素的生物質(zhì)材料的方法,包括使含有纖維素或可發(fā)酵糖類的組合物與權(quán)利要求48所示的多肽或權(quán)利要求1所示的核酸編碼的多肽接觸,其中可選地,所述含有木質(zhì)纖維素的生物質(zhì)材料是來源于農(nóng)作物,是食品或飼料35生產(chǎn)的副產(chǎn)物,是木素纖維素廢品,或者是植物殘余或廢紙或廢紙品,并且可選地,所述多肽具有活性,包括纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性,以及可選地,所述植物殘余包括莖、葉、殼、皮、穗軸、木材、木屑、木漿和鋸屑,以及可選地,所述廢紙品包括廢棄的或用過的復(fù)印紙、計(jì)算機(jī)打印紙、筆記本紙、記事本紙、打字機(jī)用紙、報(bào)紙、雜質(zhì)、硬紙和基于紙的包裝材料,以及可選地,所述生物質(zhì)材料的加工產(chǎn)生生物乙醇。148.飲食產(chǎn)品,其含有權(quán)利要求48所示的多肽或權(quán)利要求1所示的核酸編碼的10多肽,其中可選地,所述飲食產(chǎn)品包括牛奶、冰淇淋、奶酪或酸酪,以及可選地,所述多肽具有活性,包括纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。149.改善飲食產(chǎn)品的質(zhì)地和風(fēng)味的方法,其包括下列步驟(a)提供權(quán)利要求1548所示的多肽或權(quán)利要求1所示的核酸編碼的多肽;(b)提供飲食產(chǎn)品;和(c)使步驟(a)的多肽和步驟(b)的飲食產(chǎn)品在其中所述纖維素酶可以改善所述飲食產(chǎn)品的質(zhì)地和風(fēng)味的條件下接觸。150.紡織品或織物,其含有權(quán)利要求48所示的多肽或權(quán)利要求1所示的核酸編20碼的多肽,其中可選地,所述紡織品或織物包括含纖維素的纖維,以及可選地,所述多肽具有活性,包括纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶活性。151.處理固體或液體動(dòng)物廢物的方法,包括下面的步驟(a)提供權(quán)利要求48所示的多肽或權(quán)利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有活性,包括纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性;(b)提供固體或液體動(dòng)物廢物;和(c)使步驟(a)的多肽和步驟(b)的固體或液體廢物在其中所述酶可以處理30所述廢物的條件下接觸。152.加工過的廢品,其包含權(quán)利要求48所示的多肽或權(quán)利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有活性,包括纖維素酶、內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。153.消毒劑,其含有具有纖維素酶活性的多肽,其中所述多肽包括權(quán)利要求48所示的序列,或者權(quán)利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有活性,包括內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。154.生物防御劑或生物解毒劑,其含有具有纖維素酶活性的多肽,其中所述多5肽包括權(quán)利要求48所示的序列,或者權(quán)利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有活性,包括內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。155.分離的或重組的核酸,其具有包含對(duì)SEQIDNO:163的至少一個(gè)核苷酸堿10基殘基修飾的序列,其中所述修飾包括下列改變的一個(gè)或多個(gè)位置265至267的任何一處的核苷酸被修飾,變?yōu)镃GT、CGC、CGA、CGG、AGA或AGG;位置307至309的任何一處的核苷酸被修飾,變?yōu)镚GT、GGC、GGA或GGG;位置328至330的任何一處的核苷酸被修飾,變?yōu)镚GT、GGC、GGA或GGG;15位置340至342的任何一處的核苷酸被修飾,變?yōu)門TA、TTG、CTT、CTC、CTA或CTG;位置469至471的任何一處的核苷酸被修飾,變?yōu)門CT、TCC、TCA、TCG、AGT或AGC;位置1441至1443的任何一處的核苷酸被修飾,變?yōu)門TT或TTC;20位置1648至1650的任何一處的核苷酸被修飾,變?yōu)锳AT或AAC;或者位置1768至1770的任何一處的核苷酸被修飾,變?yōu)镃GT、CGC、CGA、CGG、AGA或AGG。156.分離的或重組的多肽,其具有包含對(duì)SEQIDNO:164的至少一個(gè)氨基酸殘25基修飾的序列,其中所述修飾包括下列改變的一個(gè)或多個(gè)氨基酸位置89的甲硫氨酸被修飾為精氨酸;氨基酸位置103的苯丙氨酸被修飾為甘氨酸;氨基酸位置110的脯氨酸被修飾為甘氨酸;氨基酸位置114的酪氨酸被修飾為亮氨酸;30氨基酸位置157的丙氨酸被修飾為絲氨酸;氨基酸位置481的色氨酸被修飾為苯丙氨酸;氨基酸位置550的脯氨酸被修飾為天冬酰胺;或氨基酸位置590的甘氨酸被修飾為精氨酸。157.分離的或重組的核酸,其具有包含對(duì)下列序列的核苷酸殘基序列修飾的序歹!j:SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、10SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDN0.123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163或SEQIDNO:165,其中所述修飾包括下列改變的一個(gè)或多個(gè)-SEQIDNO:163的位置265至267的任何一處的相當(dāng)?shù)暮塑账嶙優(yōu)镃GT、CGC、CGA、CGG、AGA或AGG;20SEQIDNO:163的位置307至309的任何一處的相當(dāng)?shù)暮塑账嶙優(yōu)镚GT、GGC、GGA或GGG;SEQIDNO:163的位置328至330的任何一處的相當(dāng)?shù)暮塑账嶙優(yōu)镚GT、GGC、GGA或GGG;SEQIDNO:163的位置340至342的任何一處的相當(dāng)?shù)暮塑账嶙優(yōu)門TA、TTG、25CTT、CTC、CTA或CTG;SEQIDNO:163的位置469至471的任何一處的相當(dāng)?shù)暮塑账嶙優(yōu)門CT、TCC、TCA、TCG、AGT或AGC;SEQIDNO:163的位置1441至1443的任何一處的相當(dāng)?shù)暮塑账嶙優(yōu)門TT或TTC;SEQIDNO:163的位置1648至1650的任何一處的相當(dāng)?shù)暮塑账嶙優(yōu)锳AT或AAC;或者SEQIDNO:163的位置1768至1770的任何一處的相當(dāng)?shù)暮塑账嶙優(yōu)镃GT、CGC、CGA、CGG、AGA或AGG。158.分離的或重組的核酸,其具有包含對(duì)權(quán)利要求1所示核酸的核苷酸殘基序列修飾的序列,其中所述修飾包括下列改變的一個(gè)或多個(gè)SEQIDNO:163的位置265至267的任何一處的相當(dāng)?shù)暮塑账嶙優(yōu)镃GT、CGC、CGA、CGG、AGA或AGG;SEQIDNO:163的位置307至309的任何一處的相當(dāng)?shù)暮塑账嶙優(yōu)镚GT、GGC、5GGA或GGG;SEQIDNO:163的位置328至330的任何一處的相當(dāng)?shù)暮塑账嶙優(yōu)镚GT、GGC、GGA或GGG;SEQIDNO:163的位置340至342的任何一處的相當(dāng)?shù)暮塑账嶙優(yōu)門TA、TTG、CTT、CTC、CTA或CTG;10SEQIDNO:163的位置469至471的任何一處的相當(dāng)?shù)暮塑账嶙優(yōu)門CT、TCC、TCA、TCG、AGT或AGC;SEQIDNO:163的位置1441至1443的任何一處的相當(dāng)?shù)暮塑账嶙優(yōu)門TT或TTC;SEQIDNO:163的位置1648至1650的任何一處的相當(dāng)?shù)暮塑账嶙優(yōu)锳AT或AAC;或者SEQIDNO:163的位置1768至1770的任何一處的相當(dāng)?shù)暮塑账嶙優(yōu)镃GT、CGC、CGA、CGG、AGA或AGG。159.分離的或重組的多肽,其具有包含對(duì)下列序列的氨基酸殘基修飾的序列SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:IOO、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQEDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164或SEQIDNO:166,其中所述修飾包括下列改變的一個(gè)或多個(gè)-SEQIDNO:164的氨基酸位置89的甲硫氨酸相當(dāng)?shù)陌被嶙優(yōu)榫彼?;SEQIDNO:164的氨基酸位置103的苯丙氨酸相當(dāng)?shù)陌被嶙優(yōu)楦拾彼?;SEQIDNO:164的氨基酸位置110的脯氨酸相當(dāng)?shù)陌被嶙優(yōu)楦拾彼幔?SEQIDNO:164的氨基酸位置114的酪氨酸相當(dāng)?shù)陌被嶙優(yōu)榱涟彼?;SEQIDNO:164的氨基酸位置157的丙氨酸相當(dāng)?shù)陌被嶙優(yōu)榻z氨酸;SEQIDNO:164的氨基酸位置481的色氨酸相當(dāng)?shù)陌被嶙優(yōu)楸奖彼?;SEQIDNO:164的氨基酸位置550的脯氨酸相當(dāng)?shù)陌被嶙優(yōu)樘於0?;或SEQIDNO:164的氨基酸位置590的甘氨酸相當(dāng)?shù)陌被嶙優(yōu)榫彼帷?60.分離的或重組的多肽,其具有包含對(duì)權(quán)利要求48所示多肽的氨基酸殘基修飾的序列,其中所述修飾包括下列改變的一個(gè)或多個(gè)-SEQIDNO:164的氨基酸位置89的甲硫氨酸相當(dāng)?shù)陌被嶙優(yōu)榫彼?;SEQIDNO:164的氨基酸位置103的苯丙氨酸相當(dāng)?shù)陌被嶙優(yōu)楦拾彼?;SEQIDNOa64的氨基酸位置110的脯氨酸相當(dāng)?shù)陌被嶙優(yōu)楦拾彼幔籗EQIDNO:164的氨基酸位置114的酪氨酸相當(dāng)?shù)陌被嶙優(yōu)榱涟彼?;SEQIDNO:164的氨基酸位置157的丙氨酸相當(dāng)?shù)陌被嶙優(yōu)榻z氨酸;SEQIDNO:164的氨基酸位置481的色氨酸相當(dāng)?shù)陌被嶙優(yōu)楸奖彼幔籗EQIDNO:164的氨基酸位置550的脯氨酸相當(dāng)?shù)陌被嶙優(yōu)樘於0?;或SEQIDNO:164的氨基酸位置590的甘氨酸相當(dāng)?shù)陌被嶙優(yōu)榫彼帷?61.權(quán)利要求48所述的分離的或重組的多肽,其中所述多肽具有如下所示的序列(i)SEQIDNO:164,具有堿性內(nèi)切葡聚糖酶/纖維素酶活性;25(ii)SEQIDNO:110,具有木聚糖酶活性;(iii)SEQIDNO:12,具有NAD結(jié)合氧化還原酶活性;(iv)SEQIDNO:118,具有短鏈脫氫酶活性;(v)SEQIDNO:14,具有NADH依賴性脫氫酶活性;(vi)SEQIDNO:138,具有肽酶活性;(vii)SEQIDNO:162,具有堿性內(nèi)切葡聚糖酶活性;(viii)SEQIDNO:42,具有半胱氨酰tRNA合成酶活性;(viii)SEQIDNO:32,具有纖維糊精磷酸化酶活性;(ix)SEQIDNO:50,具有fdhd/narq氧化還原酶活性;(x)SEQIDNO:54,具有自由基S-腺苷蛋氨酸(SAM)甲基轉(zhuǎn)移酶活性;或35(xi)SEQIDNO:58,具有枯草蛋白酶樣蛋白酶活性。全文摘要本發(fā)明涉及分子和細(xì)胞生物學(xué)和生物化學(xué)。一方面,本發(fā)明提供具有纖維素酶活性如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或β-葡糖苷酶活性的多肽,編碼這些多肽的多核苷酸,以及制備和使用這些多核苷酸和多肽的方法。一方面,本發(fā)明涉及多肽纖維素酶活性,例如內(nèi)切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或β-葡糖苷酶活性,包括熱穩(wěn)定和耐熱的活性,以及編碼這些酶的多核苷酸,以及制備和使用這些多核苷酸和多肽的方法。本發(fā)明的多肽可以被用于各種藥物、農(nóng)業(yè)、食物和飼料加工和工業(yè)環(huán)境中。文檔編號(hào)C12P21/06GK101175860SQ200680016175公開日2008年5月7日申請(qǐng)日期2006年1月13日優(yōu)先權(quán)日2005年3月15日發(fā)明者D·百隆,J·耿斯奇,M·迪凱科申請(qǐng)人:維萊尼姆公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1