專利名稱:金黃色葡萄球菌特異性診斷學(xué)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及金黃色葡萄球菌(Staphylococcus aureus)的診斷學(xué)領(lǐng)域,更特別地涉及基于陣列的對金黃色葡萄球菌菌株進(jìn)行分型(typing)的方法。
背景技術(shù):
金黃色葡萄球菌是住院患者護(hù)理中的一個主要問題。有許多不同的金黃色葡萄球菌菌株,其中一些對很多種抗生素有抗性。金黃色葡萄球菌的不同菌株在感染性方面表現(xiàn)不同。一些菌株在患者之間快速傳播,而另一些菌株不是很容易傳播。鑒于至少一些金黃色葡萄球菌菌株能在住院患者中導(dǎo)致嚴(yán)重疾病,醫(yī)院采取非常嚴(yán)格的衛(wèi)生規(guī)定。先前不可能快速確定一個特定的菌株是否是快速傳播菌株(流行性菌株)。因此面對二甲氧基苯青霉素抗性的金黃色葡萄球菌(MRSA)感染的患者醫(yī)院別無選擇,只能是執(zhí)行最嚴(yán)格的檢疫和衛(wèi)生規(guī)定。
陣列技術(shù)在與生物學(xué)和醫(yī)學(xué)相關(guān)的各個領(lǐng)域中已成為重要工具。這些年來已開發(fā)了幾種類型的陣列。隨著小型化和自動化的到來,越來越多的信息已經(jīng)進(jìn)入陣列。陣列技術(shù)的目前趨勢是產(chǎn)生更大的陣列,在它們之上攜帶越來越多的信息。
在基于陣列的診斷學(xué)中,雜交模式或者陣列上各種斑點與樣品核酸雜交的強(qiáng)度模式含有待與另一種樣品核酸的數(shù)據(jù)進(jìn)行對比的數(shù)據(jù)。在傳統(tǒng)陣列中,為了經(jīng)濟(jì)和精確性的原因,每個斑點的核苷酸數(shù)目保持在盡可能低。
陣列上所含的更高水平信息主要用于提供核酸樣品的更詳細(xì)的分析,即使得進(jìn)行對比的兩個這種樣品之間的最小的差異變得可見或者被揭示。例如,在人類診斷學(xué)中,陣列被用于對具有相同疾病但不同預(yù)后的患者組進(jìn)行分類,并由此揭示導(dǎo)致這種預(yù)后差異的基因。這些實驗大多數(shù)基于表達(dá)陣列進(jìn)行,因為只有特定基因的表達(dá)水平被認(rèn)為提供區(qū)分兩組患者必需的解決方案,即提供足夠的區(qū)分它們的能力。
在這些已知為表達(dá)譜分析(expression profiling)的診斷方法中,用于探查陣列的核酸(即表達(dá)的mRNA)提供了復(fù)合核酸(complex nucleicacid)。在陣列中導(dǎo)入較大數(shù)量的核苷酸導(dǎo)致另一難題,特別是當(dāng)復(fù)雜核酸被用于探查陣列時。在表達(dá)譜分析的情況下,大量的斑點具有值為0和1之間的信號,表明不是斑點中的所有核酸均與探針核酸雜交,而這是用于確定或量化所涉及的基因的表達(dá)水平的一個特征。
最終,當(dāng)對比不同的雜交模式時,需要決定陣列中的哪些信號包括在分析中,哪些不使用。通常這基于截斷值(cut-off value)進(jìn)行,截斷值的引入使得分析偏向包括特定斑點的強(qiáng)度的最顯著或最大改變。參考模式在這一過程中起重要作用,該模式是用來與測試材料或樣品核酸所產(chǎn)生的模式進(jìn)行對比的模式?,F(xiàn)有技術(shù)方法的一個問題是核酸的表達(dá)代表了生物體所處的狀態(tài),即根據(jù)環(huán)境不同,同一生物體可有不同的表達(dá)模式?,F(xiàn)有技術(shù)方法由此不太適合在不考慮其代謝狀態(tài)的情況下對生物體進(jìn)行分型。
發(fā)明概述本發(fā)明人現(xiàn)已發(fā)現(xiàn)一種制備參考雜交模式的方法,其提供了高分辨能力,使得能對樣品核酸在令人驚訝地詳細(xì)的水平上進(jìn)行分型。例如,本發(fā)明人現(xiàn)設(shè)計了一種分型方法,其使得不同細(xì)菌菌株的樣品核酸在如流行性這樣詳細(xì)的表型參數(shù)的水平上進(jìn)行分型,而分型本身基于全基因組陣列差異雜交(whole-genome-array differentialhybridization)而發(fā)生。在這些全基因組陣列差異雜交方法中,陣列上的核酸分子和樣品核酸均由(隨機(jī))基因組DNA片段組成。獲得這一詳細(xì)水平是令人驚奇的,因為人們不會預(yù)期可以基于基因組DNA的組成而區(qū)分金黃色葡萄球菌菌株的流行性和非流行性亞型。
在一個方面,本發(fā)明提供了能夠快速確定一種MRSA菌株是否是流行性菌株的手段和方法。本發(fā)明還適于確定特定的金黃色葡萄球菌菌株的其它特征。為此,本發(fā)明提供了特異的陣列,它們能區(qū)分金黃色葡萄球菌各種菌株,并且更重要地,用以估計特定金黃色葡萄球菌菌株的性質(zhì),甚至在陣列上產(chǎn)生的雜交模式與早先已產(chǎn)生的雜交模式不同的情況下進(jìn)行。
因此,在一個方面,本發(fā)明提供了對衍生自或得自一金黃色葡萄球菌菌株的樣品核酸進(jìn)行分型的方法,包括-提供包含多個核酸分子的陣列,其中所述多個核酸分子衍生自第一組的至少兩種不同的金黃色葡萄球菌菌株;-通過將所述陣列與得自或衍生自第二組的至少兩種不同的金黃色葡萄球菌菌株的至少兩種不同參考核酸進(jìn)行雜交而提供至少兩種不同的參考雜交模式,其中所述第二組中的所述金黃色葡萄球菌菌株基于至少一個表型參數(shù)的值可分成至少兩組;-通過無監(jiān)督的多變量分析(unsupervised multivariateanalysis)群集(clustering)參考雜交模式而產(chǎn)生參考雜交模式的至少兩種不同的集群(cluster);-將與用于制備參考雜交模式的陣列相同的陣列與樣品核酸雜交以獲得樣品雜交模式;以及-將所述樣品雜交模式歸于(assign to)所述參考雜交模式的至少兩種不同的集群中的一種。
在一個優(yōu)選的實施方案中,所述樣品核酸中的片段的平均大小在約50至5000個核苷酸之間。
在另一優(yōu)選的實施方案中,所述多個核酸分子的分子平均大小在約200至5000個核苷酸之間。
在另一個優(yōu)選的實施方案中,所述陣列包括隨機(jī)選自所述至少兩種不同的金黃色葡萄球菌菌株的片段化的基因組DNA的片段的約1500至5000個核酸分子。
在另一優(yōu)選的實施方案中,所述樣品核酸衍生自金黃色葡萄球菌的純培養(yǎng)物。
在另一優(yōu)選的實施方案中,所述多個核酸分子衍生自至少3種、優(yōu)選地至少5種、更優(yōu)選地至少8種不同的金黃色葡萄球菌菌株。
在另一優(yōu)選的實施方案中,所述方法包括將樣品雜交模式與至少3種、更優(yōu)選地至少5種、更優(yōu)選地至少50種不同參考雜交模式進(jìn)行對比。
在另一優(yōu)選的實施方案中,所述表型參數(shù)是所述金黃色葡萄球菌菌株的流行性。
在另一優(yōu)選的實施方案中,所述對比包括參考雜交模式與樣品雜交模式的偏最小二乘法判別分析(Partial Least Square-DiscriminantAnalysis,PLS-DA),其中至少一個其值對于參考雜交模式是已知的(并且其信息被用于監(jiān)督所述PLS-DA分析)的表型參數(shù)被針對樣品核酸或其衍生來源而額外確定或估計。
在另一優(yōu)選的實施方案中,所述方法進(jìn)一步包括基于有監(jiān)督的PLS-DA分析對模式進(jìn)行群集。
在另一優(yōu)選的實施方案中,所述方法進(jìn)一步包括基于集群的存在與否對所述樣品核酸進(jìn)行分型。
在另一優(yōu)選的實施方案中,基本上所有參考雜交模式由金黃色葡萄球菌菌株的核酸產(chǎn)生。
在另一優(yōu)選的實施方案中,所述分型包括確定衍生所述樣品核酸的金黃色葡萄球菌是否是流行株。
在另一方面,本發(fā)明提供了一種試劑盒,所述試劑盒包括上述陣列的組合,其中所述試劑盒進(jìn)一步包括至少兩種不同的參考雜交模式或衍生自上述金黃色葡萄球菌菌株的參考核酸。
附圖簡述
圖1是金黃色葡萄球菌菌株列表及其流行性特征。每一MRSA菌株由一獨特的TNO Type Collection編號(TTC nr,第1列)代表。每一菌株通過Riboprint分類被鑒定為金黃色葡萄球菌(第2列)。流行性特征通過日常醫(yī)院實踐確定(第3列)。
圖2顯示了通過全基因組陣列差異雜交數(shù)據(jù)的有監(jiān)督的PLS-DA分析對MRSA菌株的流行性進(jìn)行群集。將19種不同MRSA菌株的Cy標(biāo)記的基因組DNA與含有金黃色葡萄球菌基因組的代表的陣列雜交。用偏最小二乘法判別分析(PLS-DA)基于每一MRSA菌株的已知流行性特征分析金黃色葡萄球菌菌株的量化的熒光雜交模式,這些模式代表了高度復(fù)雜的n維數(shù)據(jù)集。下方的PLS-DA圖顯示了每一單菌株復(fù)雜雜交模式在一2維平面的單點投影(小圈,文字表示圖1所提到的菌株TTC.03編號)。In duplo雜交的菌株用粗體字表示?;跀?shù)據(jù)集的一個特異部分,PLS-DA分析能夠根據(jù)其已知的流行性對在兩個單獨的集群中的菌株進(jìn)行群集(手工橢圓,E=流行性,N=非流行性)。注Cy5/Cy3比例通過截斷值0.5而轉(zhuǎn)化為0和1數(shù)據(jù)集。PLS-DA通過平均中心化(mean centering)進(jìn)行測量(scaling)。非流行性菌株“236”通過PLS-DA定位于E-集群和N-集群之間。數(shù)據(jù)集編號是指圖1所示菌株編號。
圖3示出了在如下偏最小二乘法(Partial least squares,PLS)分析方法的部分中所述的模型復(fù)雜性的各個方面。
圖4示出了如下在主成分判別分析(PrincipalComponent-Discriminant Analysis,PC-DA)的部分中所述的判別分析的各個方面。在本圖中,D是判別軸,P是投影線,X1和X2是兩個變量,x和o代表來自兩個不同組的樣品。
發(fā)明詳述本發(fā)明的一個特征是,與樣品核酸和參考核酸之間的遺傳對比一起(例如,同時、之前或之后),對于參考核酸的每一來源確定至少一個表型參數(shù)(例如流行性),該表型參數(shù)然后被用于數(shù)據(jù)的統(tǒng)計學(xué)分類。
本發(fā)明一般地利用差異雜交來進(jìn)行樣品核酸分類并特別利用全基因組差異雜交來對生物體進(jìn)行分類。本發(fā)明在一個實施方案中涉及采用來自不同金黃色葡萄球菌菌株的集合的隨機(jī)基因組DNA片段的陣列來根據(jù)臨床相關(guān)特征(如抗生素抗性、流行性、毒力、致病性等)對“新的”金黃色葡萄球菌菌株進(jìn)行分類的方法。
由此,當(dāng)本發(fā)明規(guī)定至少兩個不同的金黃色葡萄球菌菌株必須是基于感興趣的至少一個表型參數(shù)的值而可分成至少兩組時,本發(fā)明的方法在一個優(yōu)選的實施方案中使得可以區(qū)分流行性和非流行性亞型。
在本發(fā)明的一個方面,提供有關(guān)金黃色葡萄球菌參考菌株的至少一種表型特征的信息的額外步驟提供了一種方法,其使用來自由金黃色葡萄球菌不同菌株組成的組的例如基因組DNA片段的非特異性集合對用例如所述組內(nèi)或組外的未知成員的gDNA獲得的雜交模式根據(jù)相似性進(jìn)行群集并進(jìn)行分類,并且該方法能基于至少一種表型特征進(jìn)一步區(qū)分或分離那些集群。
術(shù)語非特異性(a-specific)是有意使用的,因為本發(fā)明的陣列提供了一種分析工具,其不是必須僅適合分析與點在陣列上的不同金黃色葡萄球菌菌株的核酸相關(guān)的金黃色葡萄球菌菌株的核酸,而是提供了原則上足夠的判別能力以分析與陣列上的核酸在分類學(xué)上遠(yuǎn)離的或不相關(guān)的基因組。然而,最佳結(jié)果和最高判別能力是當(dāng)選擇用于陣列的多個核酸分子的核酸從而使樣品核酸是高度相關(guān)的(即其雜交模式在參考模式之間群集或與參考模式群集)時獲得的。
陣列上的多個核酸分子衍生自至少兩種不同的金黃色葡萄球菌菌株,優(yōu)選地,所述多個核酸分子衍生自至少3種、更優(yōu)選地至少5種、更優(yōu)選地至少8種不同的金黃色葡萄球菌菌株。
陣列核酸分子典型地是金黃色葡萄球菌菌株的(通常單鏈的)基因組DNA片段。
在本發(fā)明的一個方法中,用于制備參考雜交模式的不同金黃色葡萄球菌菌株基于表型特征或參數(shù)可分成至少兩組,在本文中也稱為至少一個感興趣的表型參數(shù)的值。術(shù)語“值(value)”包括定量和定性的值。因此,例如,陣列包含來自金黃色葡萄球菌流行性菌株的基因組DNA片段和來自非流行性菌株的基因組DNA片段。已發(fā)現(xiàn)本方法最終適合于對金黃色葡萄球菌的不同菌株進(jìn)行快速和精確分型。例如,在二甲氧基苯青霉素抗性金黃色葡萄球菌(MRSA)的情況下,甚至能區(qū)分流行性菌株和非流行性菌株。
因此,在本發(fā)明的一個特別優(yōu)選的方面,得自或衍生自至少兩個不同金黃色葡萄球菌菌株的核酸被用于產(chǎn)生參考雜交模式。優(yōu)選地,通過得自或衍生自不同金黃色葡萄球菌菌株的核酸產(chǎn)生至少5個、更優(yōu)選至少50個參考雜交模式。在一個特別優(yōu)選的實施方案中,基本上全部參考雜交模式通過金黃色葡萄球菌菌株的核酸產(chǎn)生。
這一特別優(yōu)選的實施方案優(yōu)選地與統(tǒng)計學(xué)分析組合以對比參考和樣品雜交模式。以這種方式可以確定一個金黃色葡萄球菌菌株包含一些但不是全部金黃色葡萄球菌菌株的特定表型特征或基因型相關(guān)性的幾率。所述核酸可以衍生自RNA但優(yōu)選地衍生自或得自DNA,即衍生自基因組。因此,在本發(fā)明的一個優(yōu)選實施方案中,核酸分子衍生自DNA。
參考雜交模式典型地通過將本發(fā)明的陣列與參考生物體雜交而衍生,其中典型地一個金黃色葡萄球菌菌株給出一個參考雜交模式。當(dāng)然,為了確定菌株之間的關(guān)系,所述至少兩種不同參考核酸和樣品核酸衍生自不同的金黃色葡萄球菌菌株。在一個實施方案中,本發(fā)明涉及對金黃色葡萄球菌菌株進(jìn)行分類的方法,包括將金黃色葡萄球菌測試菌株的DNA與本發(fā)明的DNA陣列雜交,所述DNA陣列包含大量隨機(jī)選擇的基因組DNA片段,所述基因組DNA片段衍生自至少2種、優(yōu)選地至少3種、更優(yōu)選地至少4種、更優(yōu)選至少8種不同的金黃色葡萄球菌菌株,以在所述參考生物體中對所述測試生物體的基因組DNA進(jìn)行分類。
在一個優(yōu)選的實施方案中,所述DNA陣列包含約1000至約10000個、優(yōu)選約1500至約5000個、最優(yōu)選約1800至約2400個、更優(yōu)選約1900至約2200個隨機(jī)選擇的基因組DNA片段。
在一個優(yōu)選的實施方案中,所述隨機(jī)選擇的基因組DNA片段長度為約500至約5000、更優(yōu)選約1000至約2000、更優(yōu)選約1300至約1800、更優(yōu)選約1400至約1600個核苷酸。因此,在最優(yōu)選的實施方案中,本發(fā)明方法采用的DNA陣列包含約3兆堿基。
在另一個實施方案中,本發(fā)明涉及一種對微生物進(jìn)行分類的方法。所述方法采用DNA陣列,所述陣列包含大量(約1000至約10000、優(yōu)選約1500至約5000、最優(yōu)選約1800至約2400、更優(yōu)選約1900至約2200個)隨機(jī)選擇的基因組DNA片段(優(yōu)選地長度為約500至約5000、更優(yōu)選約1000至約2000、更優(yōu)選約1300至約1800、更優(yōu)選約1400至約1600個核苷酸),所述基因組DNA片段衍生自至少2種、優(yōu)選地至少3種、更優(yōu)選地至少4種、例如5、6或7種、更優(yōu)選至少8種不同微生物的混和物以對一種微生物的基因組DNA進(jìn)行分類。所述混和物可以合適地代表不同金黃色葡萄球菌菌株的gDNA庫。
本發(fā)明的方法優(yōu)選地使用全基因組陣列以通過雜交研究或確定在其它金黃色葡萄球菌菌株中是否存在相對的(即互補(bǔ)的)DNA區(qū)域。與現(xiàn)有技術(shù)方法不同,本發(fā)明優(yōu)選地不采用所謂的開放讀框(ORF)-探針作為陣列上的核酸分子。這些探針衍生自并且僅檢測金黃色葡萄球菌菌株的特異基因的片段或gDNA片段。相反,本發(fā)明優(yōu)選地采用消化的基因組DNA以獲得雙鏈gDNA片段,所述片段然后優(yōu)選地被變性以作為單鏈隨機(jī)gDNA探針,其可以在適于構(gòu)建本發(fā)明的陣列的多個核酸分子中形成。在本發(fā)明的用于對金黃色葡萄球菌DNA進(jìn)行分型的方法的另一優(yōu)選的實施方案中,對現(xiàn)有技術(shù)方法的進(jìn)一步改進(jìn)通過提供衍生自各種不同金黃色葡萄球菌菌株的gDNA庫的隨機(jī)基因組DNA片段的陣列而實現(xiàn)。這具有這樣的優(yōu)點用一個單一實驗或分析,可以建立測試生物體與一組具有限定的表型特征的參考生物體之間的關(guān)系。
本發(fā)明現(xiàn)在最終使得可以研究金黃色葡萄球菌中的多基因特征。本文描述的方法因此支持或允許摻入金黃色葡萄球菌表型特征的分類,例如測試生物體的抗生素抗性,而無論其遺傳基礎(chǔ)如何。因此,當(dāng)將本發(fā)明方法用于對金黃色葡萄球菌進(jìn)行分類并包括所述金黃色葡萄球菌菌株的至少一個臨床相關(guān)參數(shù)(例如抗生素抗性或流行性)時,不僅基因型特征用于對菌株進(jìn)行分類,而且該菌株的組合的基因型和表型特征也可用于對菌株進(jìn)行分類,而無論這兩者之間是否有因果關(guān)系。
不需要存在于陣列上的序列的詳細(xì)知識。在本發(fā)明中,模式之間互相對比。
為了構(gòu)建含有至少兩種不同金黃色葡萄球菌菌株的基因組范圍的代表性陣列,可以通過混和所述至少兩種菌株的gDNA制備所述至少兩種菌株的混和基因組文庫。優(yōu)選地,選擇針對一個表型參數(shù)每一個菌株顯示不同值的多個菌株,例如對廣泛的抗生素有不同的抗性譜,優(yōu)選地總體覆蓋大多數(shù)類型的抗生素抗性。優(yōu)選地,生物體在其分離的gDNA的瓊脂糖凝膠分析中不含顯著的質(zhì)粒條帶。然后,所述gDNA混和物可被片段化(例如通過超聲剪切),片段可在例如瓊脂糖凝膠中分離。合適大小的DNA片段(優(yōu)選約1-3kb)可隨后被分離(例如通過從凝膠中切下并結(jié)合于固體載體如玻璃乳而分離)。合適數(shù)量的gDNA片段隨機(jī)回收自所述gDNA混和物,因此數(shù)量可以是約1000至約10000,優(yōu)選約1500至約5000,最優(yōu)選約1800至約2400,更優(yōu)選約1900至約2200個隨機(jī)選擇的基因組DNA片段。多個菌株的gDNA混和物的作用是在從其中分離DNA片段時,獲得來自各種菌株的片段的隨機(jī)庫,其用于構(gòu)建陣列。
隨機(jī)選擇的分離的片段優(yōu)選地進(jìn)一步倍增以提供合適的原料儲備。所述片段的倍增例如可以通過實施例1所述的克隆和核酸擴(kuò)增技術(shù)的組合而進(jìn)行。雙鏈gDNA片段隨后可末端修飾以使它們固定在陣列表面上,例如通過進(jìn)行PCR擴(kuò)增反應(yīng)修飾,其中一個引物或兩個引物都含有經(jīng)一C6接頭與引物的5’末端偶聯(lián)的游離NH2基團(tuán)。
隨機(jī)選擇的、分離的、以及任選地擴(kuò)增的gDNA片段然后可以被點印(spotting)在表面上以提供DNA微陣列。為了促進(jìn)片段的偶聯(lián),所述陣列的表面(例如玻片,其表面可以是玻璃、金等)可以被改性(modified)。所述點印可以通過任何已知方法進(jìn)行,例如通過使用ElectroSpray Ionization(ESI)微陣列印刷進(jìn)行。點印片段后,可以封閉玻片表面以防止核酸的進(jìn)一步附著,例如,在甲醛改性的玻片表面情況下用硼酸酐處理。
各個菌株的原始gDNA材料的一部分被用于提供可與陣列雜交的材料,即提供參考核酸。為了促進(jìn)檢測成功的雜交,將gDNA適當(dāng)?shù)貥?biāo)記,優(yōu)選地?zé)晒鈽?biāo)記(例如使用CyTM標(biāo)記[Amersham PharmaciaBiotech])。熒光標(biāo)記試劑盒可商購自多個廠商。
樣品核酸的平均大小對陣列上信號分布有作用。較大的樣品分子包含更多的信息并因此更易于在更多個點中發(fā)現(xiàn)合適的雜交配體。降低樣品核酸的平均大小可降低這一現(xiàn)象。另一方面,當(dāng)樣品核酸太小時,樣品中的核酸片段含有太少遺傳信息并且也在許多斑點中發(fā)現(xiàn)合適的雜交配體。樣品核酸中片段的平均大小優(yōu)選地在50至5000個核苷酸之間。更優(yōu)選地,樣品核酸中片段的平均大小包含約50至1000個核苷酸、更優(yōu)選地約50至500個核苷酸的大小。
樣品核酸優(yōu)選地代表完整樣品基因組。用陣列上的樣品核酸獲得的雜交模式與參考雜交模式對比。所述參考雜交模式可以人工產(chǎn)生,例如通過用參考樣品的核酸組成的知識產(chǎn)生,所述核酸組成是例如基因組序列已知的金黃色葡萄球菌菌株的基因組序列。但是,在一個優(yōu)選的實施方案中,所述參考雜交模式通過參考核酸與陣列雜交產(chǎn)生。樣品雜交模式與參考的對比可至少被用于確定樣品核酸是否與參考核酸相同或相似。當(dāng)需要確定例如樣品核酸是否含有特定的金黃色葡萄球菌菌株時這是有用的。在這一情況下,用該特定金黃色葡萄球菌菌株的核酸產(chǎn)生參考雜交模式,并且當(dāng)樣品雜交模式基本上與參考雜交模式相同時,該樣品被鑒定為含有該特定金黃色葡萄球菌菌株。在一個優(yōu)選的實施方案中,本發(fā)明方法進(jìn)一步包括對比樣品雜交模式和至少一種另外的參考雜交模式。以此方式,所述樣品可以與至少兩種不同的參考核酸對比。當(dāng)然,通過持續(xù)使用該陣列,越來越多的金黃色葡萄球菌雜交模式被產(chǎn)生,所有這些均可用于與樣品核酸對比。因此,當(dāng)用樣品核酸產(chǎn)生一雜交模式時,這一雜交模式可以在隨后實驗中用作參考雜交模式。因此,在一個優(yōu)選的實施方案中,本發(fā)明的方法進(jìn)一步包括將雜交模式與至少2個、優(yōu)選地至少5個、更優(yōu)選地至少50個參考雜交模式對比。更優(yōu)選地與至少100個、更優(yōu)選地至少1000個參考雜交模式對比。
樣品雜交模式和參考雜交模式可以是得自陣列的信號的一個亞集合。雜交模式可以由一個信號組成,優(yōu)選地,所述雜交模式由與陣列雜交后獲得的信號的20%組成。更優(yōu)選地,所述雜交模式由來自陣列的信號的至少50%組成。在一個特別優(yōu)選的實施方案中,所述雜交模式包括陣列信號的至少80%。
本發(fā)明的方法不僅可用于確定一個金黃色葡萄球菌樣品核酸是否與一特定的金黃色葡萄球菌參考核酸相同。當(dāng)樣品雜交模式發(fā)生時,其可以與任何參考雜交模式不同。本發(fā)明的方法和陣列的一個特別有用的特征是在這種情況下本發(fā)明的方法可以提供有用的信息。與衍生或獲得樣品核酸的金黃色葡萄球菌菌株相關(guān)的表型特征通常是大量不同序列和/或基因相互影響的結(jié)果。在這些情況下,不可能基于得自一或多個點的信號對一特定樣品進(jìn)行分型。相反,非常多的不同點的信號需要被對比。本發(fā)明的方法和陣列特別適于對這一分析類型進(jìn)行分型。為此參考雜交模式和樣品雜交模式用統(tǒng)計學(xué)軟件進(jìn)行分析。在一個實施方案中,本發(fā)明方法進(jìn)一步包括金黃色葡萄球菌參考雜交模式與由金黃色葡萄球菌樣品核酸產(chǎn)生的雜交模式的無監(jiān)督的多變量分析(例如主成分分析(Principal Component Analysis,PCA))?;谶@一分析,雜交模式被賦予一個n維值(n代表2至分析中包括的數(shù)據(jù)點總數(shù)之間的一個值),其可以被減少至其優(yōu)選的2個主要成分。這些成分可在多維顯像(multi-dimensional visualization)中顯現(xiàn),優(yōu)選地在二維顯像中顯現(xiàn)。成分的維量值(dimensional value)可以相對分析中包括的所有雜交模式作圖,其中雜交模式的優(yōu)選的二維值的編組(grouping)或群集可被仔細(xì)觀察。在一個優(yōu)選的實施方案中,樣品雜交模式的二維值與參考雜交模式的所有二維值進(jìn)行對比。以此方式可以提供用于衍生或獲得樣品核酸的金黃色葡萄球菌菌株與所包括的參考相對比的相關(guān)性(relatedness)的統(tǒng)計學(xué)估計。
在一個優(yōu)選的實施方案中,參考雜交模式的二維值被群集。這一群集優(yōu)選地基于相關(guān)性進(jìn)行。這一分型典型地與分類的誤差幅度相關(guān),所述誤差幅度即樣品核酸被錯誤地分類為與特定(集群)的參考菌株相關(guān)的概率。因此本發(fā)明的方法優(yōu)選地進(jìn)一步包括基于在集群中的存在與否對用于產(chǎn)生所述樣品核酸的金黃色葡萄球菌的相關(guān)性進(jìn)行分型。
術(shù)語“群集(clustering)”是指將具有相同或相似特征的事件(item)收集、組裝或統(tǒng)一成一個或多個集群(cluster)的行為,“集群(cluster)”是指一組或一些聚集在一起的或緊密地在一起發(fā)生的相同或相似事件?!氨蝗杭?clustered)”是指一個事件已被進(jìn)行群集。本發(fā)明方法所用的群集方法可以用手、眼或任何已知的用于對比事件之間的特征、屬性、性質(zhì)、質(zhì)量、作用等的相似性的(數(shù)學(xué))方法通過來自可測量的參數(shù)的數(shù)據(jù)進(jìn)行??梢允褂媒y(tǒng)計學(xué)分析。
主成分分析(Principal component analysis,PCA)可以使用平均中心(mean centering)作為所選擇的測量方法(scaling method)進(jìn)行。用其它測量方法可以獲得相當(dāng)?shù)慕Y(jié)果。在一個優(yōu)選的實施方案中,使用平均中心測量方法。主成分分析參考文獻(xiàn)綜述見Joliffe IT.1986.Principal Component Analysis.New YorkSpringer-Verlag。
本發(fā)明的一個特征是雜交模式用有關(guān)用于獲得或衍生參考和/或樣品核酸的金黃色葡萄球菌菌株的進(jìn)一步信息擴(kuò)展。例如,雜交模式可以用經(jīng)不同于核酸雜交的方式確定的參數(shù)擴(kuò)展。對于金黃色葡萄球菌菌株,通常重要的是知道菌株的抗生素抗性表型。這一抗性參數(shù)可以被加入到統(tǒng)計學(xué)分析中。這一參數(shù)的值(抗性或敏感,或進(jìn)一步微調(diào))可以被加入到雜交模式或雜交模式的統(tǒng)計學(xué)分析中。隨后可基于這一附加參數(shù)進(jìn)行群集。因此在本發(fā)明的一個優(yōu)選的實施方案中,對于是參考雜交模式的來源的生物體確定至少一種不是基于核酸的參數(shù)。隨后可使用統(tǒng)計學(xué)分析確定或估計作為樣品核酸來源的金黃色葡萄球菌的這一參數(shù)的值。在這一實施方案中,本發(fā)明的方法進(jìn)一步包括參考雜交模式與由樣品核酸產(chǎn)生的雜交模式的偏最小二乘法判別分析(Partial Least Square-Discriminant Analysis,PLS-DA),其中使用至少一個其值對于參考雜交模式是已知的的參數(shù)監(jiān)督所述PLS-DA分析。
偏最小二乘法(Partial Least Squares,PLS)偏最小二乘法(PLS)已經(jīng)在文獻(xiàn)中廣泛描述(P.Geladi and B.R.Kowalski,Partial Least Squares RegressionA Tutorial,AnalyticaChimica Acta,185,1986,1-17.H.Martens and T.Naes,MultivariateCalibration,John Wiley&Sons,Chichester,1989.)。盡管主成分分析(PCA)模型具有描述性質(zhì),但是PLS模型具有預(yù)測性質(zhì)。在PLS中,計算數(shù)值*加載對(loading pairs)(也稱為潛變量(LV))不僅是為了在預(yù)測數(shù)據(jù)集(predicting data set)中使解釋方差(explained variance)最大化,也是為了使待預(yù)測數(shù)據(jù)的協(xié)方差(covariance)最大化。PLS模型可通過方程(1)和方程(2)而數(shù)學(xué)概括。
X=TPT+E(1)Y=TBQT+F (2)矩陣X(也稱為X-塊(block))代表自變量的n*p矩陣(例如,n個色譜圖,每個色譜圖p保留時間),Y(也稱為Y-塊)是含有因變量(例如濃度)的n*q矩陣;PT和QT是轉(zhuǎn)置S*p和S*q矩陣,分別含有因變量和自變量加載(loadings);T是S潛在值(latent scores)的n*S矩陣,B是S*S矩陣,代表X矩陣的值在Y-數(shù)據(jù)的值上的回歸;E和F是n*p和n*q矩陣,分別含有自變量和因變量的殘差。
提取A對潛變量后的驗證標(biāo)準(zhǔn)誤差(SEV)由方程(3)計算。
SEV=ΣI=1Ic(Yi,j-yi,j)2Ic---(3)]]>其中Lc是校準(zhǔn)樣品數(shù)目,yi,j是組分j在物體i中的濃度的真值;Yi,j是yi,j的PLS預(yù)測值;q是Y變量數(shù)目。只要SEV顯著改善則持續(xù)提取LV。
所選擇的LV數(shù)必須獲得感興趣的變量的最佳預(yù)測。但是,在方差和偏倚(bias)(或匹配(fit))之間有一個平衡(pay-off)一種太復(fù)雜的模型匹配良好,但是可能預(yù)測不好。這導(dǎo)致了最佳模型復(fù)雜度(optimalmodel complexity)這一概念獲得匹配和方差之間的最佳平衡。這在圖3中示出,其中模型的增加的復(fù)雜度能夠匹配數(shù)據(jù)中更多的特征,但是估計的參數(shù)的方差升高并且總體結(jié)果在最佳模型復(fù)雜度中得到最小值。
X和Y之間的純線性關(guān)系將產(chǎn)生通常具有2至5對LV的簡單模型。復(fù)雜的非線性關(guān)系也可以被建模。但是,這需要取顯著更多的LV以將Y與X相關(guān)聯(lián)。
偏最小二乘法判別分析(Partial Least Squares-Discriminant Analysis,PLS-DA)在PLS-DA中,類別(classes)(預(yù)先確定的組(predefined groups))被用作因變量。Y-塊Y是n*類別數(shù)的矩陣。Y-塊由0和1填充。
例子類別= Y=10010110]]>使用PLS中的依賴于每一樣品所屬類別的由0和1填充的Y-塊將PLS轉(zhuǎn)變成判別分析。
主成分判別分析(Principal Component-Discriminant Analysis,PC-DA)
如果興趣集中于各樣品組之間差異,施用判別分析(DA)[D.L.Massart,B.G.M.Vandeginste,L.M.C.Buydens,S.De Jong,P.J.Lewiand J.Smeyers-Verbeke,Handbook of Chemometrics and QualimetricsPart A,Elsevier,Amsterdam,1997;B.G.M.Vandeginste,D.L.Massart,L.M.C.Buydens,S.De Jong,P.J.Lewi and J.Smeyers-Verbeke,Handbook of Chemometrics and QualimetricsPart B,Elsevier,Amsterdam,1998]。該技術(shù)基于同組樣品與其它組樣品相比更相似這一假設(shè)。DA的目的是發(fā)現(xiàn)和鑒別原始數(shù)據(jù)的結(jié)構(gòu),其顯示組平均值中的大的差異。這一方法涉及預(yù)先了解哪些樣品是相似的。因此,DA被稱為有監(jiān)督的(supervised)分析技術(shù)。這使得其與其它無監(jiān)督的技術(shù)如主成分分析(PCA)區(qū)分開來,后者不需要對樣品的預(yù)先知識。
DA中的第一個步驟是將原始變量組合成一組相互獨立的新變量,所述組合使得在由最小數(shù)目的這些新變量跨越的空間中原始樣品的投影使組平均值之間的差異最大化。這一原則示于圖4。測量兩組樣品的兩個變量X1和X2。使用主成分(PC)最大方差標(biāo)準(zhǔn),這些樣品應(yīng)被投影在由圖4的線P所示的穿過樣品的線上。為了區(qū)分不同樣品集群,這不是一個最佳方案。但是樣品在線D上的投影顯示了兩個集群之間的完全分離。計算出的因子被稱判別子(discriminant)或D-軸。所有其它投影給出亞最佳方案。這在圖4中通過對比樣品在D線上的投影與在X1或X2軸上的投影而示出。
DA最有效地描述樣品組之間的差異。但是,變量數(shù)相比于樣品數(shù)經(jīng)常是大的。這可能導(dǎo)致簡并的方案。例如,三個樣品可以總是被兩個變量分開,而不論它們的相似性如何。如果包括更多的樣品,這一簡并作用會消失。通用經(jīng)驗法則是樣品數(shù)應(yīng)至少是變量數(shù)的4倍。這一法則可以導(dǎo)致例如核磁共振(NMR)譜檢查中的問題。在天然產(chǎn)物分析中每NMR譜的峰(變量)數(shù)通常是幾百個的量級。在正常情況下這意味著應(yīng)當(dāng)測量至少400-800個樣品。在實踐中這從未發(fā)生?;谶@一點,不可能在天然產(chǎn)物的NMR譜上進(jìn)行DA。但是這一問題有一個解決方案。Hoogerbrugge et al.[R.Hoogerbrugge,S.J.Willig andP.G.Kistemaker,Discriminant Analysis by Double Stage PrincipalComponent Analysis,Analytical Chemistry,55,1983,1710-1712.]開發(fā)了一個方案,其中變量數(shù)首先被在第一PC軸上的樣品分值的PCA、隨后被DA減少。這一技術(shù)被稱為主成分判別分析(PC-DA)。確定所包括的PC的精確數(shù)目是困難的。數(shù)目應(yīng)該不太小,因為僅包括前幾個可導(dǎo)致許多組之間信息(between-group information)的丟失。數(shù)目也不應(yīng)太大,因為這會超出樣品數(shù)除以4的法則(number-of-samples-divided-by-four rule)。因此,看起來可推薦的是包括所有PC,其解釋了高達(dá)樣品數(shù)除以4這一最大值的顯著量的方差(例如高于原始方差的1%)。如果由這些PC解釋的方差總量非常低,則數(shù)目總是可以增加。但是,如果解釋的方差非常低,則原始變量之間的相關(guān)性也低。結(jié)果,DA將產(chǎn)生與原始問題一樣復(fù)雜的結(jié)果。
PLS-DA分析中所用的參數(shù)優(yōu)選地是表型參數(shù)。術(shù)語“表型參數(shù)”用于本文是為了定義任何描述由金黃色葡萄球菌或其功能部分展現(xiàn)或表達(dá)的任何性質(zhì)的參數(shù)?;谶@一分析,雜交模式被被賦予一個n維值(n代表2至分析中包括的數(shù)據(jù)點總數(shù)之間的一個值),其可以被減少至其(優(yōu)選的2個)主要成分,以與在一個(優(yōu)選為二維)顯像中的表型參數(shù)最佳相關(guān)。這一優(yōu)選的二維值可針對所有雜交模式作圖,由此所述雜交模式的優(yōu)選的二維值的分組或集群可被細(xì)察。在一個優(yōu)選的實施方案中,所述樣品雜交模式的二維值與參考雜交模式的所有二維值相對比。以此方式,可以提供對用于獲得或衍生樣品核酸的金黃色葡萄球菌菌株包含或不包含特定表型特征的概率的統(tǒng)計學(xué)估計。這當(dāng)然需要這種表型特征對于用于獲得或衍生參考核酸的金黃色葡萄球菌菌株是已知的。在一個優(yōu)選的實施方案中,所述參考雜交模式的二維值基于有監(jiān)督的PLS-DA分析被群集。
群集優(yōu)選地基于表型特征進(jìn)行,針對該表型特征,樣品雜交模式被細(xì)察。群集優(yōu)選地產(chǎn)生兩個集群,其中一個集群具有特定的表型,而另一個沒有。樣品雜交模式可因此被容易地鑒別為具有或不具有該特定表型。這一分型典型地與分類的誤差幅度相關(guān),所述分類的誤差幅度即樣品核酸被錯誤地分類為具有或不具有該特定表型特征的概率。集群的邊界可以被設(shè)定為容納誤差的較小或較大的統(tǒng)計學(xué)概率。因此本發(fā)明的方法優(yōu)選地進(jìn)一步包括基于在集群中的存在或不存在而對所述樣品核酸進(jìn)行分型。優(yōu)選地,本發(fā)明的方法進(jìn)一步包括基于在集群中的存在或不存在而對所述樣品核酸進(jìn)行分型。在一個優(yōu)選的實施方案中,參數(shù)包括流行性。優(yōu)選地,雜交模式基于其流行性表型即菌株在醫(yī)院環(huán)境下傳播至其它患者的潛力而被群集或分組。
參考雜交模式可產(chǎn)生自各種核酸。如上所述,參考雜交模式優(yōu)選地產(chǎn)生自得自或衍生自天然金黃色葡萄球菌來源的核酸。優(yōu)選地,通過得自或衍生自不同金黃色葡萄球菌菌株的核酸產(chǎn)生至少5種、更優(yōu)選至少50種參考雜交模式。在一個特別優(yōu)選的實施方案中,基本上所有參考雜交模式均由金黃色葡萄球菌菌株的核酸產(chǎn)生。以此方式可以對樣品分型以檢測其中存在所衍生的核酸或作為特定的某個或某些金黃色葡萄球菌菌株而包含相似的表型參數(shù)。這一特別優(yōu)選的實施方案優(yōu)選地與參考和樣品雜交模式的統(tǒng)計學(xué)分析組合。以此方式可以確定樣品中的金黃色葡萄球菌包含由一些但不是全部金黃色葡萄球菌菌株共有的特定表型特征的概率。金黃色葡萄球菌核酸可以衍生自RNA但優(yōu)選地衍生自或得自金黃色葡萄球菌DNA,即衍生自基因組。因此在本發(fā)明的一個優(yōu)選的實施方案中,所述多個核酸分子衍生自金黃色葡萄球菌DNA。
本發(fā)明方法的一個重要優(yōu)點是無需首先在分類學(xué)上對菌株進(jìn)行分類(例如鑒別),然后由此屬于所鑒別的菌株的臨床相關(guān)參數(shù)可以被例如基于與已知參考菌株的數(shù)據(jù)列表對比而確定。因此,本發(fā)明的一個優(yōu)點是無需確定物種就可以確定測試生物對特定抗生素的例如敏感性(或抗性)的存在,或任何其它臨床相關(guān)參數(shù)。這通過如下事實實現(xiàn)這些信息現(xiàn)在可以在陣列的多個核酸分子“內(nèi)”提供。
用于產(chǎn)生雜交模式的樣品和/或參考核酸可含有其所衍生自或得自的金黃色葡萄球菌菌株的核酸的亞集合。但是,優(yōu)選地不進(jìn)行選擇。在任何情況下,樣品和參考核酸的選擇優(yōu)選地是相同或相似的。這使得可以容易地對比參考和樣品雜交模式。
術(shù)語“得自或衍生自……的核酸”是指用于在陣列上雜交的核酸不一定是直接得自金黃色葡萄球菌來源的。在用于雜交之前,其可經(jīng)歷克隆、選擇和其它操作。樣品和參考核酸可例如得自克隆的文庫如表達(dá)或基因組文庫?;蛘撸瑯悠泛蛥⒖己怂峥梢曰跀?shù)據(jù)庫中的核酸信息而從最開始產(chǎn)生,所述數(shù)據(jù)庫例如是發(fā)展中的基因組學(xué)的努力的結(jié)果。但是優(yōu)選地樣品和參考核酸直接從天然金黃色葡萄球菌來源獲得或通過從其擴(kuò)增獲得。優(yōu)選地樣品雜交模式從金黃色葡萄球菌菌株的單培養(yǎng)物起始產(chǎn)生。以此方式,保證了在陣列上僅有一個金黃色葡萄球菌被分析,同時產(chǎn)生的雜交模式是從一個金黃色葡萄球菌菌株產(chǎn)生的雜交模式。
在一個方面,本發(fā)明提供了一種陣列,其包含多個金黃色葡萄球菌核酸分子,其中所述核酸分子包含約200-5000個核苷酸的平均大小。本發(fā)明的陣列優(yōu)選地包含至少500,000個核苷酸。優(yōu)選地,所述陣列攜帶甚至更多的核苷酸。在一個優(yōu)選的實施方案中,所述陣列包含至少1百萬個堿基(106個核苷酸)。優(yōu)選地,它們包含至少2百萬堿基。與傳統(tǒng)陣列不同,每個點的堿基數(shù)是高的,即200-5000個核苷酸之間。優(yōu)選地,所述多個核酸分子衍生自天然金黃色葡萄球菌來源。優(yōu)選地,其中所述多個核酸分子衍生自金黃色葡萄球菌DNA。已發(fā)現(xiàn)不同的金黃色葡萄球菌菌株盡管屬于相同物種,但是其攜帶的DNA的量和種類可以有很大的變化。因此,在一個優(yōu)選的實施方案中,本發(fā)明的陣列包含衍生自至少兩種不同金黃色葡萄球菌菌株的多個核酸分子。優(yōu)選地,陣列中的多個核酸分子至少包含金黃色葡萄球菌菌株基因組的代表(representation)。這優(yōu)選地用衍生自至少另一種金黃色葡萄球菌菌株的核酸擴(kuò)展。以此方式,所述陣列更代表金黃色葡萄球菌物種的完整遺傳多樣性。在一個特別優(yōu)選的實施方案中,陣列包含衍生自至少三種不同金黃色葡萄球菌菌株的多個核酸分子。通過增加金黃色葡萄球菌菌株的數(shù)目以產(chǎn)生陣列中的多個核酸,陣列越來越模擬金黃色葡萄球菌物種的完整遺傳潛力并因此分型變得越來越特異。因此在一個優(yōu)選的實施方案中,陣列包含多個核酸分子,所述核酸分子包含金黃色葡萄球菌物種的基因組多樣性的代表(representation)。這不意味著用攜帶數(shù)量少的不同金黃色葡萄球菌菌株的陣列進(jìn)行分型不是一個有效的方法;它僅意味著預(yù)測和估計變得更精確和完整。
實施例通過全基因組陣列差異雜交數(shù)據(jù)的有監(jiān)督的PLS-DA分析,基于流行性和非流行性金黃色葡萄球菌菌株之間的區(qū)別進(jìn)行群集一組31種不同金黃色葡萄球菌菌株的熒光標(biāo)記的基因組DNA(gDNA)分別與用隨機(jī)選擇的8種不同金黃色葡萄球菌菌株的混和物的gDNA片段包被的陣列雜交(約2100個片段/陣列,約1500bp/片段)。對熒光雜交模式進(jìn)行定量產(chǎn)生對于每種測試菌株的每個基因組DNA片段的雜交信號列表。為了更特異,將每個陣列同時與2種標(biāo)記的gDNA雜交一種涉及進(jìn)行調(diào)查的特異金黃色葡萄球菌菌株(用Cy5標(biāo)記),另一種涉及用于制備陣列的8種金黃色葡萄球菌菌株的標(biāo)準(zhǔn)混和物,用作參考物以使在所有獨立的玻片上進(jìn)行的雜交歸一化(用Cy3標(biāo)記)。
不同細(xì)菌菌株的組一組19種多抗性金黃色葡萄球菌菌株用于實施例3(圖5)。該組由19種醫(yī)院分離株組成。對于所有菌株從日常醫(yī)院實踐中獲得其流行性特征(圖1)。所有用于產(chǎn)生這些菌株的微陣列結(jié)果的實驗程序均參照實施例1的描述。
金黃色葡萄球菌菌株的生長和gDNA分離金黃色葡萄球菌分離株(經(jīng)單菌落)生長在TSA瓊脂平板和/或TSA培養(yǎng)基上(過夜,37℃)并作為甘油培養(yǎng)物儲存(-80℃)。為分離gDNA,將平板生長的細(xì)菌(例如10-20個菌落的量)重懸于在2ml小瓶中的400μl TE緩沖液(10mM Tris-HCl,1mM EDTA,pH7.5)中。加入400μl水洗的0.1mm鋯玻璃珠懸浮液(Biospec ProductsTM)而裂解細(xì)胞,在冰上預(yù)冷,在細(xì)胞破壞儀(minibeadbeater 8,Biospec ProductsTM)中中度振蕩120秒,并在冰上冷卻。離心后(5min,14krpm,4℃),gDNA根據(jù)標(biāo)準(zhǔn)程序(Sambrook,1989)經(jīng)用酚/氯仿/異戊醇提取(室溫)、用氯仿/異戊醇提取(室溫)、用乙醇/醋酸鈉沉淀(-20℃,在4℃離心)、用70%乙醇(-20℃,4℃離心)洗滌、干燥(真空)、沉淀溶解于含有RNAseA(1-100μg/ml)的100μl TE緩沖液中、以及在0.6%瓊脂糖溴化乙錠染色的凝膠中對gDNA的量進(jìn)行半定量(例如1-5μl制備物/槽)而從澄清的裂解物中分離。
構(gòu)建金黃色葡萄球菌gDNA陣列(玻片)為了制備含有金黃色葡萄球菌物種的基因組范圍的代表的陣列,通過混和8種金黃色葡萄球菌菌株的gDNA制備該生物體混和的基因組文庫(菌株選擇見圖3)。選擇這樣的菌株(a)對一廣泛組的抗生素各顯示一不同的抗性譜(總體上覆蓋大多數(shù)類型的抗生素抗性),和(b)在其分離的gDNA的瓊脂糖凝膠分析中不含顯著的質(zhì)粒條帶。gDNA混和物用超聲剪切(Branson sonifier 450)并在0.8%瓊脂糖凝膠中幾條泳道中分離。切下DNA片段(約1-3kb)并經(jīng)與玻璃乳(Biol01-kit)結(jié)合而分離。分離的片段用DNA-terminator End-repair試劑盒(Lucigen Corp.)預(yù)處理以促進(jìn)有效(平端)克隆進(jìn)細(xì)菌質(zhì)粒中(pSmartHCkan vector,CloneSmart Blunt Cloning Kit,Lucigen)。部分連接混和物(1μl)經(jīng)電穿孔(0,1cm-gap cuvets Eurogentec,BioRad Pulsor,25μF,200 ohms,1,6kV)轉(zhuǎn)化至25μl E.coli細(xì)胞(E.kloni 10G supremeelectrocompetent cells,Lucigen)并在TB培養(yǎng)基中再生并鋪板在含有30μg/ml卡那霉素的TY平板上,在37℃過夜生長。用牙簽將菌落轉(zhuǎn)移至96孔微滴板(32個板,150μl/孔含30μg/ml卡那霉素的TY培養(yǎng)基)。37℃過夜生長后,加入甘油(終濃度15%)并將甘油原液儲存在-80℃。
來自孔板中每一克隆的基因組插入物通過PCR擴(kuò)增在96孔PCR平板中倍增(22個平板)。PCR反應(yīng)含有50μl反應(yīng)混和物/孔,其含有1x SuperTaq緩沖液,0.2mM每種dNTP(Roche Diagnostics),0.4M引物L(fēng)1(5′-cag tcc agt tac gct gga gtc-3′)和0.4M引物R1(5′-ctt tct gct atggag gtc agg tat g-3′),1.5U SuperTaq-DNA-聚合酶和1μl來自gDNA庫相應(yīng)孔的甘油原液。兩種引物均含有游離的NH2-基團(tuán),其經(jīng)C6接頭與引物的5’末端偶聯(lián)。使用下述PCR程序4min 94℃,30x(30sec94℃,30sec 50℃,3min 72℃),10min 72℃和浸在4℃。擴(kuò)增后,將50μl PCR產(chǎn)物轉(zhuǎn)移至96孔圓底板并通過加入150μl NaAc/異丙醇混和物(每一個0.2M NaAc,67%異丙醇終濃度)沉淀,在-80℃溫育1小時,離心(1hr,2.5krpm,4℃),除去上清并用100μl 70%乙醇洗滌。DNA沉淀重懸于50μl水/孔中,轉(zhuǎn)移至384孔平板,干燥(speed vac)并重懸于10μl 3xSSC-緩沖液/孔。6個所得的384孔平板含有約2100個PCR產(chǎn)物,被用于點印微陣列。用ESI微陣列printer組合24TeleChem Stealth micro spotting quill-pins(約100μm直徑)將PCR產(chǎn)物點在一系列最多75個“醛”包被玻片(Cell Associates)上。點印后,玻片表面通過在室溫用硼酸酐處理而封閉2x5min于0.2%SDS中,2x5min于水中,10min于硼酸酐緩沖液中(1.7g NaBH4于510ml PBS緩沖液和170ml100%乙醇中),3x5min于0.2%SDS中,3x5min于水中,2sec于100℃水中,用N2流干燥。PBS(磷酸鹽緩沖鹽水)是6.75mM Na2HPO4,1.5mM K2HPO4,140mM NaCl,和2.7mM KCl pH7.0.(1.2g Na2HPO4,0.2g K2HPO4,8.0g NaCl,0.2g KCl/升,pH7.0)。
gDNA標(biāo)記gDNA的熒光標(biāo)記在基于BioPrimeRDNA Labeling System(Invitrogen,Cat.No.18094-011)的25μl反應(yīng)中在0.5-2μg分離的金黃色葡萄球菌gDNA上在37℃進(jìn)行1.5小時。反應(yīng)含有(終濃度)1xRandomPrimer溶液(50mM Tris-HCl PH 6.8,5mM MgCl2,30μg/ml隨機(jī)八聚物,BioprimeR),1x lowT dNTP-混和物(0.25mM dATP,0.25mMdGTP,0.25mM dCTP,0.1mM dTTP),0.06mM Cy-dUTP(Cy=Cy5或Cy3,1μl 1mM原液,Amersham Biosciences)和20單位DNA-聚合酶(Klenow片段;0.5μl 40U/μl原液,BioprimeR)。反應(yīng)后,通過在AutoseqG50柱(Amersham Biosciences)上純化除去鹽、未摻入的(標(biāo)記的)核苷酸和引物。純化后,1/10部分的標(biāo)記材料用于分光光度分析以確定DNA(A260nm)和Cy5(A649nm)或Cy5(A550nm)的量。剩余的標(biāo)記材料用于陣列雜交。
陣列的(預(yù))雜交在雜交準(zhǔn)備中,將玻片置于Petri皿中的20ml預(yù)雜交溶液(1%BSA,,5xSSC,0.1%SDS,經(jīng)0.45μm濾器過濾,42℃)中并在42℃輕搖(溫和旋轉(zhuǎn))45分鐘。接著玻片在40ml水中洗2次(在40ml加蓋試管中)并用N2槍迅速干燥。
用Cy5-dUTP和Cy3-dUTP標(biāo)記的合適的gDNA樣品與4μl酵母tRNA(25μg/μl)組合,干燥(用SpeedVac),重溶于40μl EasyHyb溶液(Roche Applied Science),變性(1.5min,95℃),短暫旋轉(zhuǎn)沉淀(1sec,10krpm),置于預(yù)保溫(42℃金屬板)的干的預(yù)雜交陣列上,用塑料紙覆蓋(Hybrislip,Molecular Probes),插入到水蒸氣飽和的預(yù)加熱的(42℃)雜交室(Corning)中并在42℃水浴中雜交過夜。對于每一雜交,來自測試菌株的gDNA用Cy5-dUTP標(biāo)記,而參考庫(來自用于陣列構(gòu)建的菌株的gDNA混和物)用Cy3-dUTP標(biāo)記。雜交后,通過在加蓋的40ml試管中的40ml(不同)緩沖液中搖動玻片4次而洗滌陣列(洗滌緩沖液11x SSC,0.2%SDS,37℃,5-10sec;洗滌緩沖液20.5x SSC,37℃,5-10sec;洗滌緩沖液3和40.2x SSC,20℃,各10min)。
掃描和圖像分析洗滌后,玻片儲存在黑暗中(以防止Cy熒光衰減)或直接用于用掃描裝置(來自PerkinElmer的ScanArray 4000,帶有來自PackardBioscience的Scanalyse軟件)掃描熒光Cy染料。進(jìn)行快速掃描(分辨率30μm/像素)以選擇最佳激光(強(qiáng)度)和檢測(光電倍增管)設(shè)置以防止低信號或飽和信號的過量。玻片被掃描兩次針對Cy5和Cy3熒光。用ImaGene軟件(BioDiscoveryInc.,version 4.2)量化數(shù)字掃描圖,產(chǎn)生針對陣列上每一點的點身份(spot identity)以及針對Cy5和Cy3的信號(S)和背景(B)值。數(shù)據(jù)儲存在電子文件中并用于進(jìn)一步數(shù)據(jù)加工。
數(shù)據(jù)預(yù)加工通過使用空白表格軟件(Excel,Microsoft)對于每一點進(jìn)行下列運算Cy3和Cy5的S-B值、Cy5/Cy3比率[R=Cy5(S-B)]/[(Cy3(S-B)]。去除低質(zhì)量數(shù)據(jù)(例如具有S<2B的Cy3數(shù)據(jù)的點)。然后,對于每一玻片,基于玻片上的所有點的平均Cy5-和Cy3-信號計算歸一化因數(shù)N(N=[平均Cy5(S-B)]/[平均Cy3(S-B)]。接著,對于在所有陣列上的每一點計算歸一化比率(Rn)(Rn=R/N)。許多玻片(與金黃色葡萄球菌菌株相關(guān)的玻片)的每一點的歸一化比率的矩陣(=數(shù)據(jù)集)被用于進(jìn)一步數(shù)據(jù)預(yù)加工。
由于Cy3信號通常存在于大多數(shù)點(8個菌株的Cy3標(biāo)記的參考gDNA庫與所有玻片雜交),并且Cy5信號可以變化(不同菌株的Cy5標(biāo)記的gDNA各自與單個玻片雜交),所以如果一個gDNA片段分別存在或不存在于Cy5測試的菌株中,則Cy5/Cy3比率在理論上可以有兩個值。但是在實踐中,這些值圍繞1和0變化。因此,在許多分析中在進(jìn)一步分析之前對比率數(shù)據(jù)集施加0和1的截斷值(例如Rn<0.5和Rn>0.5分別由0和1代替,或者Rn<0.3和Rn>0.7分別由0和1代替,同時保持Rn值在0.3和0.5之間)。這些“截斷值數(shù)據(jù)集”用于最終數(shù)據(jù)分析。
結(jié)果一組19種不同的金黃色葡萄球菌分離株被加工以用于來自在全基因組微陣列上的差異雜交的數(shù)據(jù)的PLS-DA分析(圖2)。
所述PLS-DA分析根據(jù)其已知的流行性特征產(chǎn)生金黃色葡萄球菌菌株的顯著群集(圖2,E=流行性,N=非流行性)。
這表明總差異雜交數(shù)據(jù)集的一部分含有可用于預(yù)測未知金黃色葡萄球菌菌株的流行性的信息。
權(quán)利要求
1.一種對衍生自或得自金黃色葡萄球菌菌株的樣品核酸進(jìn)行分型的方法,包括-提供包含多個核酸分子的陣列,其中所述多個核酸分子衍生自第一組的至少兩種不同的金黃色葡萄球菌菌株;-通過將所述陣列與得自或衍生自第二組的至少兩種不同的金黃色葡萄球菌菌株的至少兩種不同參考核酸進(jìn)行雜交而提供至少兩種不同的參考雜交模式,其中所述第二組中的所述金黃色葡萄球菌菌株基于至少一個表型參數(shù)的值可分成至少兩組;-通過無監(jiān)督的多變量分析群集參考雜交模式而產(chǎn)生參考雜交模式的至少兩種不同的集群;-將與用于制備參考雜交模式的陣列相同的陣列與樣品核酸雜交以獲得樣品雜交模式;以及-將所述樣品雜交模式歸于所述參考雜交模式的至少兩種不同的集群中的一種。
2.權(quán)利要求1的方法,其中所述樣品核酸中的片段的平均大小在約50至5000個核苷酸之間。
3.權(quán)利要求1或2的方法,其中所述多個核酸分子的平均大小在約200至5000個核苷酸之間。
4.權(quán)利要求1-3任一項的方法,其中所述陣列包括隨機(jī)選自所述至少兩種不同的金黃色葡萄球菌菌株的片段化的基因組DNA的片段的約1500至5000個核酸分子。
5.前述任一項權(quán)利要求的方法,其中所述樣品核酸衍生自金黃色葡萄球菌的純培養(yǎng)物。
6.前述任一項權(quán)利要求的方法,其中所述多個核酸分子衍生自至少3種、優(yōu)選地至少5種、更優(yōu)選地至少8種不同的金黃色葡萄球菌菌株。
7.前述任一項權(quán)利要求的方法,其中所述方法包括將樣品雜交模式與包含至少3種、更優(yōu)選地至少5種、更優(yōu)選地至少50種不同參考雜交模式的參考雜交模式集群相對比。
8.前述任一項權(quán)利要求的方法,其中所述表型參數(shù)是所述菌株的流行性。
9.權(quán)利要求7或8的方法,其中所述對比包括參考雜交模式和樣品雜交模式的偏最小二乘法判別分析(PLS-DA),其中至少一個其值對于參考雜交模式是已知的(并且其信息用于有監(jiān)督的PLS-DA分析)的表型參數(shù)被針對樣品核酸或其衍生來源而額外確定或估計。
10.權(quán)利要求9的方法,進(jìn)一步包括基于有監(jiān)督的PLS-DA分析對雜交模式進(jìn)行群集。
11.前述任一項權(quán)利要求的方法,其中基本上所有參考雜交模式由金黃色葡萄球菌菌株的核酸產(chǎn)生。
12.前述任一項權(quán)利要求的方法,其中所述分型包括確定衍生所述樣品核酸的金黃色葡萄球菌是否是流行株。
13.前述任一項權(quán)利要求的方法,其中所述第二組的至少兩種不同的金黃色葡萄球菌菌株包含來自所述第一組的菌株。
14.一種試劑盒,所述試劑盒包括權(quán)利要求1-13任一項定義的陣列與權(quán)利要求1-13任一項定義的至少兩種不同的參考雜交模式或參考核酸的組合。
全文摘要
一種對衍生自或得自金黃色葡萄球菌(Staphylococcus aureus)菌株的樣品核酸進(jìn)行分型(typing)的方法,包括提供包含多個核酸分子的陣列,其中所述多個核酸分子衍生自第一組的至少兩種不同的金黃色葡萄球菌菌株,通過將所述陣列與得自或衍生自第二組的至少兩種不同的金黃色葡萄球菌菌株的至少兩種不同參考核酸進(jìn)行雜交而提供至少兩種不同的參考雜交模式,其中所述第二組中的所述金黃色葡萄球菌菌株基于至少一個表型參數(shù)的值而可分成至少兩組,通過無監(jiān)督的多變量分析(unsupervised multivariate analysis)群集(clustering)參考雜交模式而產(chǎn)生參考雜交模式的至少兩種不同的集群(cluster),將與用于制備參考雜交模式的陣列相同的陣列與樣品核酸雜交以獲得樣品雜交模式,以及將所述樣品雜交模式歸于(assign)所述參考雜交模式至少兩種不同的集群中的一種。
文檔編號G06F19/20GK101018872SQ200580021593
公開日2007年8月15日 申請日期2005年4月29日 優(yōu)先權(quán)日2004年4月29日
發(fā)明者弗蘭克·亨利·約翰·許倫, 揚(yáng)·費爾霍夫, 羅伊·克里斯蒂安·蒙泰因 申請人:荷蘭應(yīng)用科學(xué)研究會(Tno), Umc烏得勒支控股有限公司