本發(fā)明涉及醫(yī)藥學數(shù)據(jù)處理領域,尤其涉及一種度量中藥材相似性的方法及裝置。
背景技術:
中藥材是中藥方劑、中成藥的組成單元,是各大中藥診所、藥房以及中藥制藥廠必不可少的原料。實際情況中,常出現(xiàn)某一種藥材,例如虎骨、犀角等已被列為瀕危中藥品種或受保護不被國家允許開采的行列,或是某一藥材因市場緊缺而不能及時到位,同時,根據(jù)病人的經(jīng)濟能力,某些名貴中藥材也被排除到了用藥考慮范圍。以上各種情況,均使得原有藥方中的配伍藥物缺失而使得病人不能按方抓藥。
對于給定的稀缺中藥材,由于不同中醫(yī)從業(yè)人員的學識和經(jīng)驗不同,可能給出多種不同的替代品藥材,具有較強的主觀性和不確定性,需要基于藥物本身的性質和用藥規(guī)律對稀缺中藥材和替代品中藥材進行客觀的相似性度量,從而便于選取與所需稀缺中藥材最為相似的藥材作為替代品。
技術實現(xiàn)要素:
本發(fā)明所要解決的是提供一種能夠度量兩種中藥材的相似性的度量中藥材相似性的方法及裝置。
為了解決上述技術問題,本發(fā)明提供了如下的技術方案:
一種度量中藥材相似性的方法,包括以下步驟:
S1:給定兩味中藥材,查詢分別與所述給定的中藥材配伍的配伍藥材,并基于各所述配伍藥材的配伍頻率分別建立對應于給定的所述藥材的配伍集合;
S2:獲取兩個配伍集合的并集;
S3:分別構建關于兩個給定的所述藥材的配伍特征向量;
S4:通過兩個所述配伍特征向量的內積空間夾角的余弦值來度量兩味中藥材的相似性。
作為優(yōu)選,所述步驟S1進一步配置為,所述配伍集合中的藥材數(shù)量大于或等于10。
作為優(yōu)選,所述步驟S3中兩個所述配伍特征向量分別為和其中,符號[]T表示向量轉置,ga,i表示向量中的第i個元素,gb,i表示向量中的第i個元素,并且
其中,ci為所述步驟S2中所獲得的并集中第i個元素,M表示ci的個數(shù),A和B分別為步驟S1中得到的配伍集合,fA(ci)和fB(ci)分別表示ci屬于集合A和B的情況下在中藥方劑數(shù)據(jù)庫中的所有包含兩種給定中藥材的藥方中出現(xiàn)的頻率。
作為優(yōu)選,步驟S4中,按照下述公式求解所述兩個配伍特征向量的內積夾角的余弦值:
其中,符號T表示對向量進行轉置處理,符號||||表示向量的歐幾里得范數(shù)。
作為優(yōu)選,所述步驟S4中,兩個給定的所述中藥材的相似性與所述余弦值正相關。
另外,本發(fā)明還提供了一種度量中藥材相似性的裝置,其應用如上所述的方法,所述裝置包括:
數(shù)據(jù)庫,其用于存儲中藥材的藥方;
查詢模塊,其配置為查詢出與給定的中藥材配伍的配伍藥材,并基于所述配伍藥材的配伍頻率建立對應于給定的所述藥材的配伍集合;
并集模塊,其配置為對所建立的配伍集合取并集;
數(shù)據(jù)處理模塊,其配置為構建關于給定的所述藥材的配伍特征向量,并通過兩味藥材的配伍特征向量的內積空間夾角的余弦值來度量兩味中藥材的相似性。
作為優(yōu)選,所述查詢模塊所建立的配伍集合中的藥材數(shù)量大于或等于10。
作為優(yōu)選,所述數(shù)據(jù)處理模塊進一步配置為根據(jù)以下公式獲取所述藥材的配伍特征向量其中,其中符號[]T表示向量轉置,ga,i表示向量中的第i個元素,并且其中,
其中,ci為所述并集模塊中所獲得的并集中第i個元素,M表示ci的個數(shù),A為步驟查詢模塊得到的配伍集合,fA(ci)分別表示ci屬于集合A的情況下在中藥方劑數(shù)據(jù)庫中的所有包含給定中藥材的藥方中出現(xiàn)的頻率。
作為優(yōu)選,所述數(shù)據(jù)處理模塊進一步配置為按照下述公式求解所述兩個配伍特征向量的內積夾角的余弦值:
其中,符號T表示對向量進行轉置處理,符號||||表示向量的歐幾里得范數(shù)。
作為優(yōu)選,所述數(shù)據(jù)處理模塊進一步配置為給定的所述中藥材的相似性與所述余弦值正相關。
與現(xiàn)有技術相比,本發(fā)明的有益效果在于:
(1)本發(fā)明技術方案提供的度量中藥材相似性的方法,有助于幫助中藥從業(yè)人員或病人挑選某一緊急稀缺中藥材的多個相似藥材中與所需藥材最為接近的替代品;
(2)本發(fā)明技術方案中的中藥材相似性度量方法充分考慮了中藥方劑中的配伍規(guī)律,使相似性度量結果客觀、可靠。
附圖說明
圖1為本發(fā)明實施例中一種度量中藥材相似性的方法的流程圖;
圖2為本發(fā)明實施例中一種度量中藥材相似性的裝置的原理框圖。
附圖標記說明
1-數(shù)據(jù)庫 2-查詢模塊
3-并集模塊 4-數(shù)據(jù)處理模塊
5-輸入部
具體實施方式
下面,結合附圖對本發(fā)明的實施例進行詳細的說明,但不作為本發(fā)明的限定。
本發(fā)明實施例提供了一種度量中藥材相似性的方法,通過該方法可以幫助中藥從業(yè)人員或病人挑選某一緊急稀缺中藥材的多個相似藥材中與所需藥材最為接近的替代品。
如圖1所示,為本發(fā)明實施例中一種度量中藥材相似性的方法的流程圖;其中包括以下步驟:
S1:給定兩味中藥材,查詢出與所述給定的中藥材配伍的配伍藥材,并基于所述配伍藥材的配伍頻率分別建立對應于給定的所述藥材的配伍集合;例如,本實施例中給定兩味中藥材a和b,在中藥方劑數(shù)據(jù)庫中查詢所有包含中藥材a的藥方,可以統(tǒng)計與a配伍使用的頻次較高的前N種中藥材,組成配伍集合A={a1,a2,...ai...,aN},其中ai表示與a配伍使用的所有中藥材中按出現(xiàn)頻次由高到低順序排列的第i個中藥材,其出現(xiàn)頻率為fA(ai),其中i=1,2,...,N且fA(a1)≥fA(a2)≥...≥fA(aN);另外,在中藥方劑數(shù)據(jù)庫中查詢所有包含中藥材b的藥方,統(tǒng)計與b配伍使用的頻次較高的前N種中藥材,組成配伍集合B={b1,b2,...bj...,bN},其中bj表示與b配伍使用的所有中藥材中按出現(xiàn)頻次由高到低順序排列的第j個中藥材,其出現(xiàn)頻率為fB(bj),其中j=1,2,...,N且fB(b1)≥fB(b2)≥...≥fB(bN);本實施例中的N取值大于或等于10。
S2:獲取兩個配伍集合的并集;即,計算步驟S1得到的集合A和集合B的并集C=AUB={c1,c2,...ck...,cM},其中M表示并集C中元素個數(shù),ck表示并集C中第k個元素,k=1,2,...,M;
S3:分別構建關于兩個給定的所述藥材的配伍特征向量;例如可以分別構建中藥材a和b的M維配伍特征列向量和
S4:通過兩個所述配伍特征向量的內積空間夾角的余弦值來度量兩味中藥材的相似性。即可以通過測量步驟S3中得到的兩個M維配伍特征列向量和內積空間的夾角的余弦值來度量兩味中藥材a和b的相似性,其中測量得到的夾角余弦值的取值范圍為[0,1],取值越大表示中藥材a和b越相似;
所述的測量兩個M維配伍特征列向量和內積空間的夾角的余弦值的公式為
其中,符號T表示對向量進行轉置處理,符號||||表示向量的歐幾里得范數(shù)。
此外,上述兩個M維向量夾角余弦值計算公式并不僅限于實施方式中提到的各種具體形式,本領域的普通技術人員可對其進行簡單地熟知地替換,例如:兩個M維向量夾角余弦值計算公式的分子中的除可使用矩陣相乘的形式外,還可以是向量內積或點積的形式,即
優(yōu)選的,步驟S3中兩個配伍特征向量分別可以表示為和其中,符號[]T表示向量轉置,ga,i表示向量中的第i個元素,gb,i表示向量中的第i個元素,并且
其中,ci為所述步驟S2中所獲得的并集中第i個元素,M表示ci的個數(shù),A和B分別為步驟S1中得到的配伍集合,fA(ci)和fB(ci)分別表示ci屬于集合A和B的情況下在中藥方劑數(shù)據(jù)庫中的所有包含兩種給定中藥材的藥方中出現(xiàn)的頻率。
綜上,本發(fā)明實施例中所提供的一種度量中藥材相似性的方法,可以基于大量的中藥方劑中的藥物配伍規(guī)律,客觀地反映兩種中藥材的相似性,有助于為稀缺中藥材尋找替代品藥材時衡量兩種藥材在藥性上的相似度。
另外,本發(fā)明還提供了一種度量中藥材相似性的裝置,如圖2所示為本發(fā)明實施例中的一種度量中藥材相似性的裝置的原理框圖,該裝置可以包括:數(shù)據(jù)庫1、查詢模塊2、并集模塊3、數(shù)據(jù)處理模塊4和輸入部5;其中,數(shù)據(jù)庫1可以構造為中藥方劑數(shù)據(jù)庫,以用于存儲中藥材以及包含該中藥材的藥方;對于通過輸入部5輸入的兩個或多個中藥材的名稱,可以作為本實施例中度量對象即給定的中藥材,即通過本實施例所提供的裝置可以度量輸入部5輸入的中藥材的相似性。具體的,查詢模塊2用于查詢出在數(shù)據(jù)庫1中與給定的中藥材配伍的配伍藥材,并基于查詢出的配伍藥材的配伍頻率建立對應于給定的所述藥材的配伍集合;例如,可以在數(shù)據(jù)庫1中查詢所有包含中藥材a的藥方,統(tǒng)計與a配伍使用的頻次較高的前N種中藥材,組成配伍集合A={a1,a2,...ai...,aN},其中ai表示與a配伍使用的所有中藥材中按出現(xiàn)頻次由高到低順序排列的第i個中藥材,其出現(xiàn)頻率為fA(ai),還可以統(tǒng)計與b配伍使用的頻次較高的前N種中藥材,組成配伍集合B={b1,b2,...bj...,bN},其中bj表示與b配伍使用的所有中藥材中按出現(xiàn)頻次由高到低順序排列的第j個中藥材,其出現(xiàn)頻率為fB(bj),其中j=1,2,...,N且fB(b1)≥fB(b2)≥...≥fB(bN);
其中i=1,2,...,N且fA(a1)≥fA(a2)≥...≥fA(aN);其中,N可以為大于或等于10的取值。而并集模塊3可以對查詢模塊2所建立的配伍集合A和B取并集,C=AUB={c1,c2,...ck...,cM},其中M表示并集C中元素個數(shù),ck表示并集C中第k個元素,k=1,2,...,M;數(shù)據(jù)處理模塊4用于構建關于給定的藥材a和b的配伍特征向量和并通過兩味藥材的配伍特征向量的內積空間夾角的余弦值來度量兩味中藥材的相似性。其中數(shù)據(jù)處理模塊4可以根據(jù)以下公式獲取所述藥材的配伍特征向量其中,其中符號[]T表示向量轉置,ga,i表示向量中的第i個元素,并且其中,
其中,ci為所述并集模塊中所獲得的并集中第i個元素,M表示ci的個數(shù),A為步驟查詢模塊得到的配伍集合,fA(ci)分別表示ci屬于集合A的情況下在中藥方劑數(shù)據(jù)庫中的所有包含給定中藥材的藥方中出現(xiàn)的頻率。
另外,數(shù)據(jù)處理模塊4還可以進一步配置為按照下述公式求解兩個配伍特征向量的內積夾角的余弦值:
其中,符號T表示對向量進行轉置處理,符號||||表示向量的歐幾里得范數(shù)。
其中,給定的所述中藥材的相似性與所述余弦值正相關。
以上所述的具體實施例,對本發(fā)明的目的、技術方案和有益效果進行了進一步詳細說明,所應理解的是,以上所述僅為本發(fā)明的具體實施例而已,并不用于限制本發(fā)明,凡在本發(fā)明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內。