日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

符號分析系統(tǒng)、計算機(jī)可讀媒體和方法

文檔序號:6583593閱讀:265來源:國知局
專利名稱:符號分析系統(tǒng)、計算機(jī)可讀媒體和方法
技術(shù)領(lǐng)域
本發(fā)明通常涉及分析裝置和方法,并且涉及分類數(shù)據(jù)的裝置和方法。
背景技術(shù)
在已有技術(shù)中,存在分類和分析文本數(shù)據(jù)的裝置和方法。在美國專利號6,006,221(“’221專利”)中描述了一個實(shí)例。’221專利揭示一種文檔檢索系統(tǒng),其中用戶可以輸入查詢并從數(shù)據(jù)庫中檢索文檔。數(shù)據(jù)庫中的每個文檔都經(jīng)過一組處理步驟以產(chǎn)生與語言無關(guān)的文檔的主題內(nèi)容的概念表達(dá)。查詢也經(jīng)過一組處理步驟以產(chǎn)生與語言無關(guān)的查詢的主題內(nèi)容的概念表達(dá)。也可對這些文檔和查詢進(jìn)行附加分析以提供附加的基于術(shù)語的表達(dá),例如對信息豐富的詞和短語的析取。依據(jù)概念級文檔和查詢的內(nèi)容并可選依據(jù)基于術(shù)語的表達(dá),使文檔和查詢匹配。隨后,將查詢表達(dá)與每個文檔的表達(dá)進(jìn)行比較以產(chǎn)生文檔與查詢的關(guān)聯(lián)性度量。
已有系統(tǒng)有時會遇到不能正確地識別某些相關(guān)文檔的困擾。已有技術(shù)的系統(tǒng)有時會遇到不能正確度量文檔與查詢關(guān)聯(lián)性的困擾。

發(fā)明內(nèi)容
這里所描述和所申請的發(fā)明在許多情況中都顯示出超越已有系統(tǒng)的改進(jìn),本發(fā)明更能正確地識別相關(guān)文檔,且更能度量文檔與查詢的關(guān)聯(lián)性。而且,本發(fā)明提供了一種統(tǒng)一的結(jié)構(gòu)以結(jié)合多媒體和異類數(shù)據(jù)庫,使得它們能用單一查詢進(jìn)行分析和全面研究。本發(fā)明構(gòu)造數(shù)據(jù)以允許復(fù)雜分析運(yùn)算,并配備了自動化代理程序以便與用戶、變化數(shù)據(jù)環(huán)境或其他自動代理程序提供的信號交互執(zhí)行這些操作。本發(fā)明也能保存已有系統(tǒng)所不能捕獲的符號信息。
本發(fā)明包括一種具有可檢索數(shù)據(jù)庫的系統(tǒng)。該數(shù)據(jù)庫具有多段媒體,至少部分媒體段與媒體段與描述符關(guān)聯(lián),例如,描述符可以指示媒體段部分之間的關(guān)系,或描述符可以指示該部分如何使用、揭示或其作用。
本發(fā)明還包括一種具有多段媒體的計算機(jī)可讀媒體。至少一段媒體具有由一個描述符識別的部分。該描述符指示了該部分的符號屬性。
本發(fā)明還包括一種方法,其中多段媒體的數(shù)據(jù)庫和對應(yīng)于一媒體段部分的描述符一起給出。提供了具有符號記號的查詢。該查詢用于搜索的檢索和對應(yīng)于該查詢的可能相關(guān)的媒體。


為了更加完整地理解本發(fā)明的性質(zhì)和目標(biāo),應(yīng)該在下面的詳細(xì)描述中結(jié)合附圖作為參照,其中圖1是根據(jù)本發(fā)明的系統(tǒng)的圖示,該系統(tǒng)包括與數(shù)據(jù)庫進(jìn)行通信的計算機(jī);而圖2表示根據(jù)本發(fā)明的十元(dimension)整體信息空間的符號劃分。
具體實(shí)施例方式
圖1示出根據(jù)本發(fā)明的系統(tǒng)。該系統(tǒng)包括具有軟件的計算機(jī)10。當(dāng)軟件運(yùn)行時,計算機(jī)10將接受來自用戶的查詢,并隨后檢索數(shù)據(jù)庫20查找可能與該查詢關(guān)聯(lián)的媒體段。
該系統(tǒng)還包括與計算機(jī)10進(jìn)行通信的數(shù)據(jù)庫20。計算機(jī)10具有多段媒體。例如,一個媒體段可以是文檔的文本,或者是音頻或視頻表示的記錄。數(shù)據(jù)庫20可以建立在計算機(jī)可讀媒體上,可以具有多個媒體段。計算機(jī)可讀媒體的實(shí)例是軟盤、光盤、隨機(jī)訪問存儲器和只讀存儲器。至少一個媒體段具有由至少一個描述符識別的部分。該描述符指示該部分的符號屬性。
該描述符提供了有關(guān)媒體段部分的信息。例如,如果媒體段包括文本,就可能希望將一個或多個描述符與文本部分關(guān)聯(lián),以便提供有關(guān)該部分的附加信息。
當(dāng)需要對數(shù)據(jù)庫進(jìn)行檢索取得相關(guān)媒體時,就進(jìn)行查詢,并且查詢的某些部分可能與一個或多個記號關(guān)聯(lián)。例如,該查詢可以包括字,這些字中的一些可能與記號關(guān)聯(lián),并且對上述數(shù)據(jù)庫20進(jìn)行檢索以查找這些字,而如果在數(shù)據(jù)庫20中找到這些字,就對是否存在匹配記號的描述符進(jìn)行判定。查詢輸入到計算機(jī)10,隨后,計算機(jī)10對數(shù)據(jù)庫20進(jìn)行檢索以查找與該查詢相關(guān)的媒體段。例如,如果查詢中的字和記號匹配數(shù)據(jù)庫20中的字和描述符,就將對應(yīng)的媒體段識別作為可能與該查詢特別關(guān)聯(lián)。
媒體段的一部分可以具有許多對應(yīng)的描述符。查詢一部分也具有多個對應(yīng)的記號。和查詢高度相關(guān)的媒體段與和查詢不是高度相關(guān)的媒體段相比在描述符和記號之間具有更高的匹配性。例如,考慮具有5個與其關(guān)聯(lián)的記號的查詢部分,具有4個與其關(guān)聯(lián)的描述符的文本部分的第一文檔以及具有7個與其關(guān)聯(lián)的描述符的相同文本部分的第二文檔。假設(shè)第一文檔的描述符包括5個記號中的4個,而第二文檔描述符僅包括5個描述符中的2個。當(dāng)檢索數(shù)據(jù)庫20時,通過查詢,第一文檔將識別為具有大于第二文檔的匹配程度,因?yàn)楦鄶?shù)量的第一文檔描述符匹配查詢記號。隨后,可以為用戶提供可能有關(guān)該查詢的文檔優(yōu)先列表。例如,第一文檔可能在優(yōu)先列表上列出在第二文檔之前。
在某些情況下,一些描述符與其他描述符相比可能更加好地指示出媒體的內(nèi)容,因此,更好指示的描述符可以給予比較少指示的描述符更大的權(quán)重。類似的,某些記錄與其他符號相比可在查詢的內(nèi)容的更好指示,因此,更好指示的記錄與較少指示的記錄相比給予更大的權(quán)重。在這種加權(quán)描述符和加權(quán)記號的系統(tǒng)中,當(dāng)在描述符和記號之間找出匹配時,屬于描述符或記號的權(quán)重可以用于提供其對應(yīng)的媒體,它與具有匹配未加權(quán)的描述符和記號的其他媒體相比可能具有更大的相關(guān)性。例如,描述符和記號的權(quán)重可以進(jìn)行數(shù)學(xué)上的結(jié)合,例如相加或相乘以提供描述符和記號匹配對的總權(quán)重。為了說明這點(diǎn),考慮具有10個與查詢的特定部分關(guān)聯(lián)的記號的查詢,其中的一個記號用因數(shù)2加權(quán)表示加權(quán)的記號特別指示了查詢??紤]具有5個描述符的第一媒體段部分,其中的兩個描述符用因數(shù)3加權(quán)以表示加權(quán)描述符特別指示了該部分。還考慮具有7個描述符的第二媒體段,這些描述符都沒有加權(quán),它們與在第一媒體段中找到的相同部分關(guān)聯(lián)。如果檢索數(shù)據(jù)庫20,假設(shè)查詢導(dǎo)致識別出第一媒體段部分,并導(dǎo)致識別出第二媒體段部分。如果第一媒體段部分中的3個描述符匹配3個記號,并且加權(quán)描述符和記號在這些匹配的描述符中,那么,第一媒體段將識別為特別關(guān)聯(lián)于該查詢。然而,如果第二媒體段部分中的3個描述符匹配3個記號,雖然,識別出第二媒體段,但第二媒體段不會識別為特定關(guān)聯(lián)于該查詢。在該實(shí)例中,第一媒體段將判定為比第二媒體段更加關(guān)聯(lián)于該查詢。在檢索得出的媒體優(yōu)先列表中,將第一媒體段列為比第二媒體段具有更高的相關(guān)性。如下所述,注意檢索查詢可以推廣到包括復(fù)雜的學(xué)習(xí)和提取算法以及代理通信協(xié)議。
一種提供描述符和記號(統(tǒng)稱為“指示符”)的方法是使用一組多元指示符,該組可以用于描述和分類媒體段部分以及查詢段部分。隨后,當(dāng)需要一個描述符和記號時,該描述符和記號就可以從該指示符中選擇。應(yīng)該清楚,描述符是對應(yīng)于媒體的指示符,而記號是對應(yīng)于查詢的指示符。在此所述的多元指示符組是根據(jù)本發(fā)明劃分和分類媒體或查詢段部分的符號方法的實(shí)例。
在符號學(xué)領(lǐng)域,符號關(guān)系(“S”)是必須伴隨對象(“O”)、符號(“R”用于“表達(dá)(representamen)”),以及該符號對解釋思路和準(zhǔn)思路產(chǎn)生的某些效果(“I”用于“解釋符(interpretant)”)的三元原語。這樣,O-R-I就是包括Object-Representamen-Interpretant的不可約三元關(guān)系。習(xí)慣上,整體信息空間劃分為3個二元對。第一常規(guī)二元對為關(guān)系R-O,稱為“語義”,它處理符號與對象的關(guān)系。第二常規(guī)二元對為關(guān)系R-R,稱為“符號關(guān)系”,它處理符號與符號的關(guān)系。第三常規(guī)二元對為關(guān)系R-I,稱為“Pragmatics-語用”,它處理意義或符號與解釋符的關(guān)系。這種常規(guī)的整體信息空間劃分將三元關(guān)系減少為3個二元對,根據(jù)Peirce的減少定理,不可能沒有符號丟失。需要更多的有關(guān)Peirce減少定理信息,可以查閱A Peircean ReductionThesisThe Foundations of Topological Logic,By Robert W.Burch,1991。這些熟悉的Peirce教義的人可以理解超過三元的關(guān)系可以減少到三元,但三元不能在沒有符號丟失的情況下,再減少到二元對和單元。本發(fā)明的目標(biāo)是如果不能消除就減少與整體信息空間常規(guī)劃分有關(guān)對的符號丟失。
本發(fā)明將三元關(guān)系處理成對于寬度和深度是連續(xù)的,而不是起初就將整體信息空間細(xì)分為3個二元對。相對于寬度,每個解釋符可以將其自身看作一個符號關(guān)系,具有它自己的對象和解釋符;這樣,O-R-I關(guān)系必然伴有符號的連續(xù)統(tǒng),每個符號產(chǎn)生另一符號。
相對于深度,連續(xù)統(tǒng)中的任何斷點(diǎn)必然伴有許多可能性,它們是可分解和再細(xì)分到三元圖。出于描述本發(fā)明的目的,在O-R-I連續(xù)統(tǒng)中描述了10個斷點(diǎn)(也稱為“元”),而每個元分為3個符號元素。圖2說明了這種10元的連續(xù)統(tǒng)。其中,R是表達(dá)符,O是對象,I′是當(dāng)前解釋符,I″是連續(xù)音解釋符,I是直接,d是動態(tài),f是最終。其中,i、d、f指示用于(O)對象和(I)解釋符的斷點(diǎn)。每個符號元素可以分成子元素。有時,將符號元素稱為對應(yīng)元的“價(valence)”表示比較有用。并且將子元素稱為對應(yīng)符號元素的“顆粒(granular)”表示比較有用。在這種方式中,為了用查詢正確識別媒體段,可以實(shí)現(xiàn)和利用“豐富(richness)”或“密度(density)”。應(yīng)該注意在任意給定元中可以用許多符號元素來表示任何數(shù)據(jù)。用超過一個的符號元素來描述數(shù)據(jù)的能力在此稱為“共存性(compossibitity)”。本發(fā)明的共存方面保存了僅允許用一個符號元素與數(shù)據(jù)關(guān)聯(lián)的數(shù)據(jù)表達(dá)所沒有保存的信息。
并沒有隨意描述本實(shí)例中的元。元的描述是通過假設(shè)為基礎(chǔ)的3種思維類別來判定。首先,單獨(dú)的一個事物的“直接”概念(僅需要一個元素);其次,與其他事物直接關(guān)系的事物的“動態(tài)”概念(需要兩個元素);第三,與其他事物間接關(guān)系的事物的“最終”概念(需要3個元素)。這些3種類別可以看作是思維的時刻,即首先,我們單獨(dú)構(gòu)思我們思考的對象(相對于其他對象(“第二性Secondness”)的定義),隨后由一些符號或其他中間事物(“第三性Thirdness”)來間接表達(dá)。我們分別將下標(biāo)I、d和f用于直接、動態(tài)和最終。
出于區(qū)分元的目的,下面使用羅馬數(shù)字I到X。羅馬數(shù)字的使用不包含分層結(jié)構(gòu)。為了使元更具說服力,我們將一些Peirce常用的難術(shù)語用于它們中的共存符號元素,但需要牢記這些用于符號元素的術(shù)語只是說明性的,并不要詳細(xì)討論它們的含義。每個符號元素可以看作是與其關(guān)聯(lián)的元的價?!暗谝恍詅irstness”、“第二性secondness”和“第三性thirdness”的類別可以應(yīng)用于整個發(fā)明。同樣,在給出實(shí)例時,并不是意指該實(shí)例是完美的實(shí)例,其他符號元素就不能用于該實(shí)例,而只是說明其具有所討論的特定形態(tài)。應(yīng)該認(rèn)識到一個符號元素的應(yīng)用并不將同一元中的其他元素排除在外。記住這一點(diǎn),這些元是I.R-O sub i關(guān)于直接對象的表達(dá)符--就是說,對象僅含有符號信息。實(shí)際上,這是能讓計算機(jī)“認(rèn)出”對象的唯一方法。在該元中,存在3個符號元素描述、名稱、分配。在該元中的符號元素實(shí)例為(1)對象描述符例如“blue”,(2)將對象從一個或多個其他對象中區(qū)分出來的對象名字,例如,“Blue Boy”(Gainsborough的繪畫),(3)分配屬性,一類對象的規(guī)則或類似規(guī)則的關(guān)系(或是Peirce術(shù)語中的“同形結(jié)合體(copulant)”),例如,“blueness”的“-ness”方面或等號(“=”)或它們角色中作為通用同形結(jié)合體的隱含符號(“>”)。
II.R-O sub d關(guān)于動態(tài)對象的表達(dá)符,就是說,在與世界的關(guān)系中的對象。在該元中,我們具有Peirce著名的圖標(biāo)-索引-符號的符號元素。當(dāng)符號元素與其動態(tài)對象的關(guān)系是形象的,那么該符號元素就用相似或類似物表示對象,例如,Blue Boy可以看作是模特的肖像。當(dāng)符號元素與其動態(tài)對象的關(guān)系是索引的,它就通過參照某些附屬信息來表示對象,例如Blue Boy臉部的蒼白在醫(yī)生看來是營養(yǎng)不良的癥狀。當(dāng)符號與其動態(tài)對象的關(guān)系是符號的,該符號就通過某些常規(guī)或任意的并聯(lián)習(xí)慣來表示對象,例如英語單詞“boy”,由字母b-o-y構(gòu)成的符號。
III.R-O sub f關(guān)于對象存在的模式的表達(dá)符,就是說,我們曾將固定概念附加于它的對象,即是“最終”對象而不是“動態(tài)”或“直接”對象。在該元中,對象可能可共存地為抽象、凝結(jié)性、集合的。該對象的抽象性到了符號可將其作為單獨(dú)對象來表示的程度,例如,“原子”。這引起了抽象在語源學(xué)上的含義,“找出”一個元素排除在其他元素之外。對象的凝結(jié)性到了符號可將其作為關(guān)系組成來表示的程度,例如“分子”。這引起了凝結(jié)在語源學(xué)上的含義,就是將一個元素與另一元素“長在一起”。對象的集合到了符號可將其作為集合或組合來表示的程度,例如“物質(zhì)”。這引起了集合在語源學(xué)上作為“集合在一起”的含義。
與表達(dá)符和解釋符之間的連續(xù)統(tǒng)區(qū)域中的元,使用分析的直接-動態(tài)-最終來設(shè)定R-I。然而,在此,還依據(jù)解釋符是視作發(fā)生,還是視作連續(xù)發(fā)生,就是說是作為離散的影響或作為活動流(在此有時稱為“過程”)的分享,進(jìn)一步作兩步劃分。我們用I’作為正在發(fā)生的解釋符,用I”作為連續(xù)的解釋符,并且再次針對直接、動態(tài)和最終使用下標(biāo)i、d和f。
IV.R-I’sub i關(guān)于其直接發(fā)生的解釋符的表達(dá)符,就是說在其含義的最初一瞥和一瞬間。在該元中,解釋符(在Peirce術(shù)語中)可以是依據(jù)其“可能是”、“是”或某些范圍中的“是……的跡象”分為假定的、分類的、相關(guān)的。
V.R-I’sub d關(guān)于其動態(tài)發(fā)生的解釋符的表達(dá)符,就是其影響或產(chǎn)生其他符號的解釋符。在該元中,解釋符可以是和諧的、有震動力的/令人震驚的、通常的/習(xí)慣的。
VI.R-I’sub f當(dāng)處于其最終范疇或區(qū)域或影響中時,表達(dá)符將表示什么。在該元中的第一價中,發(fā)生的最終解釋符可以僅僅是記號或術(shù)語,或者更常見的是Peirce的來自希臘的術(shù)語學(xué)的“seme”;例如,在其最直接的符號意義下的“理論”。在第二價中,當(dāng)發(fā)生的最終解釋符可以是命題或更常見的希臘語中用于確認(rèn)或斷言的“pheme”;例如,其命題要點(diǎn)中的“相對論”。在第三價中,發(fā)生的最終解釋符可能是中項(xiàng)或更常見的希臘語中用于了解、示出或解釋的“delome”;例如在其說明要點(diǎn)中的“E=mc2”。
VII.R-I”sub i關(guān)于其直接解釋符的活動流或過程的表達(dá)符,就是作為其從解釋活動中接收的確信。在該元中,解釋符是本能的、經(jīng)驗(yàn)上的、正式的。
VIII.R-I”sub d關(guān)于其動態(tài)解釋符的過程的表達(dá)符,就是作為其要求或成為某些正在活動解釋的部分。在該元中,解釋符可以是建議性、強(qiáng)制性的/質(zhì)疑的、表示的。
IX.R-I”sub f關(guān)于其最后目標(biāo)的表達(dá)符,就是按照其通向的目標(biāo)。在該元中,解釋符的模式可以是情緒的(導(dǎo)致激動),積極的(導(dǎo)致動作)、邏輯的(導(dǎo)致理解和關(guān)于動作、自我控制)。
X.最終,我們可以考慮符號自身,而不需要關(guān)注其與對象或解釋符的關(guān)系。在該元中,相關(guān)符號元素包括音調(diào)-標(biāo)志-類型或更常見的在Peirce的新詞語中為qualisign、sinsign或legisign。音調(diào)是符號強(qiáng)度的模式。標(biāo)志是其特殊性的模式。類型是其通用性的模式。注意到使用其他元中其他解釋符的符號元素來進(jìn)一步區(qū)分“音調(diào)”是有益的;例如,從元V的和諧的-有震動力的-通常的、從元VII-價1的本能的、從元VIII-價1的建議的、從元IX-價1的激動的。
總之,下面列出10個元以及每個元中的3個符號元素。符號元素隨同對應(yīng)的參考號碼(1、2或3),它們在此稱為價數(shù),在下示出。
元I.R-O sub i(1)描述性、(2)名稱和(3)分配性;元II.R-O sub d(1)圖標(biāo)、(2)索引和(3)符號;元III.R-O sub f(1)抽象、(2)凝結(jié)性和(3)集合;元IV.R-I’sub i(1)假設(shè)、(2)類別和(3)相關(guān)性;元V.R-I’sub d(1)和諧、(2)有震動力和(3)通常的;元VI.R-I’sub f(1)術(shù)語、(2)命題和(3)中項(xiàng);元VII.R-I”sub i(1)本能、(2)實(shí)驗(yàn)性和(3)正式;元VIII.R-I”sub d(1)建議、(2)強(qiáng)制性和(3)指示性;元IX.R-I”sub f(1)情緒、(2)積極和(3)邏輯;元X.R-R(1)音調(diào)、(2)標(biāo)志和(3)類型。
現(xiàn)在可以認(rèn)識到本發(fā)明具有擴(kuò)展符號關(guān)系學(xué)(術(shù)語“符號關(guān)系學(xué)”用于意指符號之間的關(guān)系,不涉及它們的含義和對象)。不同于傳統(tǒng)對“符號關(guān)系學(xué)”的定義,本發(fā)明的符號關(guān)系學(xué)并不局限于元X中的關(guān)系,自身中考慮的符號,但還可以包括其他元中的其他符號元素,例如,分配性、符號的、集合、相對性、通常、delomic/中項(xiàng)、正式性、指示性和邏輯性以及其他可選元中其他價的符號元素,例如,元II中圖標(biāo)可以具有相對于圖解推理的任何討論的語法相關(guān)性。
每個符號元素可以分解成更細(xì)分的子元素。這樣,將“圖標(biāo)”符號元素作為實(shí)例,我們可以從符號圖標(biāo)中區(qū)分出索引圖標(biāo)。在不用將標(biāo)簽附加給顆粒再細(xì)分的情況下,在“Of”元的“集合”符號元素中的顆粒性在圖2中描述為“1.”、“2.”和“3.”。每個數(shù)字下標(biāo)能進(jìn)一步細(xì)分成圖2中描述的價如“a.”、“b.”和“c.”。如圖2中所建議,細(xì)分的過程可以繼續(xù)(即“i”、“ii”和“iii”),并且可以用于細(xì)分一個或多個元中的符號元素和子元素?,F(xiàn)在可以理解元的豐富性直接與該元中的符號元素和子元素的數(shù)目成正比。
一種利用10元指示符組的系統(tǒng)包括用于數(shù)據(jù)庫20的關(guān)系數(shù)據(jù)庫,它可以由計算機(jī)10檢索。關(guān)系數(shù)據(jù)庫將一媒體段與從可能描述符列表中選擇出的一個或多個描述符關(guān)聯(lián)。例如,如果描述符包括10個元,并且每個元具有3個符號元素,就需要30種不同的描述符。每個可能的元/符號元素對具有一個描述符。例如,一個媒體段可以包括一個單詞或?qū)τ陉P(guān)聯(lián)一個或多個描述符識別的一組詞。隨后,將媒體段中經(jīng)識別的詞與32位矢量關(guān)聯(lián)。對應(yīng)于要與識別詞關(guān)聯(lián)的描述符的位被打開,例如通過將位從0變成1。隨后,當(dāng)表達(dá)檢索查詢,使得經(jīng)識別的詞和對應(yīng)于打開的記號一起出現(xiàn)在檢索查詢中,為了將其識別為與查詢特定關(guān)聯(lián),就給予該媒體段額外的權(quán)重。
在上述實(shí)例中,每個矢量保留30位,一個位用于每個可能的描述符,留下兩個位用于其他目的。剩下的兩個位可以作為有關(guān)識別字信號信息的通配符,它們沒有由30個可能的描述符給出。例如,兩個剩余位可以作為給定元中更加細(xì)分的觸發(fā)。
符號元和它們的符號元素以及價與媒體類型、語言和媒體內(nèi)容無關(guān)。因此,符號元可以跨異種格式和域應(yīng)用。
作為對于格式文本如何實(shí)現(xiàn)本發(fā)明的一個實(shí)例,可以將標(biāo)準(zhǔn)的HTML和XML標(biāo)簽作為描述符以提供有關(guān)文本文檔的信息。例如,斜體、粗體、對中、下劃線和標(biāo)題的HTML標(biāo)簽都可依靠示出的強(qiáng)調(diào)或強(qiáng)度映射為元X的“音調(diào)”,并用于使搜索引擎的標(biāo)準(zhǔn)加權(quán)技術(shù)充實(shí)??梢源_信,這種使用HTML標(biāo)簽(通過例如字位置增加)的本發(fā)明應(yīng)用將在正確識別文檔方面產(chǎn)生實(shí)質(zhì)的改進(jìn)。
同樣,用于插入圖片和圖形的HTML標(biāo)簽可以符號化識別為如元II中的“圖標(biāo)”。HTML超文本指針可以符號化識別為如元II中的“索引”和元IX中的“積極”。XML通配符可以符號化識別為元X中的“類型”和元I中的“分配”。在元X中,如果在檢索查詢中指定,可共存識別為音調(diào)、標(biāo)志(默認(rèn))和類型的輸入顯然比沒有這種識別符的相同輸入具有更高的權(quán)重。當(dāng)將標(biāo)點(diǎn)和英語正字法看作標(biāo)注語言時,使用正字法作為自動符號指示符屬性的觸發(fā),就可能進(jìn)一步進(jìn)行自動語法分析并映射到10-元系統(tǒng)中。當(dāng)然,并不是媒體段中的所有數(shù)據(jù)都需要與描述符關(guān)聯(lián),并且也不是所有的符號元都要激活。注意,雖然,這些實(shí)例主要針對文本,但同樣的應(yīng)用原理也可應(yīng)用在其他媒體和跨媒體應(yīng)用。
本發(fā)明不僅使有關(guān)媒體的信息分層,而且可以結(jié)合更完善更經(jīng)濟(jì)的學(xué)習(xí)和數(shù)據(jù)提取算法、邏輯運(yùn)算、模式識別以及其他操作使用,以便從檢索中收集更多信息。例如,通過考慮到通常結(jié)合哪種語言來表述概念,就能鑒別出一般規(guī)則。例如,可以找到單詞如何進(jìn)行邏輯組合或語法組合的這種規(guī)則,或這種規(guī)則著重于依據(jù)哪個描述符是“打開”,判定某個概念與特定媒體部分關(guān)聯(lián)的可能性。
本發(fā)明可以在新興的本體論構(gòu)造的學(xué)科中實(shí)現(xiàn),它通過提供自上層到下層術(shù)語的繼承關(guān)系所表征的類型層次,簡化了推論。這些繼承關(guān)系是可變的,范圍從更寬和更窄的Thesaurus術(shù)語到多樣繼承性、類似人工制品中實(shí)現(xiàn)第一級邏輯并作為部分有序集合構(gòu)造的格柵形關(guān)系。最完善的本體論通常局限于整體-部分和類-成員關(guān)系。本發(fā)明提供了一種方法,通過該方法可以充實(shí)本體論,以便區(qū)分使用例如元III、VI和IX的層次以區(qū)別它們應(yīng)用的各種含義和繼承以及對象。使用這3個元,就可使用用于所有本體論的9單元矩陣D-IIID-VI D-IX抽象 術(shù)語 情緒凝結(jié)性 命題 積極集合 中項(xiàng) 邏輯不考慮“情緒”解釋符(元-IX中的第一價的元素),通常不使用它,并且將元-VI作為元-III中最終對象和元-IX中的最終解釋符之間的關(guān)系連接符處理,我們就已經(jīng)具有跨3個元的2×3×3組合。隨后,通過考慮在元-III中集合一方和抽象與凝結(jié)一方之間的包含關(guān)系和共存性,我們可以形成各種規(guī)則以提供進(jìn)一步的推論。一種完成方法涉及使用元Vi中符號元素的一個或多個子元素。
本發(fā)明通過在復(fù)雜和異種數(shù)據(jù)庫中實(shí)現(xiàn)操作使得知識發(fā)現(xiàn)和推論簡化。例如,如果元IX中的最終連續(xù)解釋符為“積極”(導(dǎo)致動作),隱含關(guān)系的性質(zhì)與“邏輯”解釋符不同。例如,“making an omelet(做煎蛋)”以不同于食物“egg(蛋)”包括“omelet”作為較窄術(shù)語,或“egg(蛋)”隱含“chicken(小雞)”的不同方式限定“breaking an egg(打碎蛋)”,或反之亦然。本發(fā)明允許區(qū)分關(guān)系的分離和分層,并且允許經(jīng)濟(jì)地對這些關(guān)系處理。這樣,“making an omelet”和“breaking eggs”將用元IX-價2(積極)、元III-價2(凝結(jié)性)和元VI-價3(中項(xiàng))的指示符“on(打開)”進(jìn)行分析。在不具有這種區(qū)分本體論的能力時,存在非傳遞性異常,困擾人工制品混合不同類型的符號,并嘗試對它們執(zhí)行邏輯運(yùn)算。本發(fā)明系統(tǒng)地分割可用于單獨(dú)的符號以及它們之間的關(guān)系的整體信息空間,這些關(guān)系也允許作為符號解釋符進(jìn)行分析。
注意到在此描述的10元系統(tǒng)自身不是本體論或類型層次是有益的。雖然,符號元素是元X含義中的類型,而在它們作為位的示例中,它們還是標(biāo)志,它們可共存性意指在同一元中的符號元素中不需要有層次關(guān)系。然而,存在定理限制了它們可以共同出現(xiàn)的模式,如下將詳細(xì)描述。
本發(fā)明可以用于簡化代理協(xié)議。計算的代理是自主、協(xié)作、智能、限定協(xié)議的數(shù)據(jù)系統(tǒng),它能遵照自動察覺的信號以及來自用戶的直接信號行事。代理與數(shù)據(jù)相關(guān)字段、其他代理及其用戶進(jìn)行交互。代理的協(xié)議系統(tǒng)可以包括分析和映射引擎、機(jī)器學(xué)習(xí)算法以及搜索、檢索、推論、模式識別和知識發(fā)現(xiàn)能力。這種針對代理的應(yīng)用專注于本發(fā)明的解釋符元的所有范圍(元IV到元IX)。回想“解釋符”定義作為思路和類似思路的作用。當(dāng)代理為類似思路時,代理解釋符就是其響應(yīng)和適合的信號。例如,對于與其直接、動態(tài)和最終形式中的連續(xù)解釋符(R-I”)的表達(dá)符有關(guān)的元VII到IX的3個元,可以使用下述矩陣
VIIVIII IX本能的 建議性 情緒的經(jīng)驗(yàn)上的 強(qiáng)制性 積極的正式的 指示性 邏輯當(dāng)包含在代理通信協(xié)議中時,元VII元素響應(yīng)信號捕獲并提供代理學(xué)習(xí)模式。外界直接解釋符為“本能的”的信號可以依據(jù)固定的代理行為接受或拒絕。“經(jīng)驗(yàn)上”解釋符可以結(jié)合成基于事件的學(xué)習(xí)?!罢健苯忉尫麑⒔Y(jié)合成基于規(guī)則的學(xué)習(xí)。這些元所分成、細(xì)分成和進(jìn)一步細(xì)分成的程度允許學(xué)習(xí)連續(xù)統(tǒng)反映該代理響應(yīng)其環(huán)境或其他代理的用戶的輸入修改其知識和行為的適應(yīng)能力。
當(dāng)包含在代理通信協(xié)議中時,元VIII元素捕獲和提供代理信號接受的模式?!敖ㄗh性”信號要求沒有特征的可能行為?!皬?qiáng)制性/質(zhì)疑的”信號為代理提供一個命令,它也可能為查詢形式?!爸甘拘浴毙盘柼峁┝艘紤]的信息。較采用的劃分、細(xì)分和進(jìn)一步細(xì)分再次允許將這些模式匯合入連續(xù)統(tǒng)。
當(dāng)包含在代理通信協(xié)議中時,元IX元素捕獲和提供代理方向的模式,在“情緒”解釋符情況,導(dǎo)致感覺(對于計算的代理,“感覺”可以翻譯為在標(biāo)準(zhǔn)經(jīng)濟(jì)值量度之外的值),對“積極”解釋符為動作,以及對“邏輯”解釋符為理解。
本發(fā)明如何實(shí)現(xiàn)的另一示例是作為符號定理測試。自從Peirce的符號元素定理在1950年代通過不完整和有時不一致的版本可以公開獲得,已有不斷增加的研究工作來發(fā)展和精煉它,以提供正式的基礎(chǔ)數(shù)學(xué)驗(yàn)證,并將其與計算領(lǐng)域的新興工作關(guān)聯(lián)?,F(xiàn)在所缺少的是為此目的設(shè)計的實(shí)驗(yàn)試驗(yàn)臺。本發(fā)明的10元系統(tǒng)就提供了一種這樣的試驗(yàn)臺。它開辟了代數(shù)學(xué)的新領(lǐng)域,正式說明了關(guān)系和對符號元素的容許的計算操作。特別關(guān)注這種代數(shù)的細(xì)節(jié)將在理論上和經(jīng)驗(yàn)上測試有關(guān)吸引或排斥某些符號元素組合的符號價的作用的定理。
在理論階段,某些研究工作建議穩(wěn)定元-符號組合的實(shí)際數(shù)字,原則上為3的10次方或59,049種組合--可以限定到在100之下,66是最經(jīng)常引用的數(shù)字。參照Gary Sanders,“Peirce’s Sixty-six Signs?”,Charle S.PeirceSociety學(xué)報,Vol.VI,No.1,pp3-16。如何證明這種假設(shè)本身也在爭論中,因?yàn)樵摲栐卦跀?shù)學(xué)前沿。一旦符號元素和其計算實(shí)施例之間的關(guān)系建立,對應(yīng)的代數(shù)就作為符號研究的實(shí)驗(yàn)室更一般是符號組合學(xué)研究的實(shí)驗(yàn)室。本發(fā)明可能用于測試的定理,參閱Robert Marty,L’Algebre des signes,Amsterdam,1990。
在試驗(yàn)階段,由一些或所有元充實(shí)的數(shù)據(jù)可以用作訓(xùn)練基礎(chǔ)以產(chǎn)生改進(jìn)檢索信息的精度和調(diào)用的算法。這種數(shù)據(jù)也可以考慮用于規(guī)則和可能的關(guān)系,它們轉(zhuǎn)而可用模塊化加法管理。例如,代數(shù)可以產(chǎn)生正式定義和試驗(yàn)可測的本體論計算法,它們可以區(qū)分幾種表征不同參照本體論的繼承類型,規(guī)定有效存儲它們的規(guī)則,避免它們之間的混淆,并允許從上層人工制品到兼容符號元素的域本體論的傳遞推論。在整體理論階段,這種代數(shù)成為有關(guān)10元系統(tǒng)自身的定理測試臺。例如,已經(jīng)討論過某些元可以附屬于其他元以減少要考慮的有效元素數(shù)目,或者,含有排斥價的組合是不穩(wěn)定或不可能的。本發(fā)明允許對這些假設(shè)進(jìn)行測試實(shí)驗(yàn)。
雖然,本發(fā)明已經(jīng)相對于特定實(shí)施例進(jìn)行了描述,但應(yīng)該理解在不背離本發(fā)明的精神和范疇的情況下,可以得到本發(fā)明的其他實(shí)施例。因此,本發(fā)明僅由附加權(quán)利要求和其合理的解釋限定。
權(quán)利要求
1.一種符號分析系統(tǒng),其特征在于,所述系統(tǒng)包括具有軟件的計算機(jī),它能使得所述計算機(jī)接受查詢,并檢索數(shù)據(jù)庫尋找對應(yīng)于該查詢的數(shù)據(jù)庫中的項(xiàng);以及與所述計算機(jī)進(jìn)行通信的數(shù)據(jù)庫,該數(shù)據(jù)庫具有對應(yīng)于媒體段的項(xiàng),其中媒體段的一部分由指示該部分符號屬性的描述符識別,符號屬性具有元和元素,所述元和元素從具有至少兩個元的符號劃分中選出,其中所述元中的至少一個劃分成具有至少3個元素的組。
2.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述元是所述部分中的表達(dá)符和所述部分中的直接對象之間的關(guān)系。
3.如權(quán)利要求2所述的系統(tǒng),其特征在于,所述組包括描述、名稱和分配元素。
4.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述元是所述部分中的表達(dá)符和所述部分中的動態(tài)對象之間的關(guān)系。
5.如權(quán)利要求4所述的系統(tǒng),其特征在于,所述組包括圖標(biāo)、索引和符號元素。
6.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述元是所述部分中的表達(dá)符和所述部分中的對象存在的最終模式之間的關(guān)系。
7.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述組包括抽象、凝結(jié)和集合元素。
8.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述元是所述部分中的表達(dá)符和所述部分的直接發(fā)生的解釋符之間的關(guān)系。
9.如權(quán)利要求8所述的系統(tǒng),其特征在于,所述組包括假設(shè)、分類和相關(guān)元素。
10.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述元是所述部分中的表達(dá)符和所述部分的動態(tài)發(fā)生的解釋符之間的關(guān)系。
11.如權(quán)利要求10所述的系統(tǒng),其特征在于,所述組包括和諧、有震動力和通常的元素。
12.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述元是所述部分中的表達(dá)符和所述部分的最終發(fā)生解釋符之間的關(guān)系。
13.如權(quán)利要求12所述的系統(tǒng),其特征在于,所述組包括術(shù)語、命題和中項(xiàng)元素。
14.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述元是表達(dá)符和直接連續(xù)解釋符之間的關(guān)系。
15.如權(quán)利要求14所述的系統(tǒng),其特征在于,所述組包括本能、經(jīng)驗(yàn)上、正式元素。
16.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述元是所述部分中的表達(dá)符和動態(tài)連續(xù)解釋符之間的關(guān)系。
17.如權(quán)利要求16所述的系統(tǒng),其特征在于,所述組包括建議、強(qiáng)制、指示元素。
18.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述元是所述部分中的表達(dá)符和表達(dá)符的最終連續(xù)解釋符之間的關(guān)系。
19.如權(quán)利要求18所述的系統(tǒng),其特征在于,所述組包括情緒、積極和邏輯元素。
20.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述元是從其與對象和解釋符的關(guān)系中分離出的表達(dá)符。
21.如權(quán)利要求20所述的系統(tǒng),其特征在于,所述組包括音調(diào)、標(biāo)志和類型元素。
22.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述描述符與權(quán)重關(guān)聯(lián),以提供加權(quán)描述符,權(quán)重對應(yīng)于描述符指示媒體段的內(nèi)容的能力。
23.如權(quán)利要求22所述的系統(tǒng),其特征在于,所述權(quán)重用于提供媒體段相關(guān)性的指示。
24.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述查詢具有記號,并且所述軟件能使得計算機(jī)檢索數(shù)據(jù)庫查找對應(yīng)于該記號的描述符。
25.如權(quán)利要求24所述的系統(tǒng),其特征在于,所述記號與權(quán)重關(guān)聯(lián),以提供加權(quán)記號,權(quán)重對應(yīng)于記號指示查詢的內(nèi)容的能力。
26.如權(quán)利要求25所述的系統(tǒng),其特征在于,所述權(quán)重用于提供由搜索識別出的媒體段相關(guān)的指示。
27.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述元是從由直接、動態(tài)和最終構(gòu)成的組中選出。
28.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述元素中的至少一個具有3個子元素。
29.在其上具有媒體段的一種計算機(jī)可讀媒體,至少一個所述媒體段具有由描述符識別出的部分,描述符指示至少具有兩個元的符號劃分的一個元和元素,其中至少一個元進(jìn)一步分為具有至少3個元素的組。
30.如權(quán)利要求29所述的計算機(jī)可讀媒體,其特征在于,所述元是所述部分中的表達(dá)符和所述部分中的直接對象之間的關(guān)系。
31.如權(quán)利要求30所述的計算機(jī)可讀媒體,其特征在于,所述組包括描述、名稱和分配元素。
32.如權(quán)利要求29所述的計算機(jī)可讀媒體,其特征在于,所述元是所述部分中的表達(dá)符和所述部分中的動態(tài)對象之間的關(guān)系。
33.如權(quán)利要求32所述的計算機(jī)可讀媒體,其特征在于,所述組包括圖標(biāo)、索引和符號元素。
34.如權(quán)利要求29所述的計算機(jī)可讀媒體,其特征在于,所述元是所述部分中的表達(dá)符和所述部分中的對象的存在的模式之間的關(guān)系。
35.如權(quán)利要求34所述的計算機(jī)可讀媒體,其特征在于,所述組包括抽象、凝結(jié)和集合元素。
36.如權(quán)利要求29所述的計算機(jī)可讀媒體,其特征在于,所述元是所述部分中的表達(dá)符和所述表達(dá)符的直接發(fā)生的解釋符之間的關(guān)系。
37.如權(quán)利要求36所述的計算機(jī)可讀媒體,其特征在于,所述組包括假設(shè)、分類和相關(guān)元素。
38.如權(quán)利要求29所述的計算機(jī)可讀媒體,其特征在于,所述元是所述部分中的表達(dá)符和所述部分的動態(tài)發(fā)生的解釋符之間的關(guān)系。
39.如權(quán)利要求38所述的計算機(jī)可讀媒體,其特征在于,所述組包括和諧、有感動力和通常元素。
40.如權(quán)利要求29所述的計算機(jī)可讀媒體,其特征在于,所述元是所述部分中的表達(dá)符和所述部分的最終發(fā)生的解釋符之間的關(guān)系。
41.如權(quán)利要求40所述的計算機(jī)可讀媒體,其特征在于,所述組包括術(shù)語、命題和中項(xiàng)元素。
42.如權(quán)利要求29所述的計算機(jī)可讀媒體,其特征在于,所述元是表達(dá)符和直接連續(xù)解釋符之間的關(guān)系。
43.如權(quán)利要求42所述的計算機(jī)可讀媒體,其特征在于,所述組包括本能、經(jīng)驗(yàn)上、正式元素。
44.如權(quán)利要求29所述的計算機(jī)可讀媒體,其特征在于,所述元是所述部分中的表達(dá)符和動態(tài)連續(xù)解釋符之間的關(guān)系。
45.如權(quán)利要求44所述的計算機(jī)可讀媒體,其特征在于,所述組包括建議、強(qiáng)制、指示元素。
46.如權(quán)利要求29所述的計算機(jī)可讀媒體,其特征在于,所述元是所述部分中的表達(dá)符和表達(dá)符最終連續(xù)解釋符之間的關(guān)系。
47.如權(quán)利要求46所述的計算機(jī)可讀媒體,其特征在于,所述組包括情緒、積極和邏輯元素。
48.如權(quán)利要求29所述的計算機(jī)可讀媒體,其特征在于,所述元是從其與對象和解釋符的關(guān)系的分離中考慮的表達(dá)符。
49.如權(quán)利要求48所述的計算機(jī)可讀媒體,其特征在于,所述組包括音調(diào)、標(biāo)志和類型元素。
50.如權(quán)利要求29所述的計算機(jī)可讀媒體,其特征在于,所述描述符與權(quán)重關(guān)聯(lián),以提供加權(quán)描述符,權(quán)重對應(yīng)于描述符指示媒體段的內(nèi)容的能力。
51.如權(quán)利要求50所述的計算機(jī)可讀媒體,其特征在于,所述權(quán)重用于提供媒體段相關(guān)性的指示。
52.如權(quán)利要求29所述的計算機(jī)可讀媒體,其特征在于,所述元是從由直接、動態(tài)和最終構(gòu)成的組中選出。
53.如權(quán)利要求29所述的計算機(jī)可讀媒體,其特征在于,所述元素中的至少一個具有3個子元素。
54.一種識別相關(guān)媒體段的方法,其特征在于,所述方法包括提供具有對應(yīng)于媒體段一部分的描述符的數(shù)據(jù)庫,所述描述符指示具有一個元和元素的部分的符號特性,所述元和元素是從具有至少兩個元的符號劃分中選出,其中至少一個元分成了具有至少3個元素的組;提供具有指示查詢符號屬性的記號的查詢;搜索所述數(shù)據(jù)庫以判定該查詢是否匹配所述媒體段部分,并且判定所述記號是否匹配所述描述符;如果判定在所述查詢和媒體段部分之間存在匹配,就提供第一指示;以及如果判定在所述查詢和媒體段部分之間存在匹配,那么,如果判定在所述記號和描述符之間存在匹配,就提供第二指示。
55.如權(quán)利要求54所述的方法,其特征在于,所述第二指示具有高優(yōu)先權(quán)。
全文摘要
描述了一種符號分析系統(tǒng)、計算機(jī)可讀媒體以及方法。該系統(tǒng)具有計算機(jī)和與計算機(jī)通信的可檢索數(shù)據(jù)庫。該數(shù)據(jù)庫具有媒體段,其一部分與符號描述符關(guān)聯(lián)。計算機(jī)可讀媒體具有媒體段,這些媒體段中至少一個具有由符號描述符識別出的部分。該方法包括提供媒體段的數(shù)據(jù)庫,其一部分與符號描述符關(guān)聯(lián)。提供具有符號記號的查詢,并且該查詢用于檢索和獲得對應(yīng)于該查詢的可能相關(guān)媒體。
文檔編號G06F17/30GK1467658SQ0212614
公開日2004年1月14日 申請日期2002年7月10日 優(yōu)先權(quán)日2002年7月10日
發(fā)明者J·L·奧斯匹茲, K·斯托弗爾, J L 奧斯匹茲, 懈ザ 申請人:計算解析法和符號法實(shí)驗(yàn)室有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1