日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

使用查詢數(shù)據(jù)提供流行率信息的制作方法

文檔序號(hào):10694069閱讀:442來(lái)源:國(guó)知局
使用查詢數(shù)據(jù)提供流行率信息的制作方法
【專利摘要】在一個(gè)示例中,一種數(shù)據(jù)安全系統(tǒng)能夠基于針對(duì)對(duì)象(例如,文件或文件的散列)的查詢數(shù)據(jù)來(lái)確定文件流行率。一種示例性算法可以在存儲(chǔ)很少數(shù)據(jù)記錄的同時(shí)提供使用所述流行率的在統(tǒng)計(jì)上合理的估計(jì)值,并且因此可以以O(shè)(1)時(shí)間復(fù)雜度(即,恒定時(shí)間)來(lái)提供流行率信息。這種算法可以近實(shí)時(shí)地應(yīng)用于提供例如對(duì)所述文件流行率的查詢的立即響應(yīng)。
【專利說明】
使用查詢數(shù)據(jù)提供流行率信息
技術(shù)領(lǐng)域
[0001]所描述實(shí)施例總體上涉及計(jì)算機(jī)安全領(lǐng)域,并且更具體地,涉及使用查詢數(shù)據(jù)提供流行率(prevelance)信息。
【背景技術(shù)】
[0002]現(xiàn)代計(jì)算技術(shù)可以提供在全球分布的資源上維持大量數(shù)據(jù)的能力。某些分布式體系結(jié)構(gòu)允許對(duì)標(biāo)識(shí)大的分布式數(shù)據(jù)組(例如,金融市場(chǎng)分析師(analyst)、跟蹤藥物流行病學(xué)、數(shù)據(jù)安全系統(tǒng)等)的趨勢(shì)的請(qǐng)求作出響應(yīng)的能力。處理這種數(shù)據(jù)是具有挑戰(zhàn)性的。數(shù)據(jù)安全系統(tǒng)例如可以分析分布式數(shù)據(jù)以便標(biāo)識(shí)安全威脅并且向不同端點(diǎn)提供最新安全信息,所述端點(diǎn)各自可以遠(yuǎn)離所述系統(tǒng)定位。
【附圖說明】
[0003]結(jié)合附圖參考以下說明以便提供對(duì)本公開及其特征和優(yōu)點(diǎn)的更徹底的理解,其中,類似參考標(biāo)號(hào)表示類似部分,在附圖中:
[0004]圖1是展示根據(jù)本說明書一個(gè)或多個(gè)實(shí)施例的用于提供數(shù)據(jù)安全信息(包括信譽(yù)信息)的示例性系統(tǒng)的部件圖。
[0005]圖2是根據(jù)本說明書一個(gè)或多個(gè)實(shí)施例的信譽(yù)信息系統(tǒng)的方框圖。
[0006]圖3是展示根據(jù)本說明書一個(gè)或多個(gè)實(shí)施例的用于提供查詢數(shù)據(jù)的流行率信息的邏輯的流程圖。
[0007]圖4是根據(jù)本說明書一個(gè)或多個(gè)實(shí)施例的用于改變連續(xù)值數(shù)目而使查詢值與目標(biāo)值相匹配的概率分布的圖形表示。
[0008]圖5是示出匹配值數(shù)目與流行率信息之間的基于概率的示例性對(duì)應(yīng)性的圖表。
[0009]圖6A和圖6B描繪了展示根據(jù)本說明書一個(gè)或多個(gè)實(shí)施例的用于提供文件的散列的流行率信息的邏輯的流程圖。
[0010]圖7展示了根據(jù)本說明書實(shí)施例的對(duì)應(yīng)于三個(gè)設(shè)備的三個(gè)示例性位序列。
[0011 ]圖8是根據(jù)實(shí)施例的耦合到示例處理器上的存儲(chǔ)器的方框圖。
[0012]圖9是根據(jù)實(shí)施例的以點(diǎn)對(duì)點(diǎn)(PtP)配置安排的示例計(jì)算系統(tǒng)的方框圖。
【具體實(shí)施方式】
[0013]提供數(shù)據(jù)安全常常要求處理大量的數(shù)據(jù)。提供數(shù)據(jù)安全信息的系統(tǒng)可以接收對(duì)與一個(gè)或多個(gè)對(duì)象相關(guān)的安全信息的多個(gè)查詢(例如,在30天時(shí)間周期內(nèi)數(shù)百萬(wàn)或數(shù)十億)。對(duì)象可以是文件、散列值、文件的散列、或任何其他數(shù)據(jù)對(duì)象。所述系統(tǒng)可以響應(yīng)于所述多個(gè)查詢中的每一個(gè)而提供信譽(yù)分?jǐn)?shù)。信譽(yù)分?jǐn)?shù)反映出所查詢對(duì)象為惡意(例如,惡意軟件或被病毒感染的文件)的可能性。數(shù)據(jù)安全系統(tǒng)可以使用信譽(yù)分?jǐn)?shù)來(lái)確定行動(dòng)(例如,隔離所述文件、刪除所述文件、和/或停止利用所述文件的任何線程運(yùn)行)的過程。信譽(yù)分?jǐn)?shù)可以基于多個(gè)因素來(lái)確定。確定信譽(yù)分?jǐn)?shù)的因素可以包括:對(duì)象的內(nèi)容、針對(duì)對(duì)象的查詢數(shù)目、和/或?qū)ο蟮牧餍新?。每個(gè)因素可以用作信譽(yù)分?jǐn)?shù)的一個(gè)指示符。例如,流行率可以表示已經(jīng)向數(shù)據(jù)安全系統(tǒng)查詢對(duì)象的唯一設(shè)備的數(shù)目并且可以用于提供信譽(yù)分?jǐn)?shù)。類似地,針對(duì)對(duì)象的查詢數(shù)目可以用于提供信譽(yù)分?jǐn)?shù)。作為示例,服務(wù)器端多態(tài)惡意軟件具有非常低的流行率,因?yàn)橛煞?wù)器輸出的每個(gè)文件實(shí)例如果被散列的話則具有不同的散列值。因此,低流行率可能對(duì)應(yīng)于低信譽(yù)分?jǐn)?shù),而高流行率可能對(duì)應(yīng)于高信譽(yù)分?jǐn)?shù)。在示例中,一些對(duì)象是高度流行的并且已知是惡意的;在這種情況下,高流行率分?jǐn)?shù)可能并不對(duì)應(yīng)高信譽(yù)分?jǐn)?shù)。
[0014]實(shí)現(xiàn)提供信譽(yù)分?jǐn)?shù)的數(shù)據(jù)安全系統(tǒng)的挑戰(zhàn)并不是微不足道的。例如,所述系統(tǒng)可以包括一個(gè)或多個(gè)分布式部件(例如,分布在不同城市、州或國(guó)家的服務(wù)器)并且可以處理來(lái)自多個(gè)設(shè)備的查詢。每個(gè)設(shè)備可以是不同類型的設(shè)備(例如,不同操作系統(tǒng))并且遠(yuǎn)離數(shù)據(jù)安全系統(tǒng)。因此,實(shí)現(xiàn)這種系統(tǒng)可能要求進(jìn)行復(fù)雜的分布式處理以便基于多個(gè)因素提供信譽(yù)分?jǐn)?shù)。例如,通過對(duì)查詢文件的唯一設(shè)備的數(shù)目進(jìn)行計(jì)數(shù)來(lái)計(jì)算文件的流行率可能要求針對(duì)所述文件維持唯一設(shè)備的列表。考慮以下對(duì)唯一設(shè)備的數(shù)目進(jìn)行計(jì)數(shù)的挑戰(zhàn)的說明。假設(shè)設(shè)備的數(shù)目是在17的數(shù)量級(jí),文件的數(shù)目是在19的數(shù)量級(jí),并且國(guó)家的數(shù)目是在12的數(shù)量級(jí),那么所述系統(tǒng)可能要處理數(shù)據(jù)記錄的118個(gè)條目(例如,查詢數(shù)據(jù)庫(kù)記錄、或數(shù)據(jù)庫(kù))來(lái)對(duì)唯一設(shè)備的數(shù)目進(jìn)行計(jì)數(shù)。因此,對(duì)唯一設(shè)備的數(shù)目進(jìn)行計(jì)數(shù)可能要求強(qiáng)大的處理和存儲(chǔ)能力,以便計(jì)算、存儲(chǔ)和查詢必要的數(shù)據(jù)。此外,首次報(bào)告文件的每個(gè)設(shè)備可能要求全局態(tài)變化(例如,計(jì)數(shù)的增量),這潛在地造成高數(shù)據(jù)波動(dòng)率。另外,對(duì)設(shè)備的數(shù)目進(jìn)行計(jì)數(shù)的過程可能具有為0(n)的時(shí)間復(fù)雜度。
[0015]以下公開內(nèi)容提供了用于實(shí)現(xiàn)本公開的不同特征的許多不同實(shí)施例或示例。以下描述部件和安排的具體示例以便簡(jiǎn)化本公開。當(dāng)然,這些僅是示例并且并不旨在是限制性的。另外,本公開在不同示例中可以重復(fù)參考標(biāo)號(hào)和/或字母。這種重復(fù)是出于簡(jiǎn)明性和清楚性的目的,并且本身并不決定所描述的不同實(shí)施例和/或配置之間的關(guān)系。
使用查詢數(shù)據(jù)的流行率信息
[0016]通過使用查詢數(shù)據(jù)確定流行率信息或查詢數(shù)目的基于統(tǒng)計(jì)學(xué)的估計(jì)值來(lái)提供數(shù)據(jù)安全信息的系統(tǒng)可以要求較小的計(jì)算和存儲(chǔ)能力并且增強(qiáng)所述系統(tǒng)的響應(yīng)性。有利地,這提供了流行率在數(shù)學(xué)上合理的估計(jì)值,并且可以在接收到查詢的時(shí)候(即,在查詢時(shí)間、實(shí)時(shí)地、或近實(shí)時(shí)地)得到確定,從而避免由于處理大數(shù)目的數(shù)據(jù)記錄所造成的長(zhǎng)的延遲。
[0017]圖1是展示根據(jù)本說明書一個(gè)或多個(gè)實(shí)施例的用于提供數(shù)據(jù)安全信息(包括信譽(yù)信息)的示例性系統(tǒng)的部件圖。在這個(gè)示例中,安全信息系統(tǒng)100包括安全服務(wù)器102、信譽(yù)信息系統(tǒng)104、通信網(wǎng)絡(luò)106、以及通信設(shè)備108。通信設(shè)備108經(jīng)由通信網(wǎng)絡(luò)106向安全服務(wù)器102發(fā)射數(shù)據(jù)和/或從其接收數(shù)據(jù)。
[0018]通信設(shè)備108各自可以經(jīng)由通信網(wǎng)絡(luò)106向安全服務(wù)器102提交對(duì)與對(duì)象相關(guān)的安全信息的查詢(例如,查詢數(shù)據(jù))。安全信息可以包括例如:信譽(yù)分?jǐn)?shù)、流行率分?jǐn)?shù)、查詢數(shù)目、和/或已經(jīng)進(jìn)行查詢的唯一設(shè)備的數(shù)目。在一種實(shí)現(xiàn)方式中,通信設(shè)備108可以基于用戶對(duì)查詢文件的選擇而生成請(qǐng)求所述文件的流行率分?jǐn)?shù)的查詢數(shù)據(jù)。可替代地,作為數(shù)據(jù)掃描程序的部分,在通信設(shè)備108上執(zhí)行的應(yīng)用可以生成查詢數(shù)據(jù)。在一種實(shí)現(xiàn)方式中,通信設(shè)備108可以包括以下各項(xiàng)中的至少一項(xiàng):計(jì)算設(shè)備、有線或無(wú)線通信設(shè)備、移動(dòng)電話、臺(tái)式計(jì)算機(jī)、或可以提供對(duì)安全信息的查詢的任何其他通信設(shè)備。
[0019]安全服務(wù)器102可以被配置成用于至少部分地基于信譽(yù)信息系統(tǒng)104的針對(duì)對(duì)象的輸出向通信設(shè)備108提供所述對(duì)象的數(shù)據(jù)安全信息。響應(yīng)于接收來(lái)自通信設(shè)備108的查詢數(shù)據(jù),安全服務(wù)器102可以處理查詢數(shù)據(jù)和/或向信譽(yù)信息系統(tǒng)104提供查詢數(shù)據(jù)以便進(jìn)行處理。在處理數(shù)據(jù)之后,安全服務(wù)器102可以向通信設(shè)備108發(fā)射含有與對(duì)象相關(guān)的安全信息的響應(yīng)。所述響應(yīng)可以包括:對(duì)象是否是惡意的、指示的置信水平、信譽(yù)分?jǐn)?shù)、流行率、查詢數(shù)目、已經(jīng)進(jìn)行查詢的唯一設(shè)備的數(shù)目、和/或其估計(jì)值。安全服務(wù)器102的示例性實(shí)現(xiàn)方式可以提供用于向通信設(shè)備108發(fā)射響應(yīng)的基于萬(wàn)維網(wǎng)的框架。
[0020]通信網(wǎng)絡(luò)106可以被配置成用于在安全服務(wù)器102與通信設(shè)備108之間傳輸數(shù)據(jù)。通信網(wǎng)絡(luò)106的示例性實(shí)現(xiàn)方式可以利用無(wú)線或有線技術(shù)(例如,局域網(wǎng)(LAN)、無(wú)線LAN、蜂窩網(wǎng)絡(luò)),并且可以支持不同的通信和/或安全協(xié)議(例如,互聯(lián)網(wǎng)協(xié)議(IP)、超文本傳輸協(xié)議(HTTP)、安全套接字層(SSL)、簡(jiǎn)單對(duì)象訪問協(xié)議(SOAP))。
[0021]為了清楚起見,圖1對(duì)于通信設(shè)備108、安全服務(wù)器102以及通信網(wǎng)絡(luò)106中的每一項(xiàng)描繪了特定數(shù)目。然而,在根據(jù)本說明書一個(gè)或多個(gè)實(shí)施例的系統(tǒng)中可以實(shí)現(xiàn)任何數(shù)目的服務(wù)器、設(shè)備以及網(wǎng)絡(luò)。此外,圖1所描繪的示例性信譽(yù)信息系統(tǒng)104示出了兩個(gè)部件104a和104b。然而,信譽(yù)信息系統(tǒng)104可以在一個(gè)位置(例如,單個(gè)設(shè)備)中實(shí)現(xiàn)或在多個(gè)位置中實(shí)現(xiàn)(例如,跨多個(gè)設(shè)備分布)。
[0022]圖2是根據(jù)本說明書一個(gè)或多個(gè)實(shí)施例的信譽(yù)信息系統(tǒng)的方框圖。如圖2所描繪的信譽(yù)信息系統(tǒng)104是如圖1所描繪的信譽(yù)信息系統(tǒng)104的示例性實(shí)現(xiàn)方式。在這個(gè)示例中,信譽(yù)信息系統(tǒng)104包括查詢系統(tǒng)202、數(shù)據(jù)存儲(chǔ)區(qū)(data store)208、數(shù)據(jù)挖掘系統(tǒng)210、查詢數(shù)據(jù)204、以及信譽(yù)數(shù)據(jù)206。查詢系統(tǒng)202、數(shù)據(jù)存儲(chǔ)區(qū)208以及數(shù)據(jù)挖掘系統(tǒng)210中的每一個(gè)彼此耦合以便允許所述系統(tǒng)與數(shù)據(jù)存儲(chǔ)區(qū)之間的雙向數(shù)據(jù)傳輸。
[0023]查詢系統(tǒng)202接收查詢數(shù)據(jù)204并且輸出信譽(yù)數(shù)據(jù)206。在一種實(shí)現(xiàn)方式中,查詢系統(tǒng)202可以使用不同途徑對(duì)新出現(xiàn)的威脅或眾所周知的威脅起反應(yīng)。新出現(xiàn)的威脅可以是具有低流行率和未知安全威脅水平的文件。眾所周知的威脅可以是具有高流行率和已知安全威脅水平的文件。對(duì)于新出現(xiàn)的威脅,例如,所述系統(tǒng)可以立即更新信譽(yù)分?jǐn)?shù)并向基于云的服務(wù)器發(fā)布更新的信譽(yù)分?jǐn)?shù)。然而,對(duì)于眾所周知的威脅,所述系統(tǒng)可以既不更新信譽(yù)分?jǐn)?shù)(例如,由于信譽(yù)是已知的并且可能是相對(duì)穩(wěn)定的)也不立即向基于云的服務(wù)器發(fā)布更新的信譽(yù)分?jǐn)?shù)。替代地,眾所周知的威脅的數(shù)據(jù)可以由數(shù)據(jù)挖掘系統(tǒng)210處理,并且稍后用于更新信譽(yù)分?jǐn)?shù)并向基于云的服務(wù)器發(fā)布更新的信譽(yù)分?jǐn)?shù)。處置方面的不同之處在于信譽(yù)被更新和/或分布的速度。對(duì)于低流行率文件,可能重要的是快速發(fā)布更新的估計(jì)值,因?yàn)橥{可能是快速進(jìn)化的(例如,多形惡意軟件)。對(duì)于高流行率文件,可能重要的是提供詳細(xì)分析和歷史上下文,以便確定例如惡意文件正在擴(kuò)散的方式以及惡意文件擴(kuò)散所用的機(jī)制。
[0024]在實(shí)施例中,查詢系統(tǒng)202可以使用至少一個(gè)處理器來(lái)實(shí)現(xiàn)用于提供流行率信息的邏輯。例如,查詢系統(tǒng)202可以實(shí)現(xiàn)如圖3所描繪的用于提供查詢數(shù)據(jù)的流行率信息的邏輯,和/或如圖6A和圖6B所描繪的用于提供文件的散列的流行率信息的邏輯。
[0025]查詢數(shù)據(jù)204封裝用于查詢信譽(yù)信息系統(tǒng)104的數(shù)據(jù)。在實(shí)施例中,查詢數(shù)據(jù)204可以包括以下各項(xiàng)中的至少一項(xiàng):與設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符、用于通信設(shè)備108的元數(shù)據(jù)、和/或與文件相關(guān)聯(lián)的標(biāo)識(shí)符。與設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符可以包括:設(shè)備標(biāo)識(shí)符、生成和/或提交查詢的設(shè)備的全球唯一隱式標(biāo)識(shí)符設(shè)備標(biāo)識(shí)符、設(shè)備標(biāo)識(shí)符的散列、設(shè)備上所存在的操作系統(tǒng)。用于通信設(shè)備108的元數(shù)據(jù)可以包括生成和/或提交查詢的設(shè)備的IP地址、設(shè)備所位于的國(guó)家、和/或其組合。與文件相關(guān)聯(lián)的標(biāo)識(shí)符可以包括:文件標(biāo)識(shí)符、經(jīng)受查詢的文件的全球唯一隱式標(biāo)識(shí)符、經(jīng)受查詢的文件的全球唯一隱式的散列、文件的至少一部分內(nèi)容的散列、文件的全部?jī)?nèi)容的整體的的散列、文件的統(tǒng)一資源定位符(URL)、和/或其任意組合。
[0026]信譽(yù)數(shù)據(jù)206封裝用于提供信譽(yù)信息的數(shù)據(jù),在一種實(shí)現(xiàn)方式中,信譽(yù)數(shù)據(jù)206可以包括估計(jì)響應(yīng)和精確響應(yīng)中的至少一項(xiàng)。例如,信譽(yù)數(shù)據(jù)206可以包括已經(jīng)查詢對(duì)象的唯一設(shè)備的估計(jì)數(shù)目或精確數(shù)目或所接收的針對(duì)對(duì)象的查詢的估計(jì)數(shù)目或精確數(shù)目(例如,不管查詢?cè)O(shè)備)。
[0027]數(shù)據(jù)存儲(chǔ)區(qū)208可以被配置成用于存儲(chǔ)從通信設(shè)備108、數(shù)據(jù)挖掘系統(tǒng)210或查詢系統(tǒng)202接收的數(shù)據(jù)。存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)208中的數(shù)據(jù)可以包括查詢數(shù)據(jù)204、信譽(yù)數(shù)據(jù)206、或與信譽(yù)或安全相關(guān)的其他數(shù)據(jù)。在一種示例性實(shí)現(xiàn)方式中,數(shù)據(jù)存儲(chǔ)區(qū)208可以包括以下各項(xiàng)中的至少一項(xiàng):關(guān)系數(shù)據(jù)庫(kù)、大規(guī)模并行處理(MPP)數(shù)據(jù)庫(kù)、結(jié)構(gòu)查詢語(yǔ)言(SQL)數(shù)據(jù)庫(kù)(例如,CSR/數(shù)據(jù)庫(kù)實(shí)例)、NoSQL數(shù)據(jù)庫(kù)、MongoDB、和/SHadoop。
[0028]數(shù)據(jù)挖掘系統(tǒng)210可以被配置成用于訪問數(shù)據(jù)存儲(chǔ)區(qū)208、查詢系統(tǒng)202、查詢數(shù)據(jù)204和/或信譽(yù)數(shù)據(jù)206。在一種實(shí)現(xiàn)方式中,數(shù)據(jù)挖掘系統(tǒng)210可以利用以下各項(xiàng)中的至少一項(xiàng):統(tǒng)計(jì)分析、集群、分類、機(jī)器學(xué)習(xí)、MapReduce、和/或回歸。
用于基于查詢數(shù)目估計(jì)流行率的統(tǒng)計(jì)模型
[0029]對(duì)象的流行率可以基于所接收的針對(duì)對(duì)象的查詢數(shù)目來(lái)估計(jì)。因此,系統(tǒng)已經(jīng)接收的針對(duì)對(duì)象的查詢數(shù)目的估計(jì)值可以用作對(duì)象的流行率的估計(jì)值。用于基于查詢數(shù)目估計(jì)流行率的統(tǒng)計(jì)模型可以將針對(duì)對(duì)象(例如,文件、文件的散列等)文件的查詢表示為投擲η面骰子的結(jié)果,其中,每個(gè)“面”具有成為投擲結(jié)果的相等概率。如以上所討論,η的值用作已經(jīng)接收的針對(duì)對(duì)象的查詢數(shù)目的估計(jì)值。投擲η面骰子的結(jié)果可以是查詢值。骰子的目標(biāo)值可以是整數(shù)值,其中,O〈目標(biāo)值Sn。在這個(gè)示例中,查詢值匹配目標(biāo)值的可能性與骰子已經(jīng)被投擲η次數(shù)關(guān)聯(lián)。換言之,如果骰子的結(jié)果匹配目標(biāo)值,那么可以估計(jì)出骰子已經(jīng)被投擲了 η次數(shù)。由于骰子的投擲表示查詢,骰子已經(jīng)被投擲了 η次數(shù)的估計(jì)值對(duì)應(yīng)于已經(jīng)接收了 η個(gè)針對(duì)對(duì)象的查詢的估計(jì)值。因此,所述模型可以基于針對(duì)對(duì)象的查詢數(shù)目的數(shù)學(xué)上合理的估計(jì)值提供流行率的估計(jì)值。
[0030]由于所接收的對(duì)每個(gè)對(duì)象的查詢數(shù)目在文件之間可以是不同的,所述模型可以單獨(dú)地應(yīng)用于每個(gè)對(duì)象。在已經(jīng)接收了針對(duì)對(duì)象的查詢之前,針對(duì)對(duì)象的查詢數(shù)目是已知的;它等于零。從這個(gè)初始點(diǎn)開始,可以選擇η的值來(lái)標(biāo)識(shí)所考慮的目標(biāo)值。如果例如,η的值被增量地設(shè)定成表示數(shù)量級(jí)(例如,I; 10; 100; I,000;10,000; 100,000;等)的值,那么所述模型可以提供已經(jīng)查詢對(duì)象的設(shè)備的數(shù)目數(shù)量級(jí)的估計(jì)值。作為另一示例,η的值和目標(biāo)值都可以被設(shè)定成10。每次“投擲”骰子時(shí),將結(jié)果(S卩,查詢值)與目標(biāo)值進(jìn)行比較。在一種實(shí)現(xiàn)方式中,隨機(jī)數(shù)生成器(RNG)可以生成值以便表示投擲η面骰子的結(jié)果。如果結(jié)果匹配目標(biāo)值,可以將η的值記錄為針對(duì)對(duì)象的查詢數(shù)目的估計(jì)值。在記錄了估計(jì)值之后,可以使η的值增加到所考慮的下一個(gè)數(shù)目(例如,下一個(gè)數(shù)量級(jí),在這個(gè)示例中,從10增加到100)。例如,如果已經(jīng)接收到4個(gè)查詢,那么數(shù)量級(jí)可以是I;如果已經(jīng)接收到354,001個(gè)查詢,那么數(shù)量級(jí)可以是100,000。在一種實(shí)現(xiàn)方式中,在結(jié)果匹配目標(biāo)值之后,可以增加目標(biāo)值以匹配η的值,保持相同的值,或可以向目標(biāo)值分派大于零且小于或等于η的新的值。針對(duì)每個(gè)對(duì)象,可以單獨(dú)存儲(chǔ)估計(jì)值、查詢值、目標(biāo)值中的每一項(xiàng)的值、和/或η的值。
[0031]圖3是展示根據(jù)本說明書一個(gè)或多個(gè)實(shí)施例的用于提供查詢數(shù)據(jù)的流行率信息的邏輯的流程圖。圖3中的邏輯是用于基于查詢數(shù)目估計(jì)流行率的統(tǒng)計(jì)模型的實(shí)現(xiàn)方式。在這個(gè)示例中,邏輯300包括:起點(diǎn)302,檢索至少一個(gè)目標(biāo)值304,從設(shè)備接收查詢數(shù)據(jù)306,響應(yīng)于接收查詢數(shù)據(jù)而生成至少一個(gè)查詢值308,將至少一個(gè)查詢值與至少一個(gè)目標(biāo)值進(jìn)行比較310,基于比較輸出查詢數(shù)據(jù)的流行率312,以及終點(diǎn)314。
[0032]邏輯300從起點(diǎn)302開始。起點(diǎn)302可以與其他邏輯、例程、應(yīng)用或線程的起點(diǎn)/終點(diǎn)重合。此外,在起點(diǎn)302處,可以對(duì)數(shù)據(jù)(例如,對(duì)象、值、變量等)進(jìn)行初始化、檢索、或訪問,以供在邏輯300中使用。
[0033]接著,在程序304處,檢索至少一個(gè)目標(biāo)值。所述至少一個(gè)目標(biāo)值可以被實(shí)現(xiàn)為單個(gè)值、值序列、位序列、與設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符、查詢文件的第一設(shè)備的標(biāo)識(shí)符、或可以與每個(gè)查詢的其他值(例如,查詢值)進(jìn)行比較的任何值。目標(biāo)值可以是從數(shù)據(jù)源(例如,數(shù)據(jù)源208)檢索的或可以是生成的。例如,目標(biāo)值可以是基于與設(shè)備相關(guān)聯(lián)的設(shè)備標(biāo)識(shí)符生成的位序列或η面骰子的值,如以上相對(duì)于統(tǒng)計(jì)模型所描述的。
[0034]在程序306處,從設(shè)備(例如,通信設(shè)備108)接收查詢數(shù)據(jù)(例如,查詢數(shù)據(jù)204)。例如,可以從通信設(shè)備接收文件和對(duì)文件的流行率的請(qǐng)求。
[0035]根據(jù)程序308,響應(yīng)于接收查詢數(shù)據(jù)而生成至少一個(gè)查詢值。在一種實(shí)現(xiàn)方式中,查詢值可以是與設(shè)備(即,查詢?cè)O(shè)備)相關(guān)聯(lián)的標(biāo)識(shí)符、隨機(jī)生成的數(shù)目、與設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符的散列、或可以與每個(gè)查詢的其他值(例如,目標(biāo)值)進(jìn)行比較的任何值。
[0036]在程序310處,將至少一個(gè)查詢值與至少一個(gè)目標(biāo)值進(jìn)行比較。為了便于比較,可以用相同方式來(lái)實(shí)現(xiàn)目標(biāo)值和查詢值(例如,目標(biāo)值和查詢值中的每一個(gè)是位序列,每一個(gè)都是整數(shù)值等)。所述比較可以包括通過以下方式來(lái)對(duì)值進(jìn)行比較:確定哪一個(gè)是較大值/較小值,確定值是否相等,對(duì)值執(zhí)行成對(duì)比較,和/或確定值是否呈相同格式。所述格式可以包括例如:編碼類型、用于產(chǎn)生序列的散列類型、和/或位序列的長(zhǎng)度。比較的結(jié)果可以作為流行率值(例如,作為其估計(jì)值)直接輸出,或可以用作其他計(jì)算的基礎(chǔ)。例如,所述結(jié)果可以被輸入到模型(諸如統(tǒng)計(jì)模型和/或模擬),以便確定查詢數(shù)據(jù)的流行率。
[0037]在程序312處,輸出(查詢數(shù)據(jù)的流行率。流行率可以包括流行率值、所估計(jì)查詢數(shù)目、已經(jīng)查詢對(duì)象的唯一設(shè)備的所估計(jì)數(shù)目等。流行率可以基于比較查詢值和目標(biāo)值的結(jié)果來(lái)計(jì)算。例如,流行率值可以從信譽(yù)信息系統(tǒng)向提交查詢數(shù)據(jù)的設(shè)備輸出。在一種實(shí)現(xiàn)方式中,可以從第一設(shè)備接收查詢數(shù)據(jù)并且可以將相應(yīng)信譽(yù)信息提供給第二設(shè)備、或多個(gè)設(shè)備。
[0038]最后,在終點(diǎn)314處,所述邏輯結(jié)束。終點(diǎn)314可以用作其他邏輯、例程、應(yīng)用或線程的起點(diǎn)/終點(diǎn)。例如,終點(diǎn)314可以在接收到隨后的查詢時(shí)指揮處理器執(zhí)行從起點(diǎn)302開始的邏輯。
用于基于唯一設(shè)備的數(shù)目估計(jì)流行率的統(tǒng)計(jì)模型
[0039]對(duì)象的流行率可以基于已經(jīng)提交針對(duì)對(duì)象的查詢的唯一設(shè)備的數(shù)目來(lái)估計(jì)。因此,已經(jīng)提交針對(duì)對(duì)象的查詢的唯一設(shè)備的數(shù)目的估計(jì)值可以用作對(duì)象的流行率的估計(jì)值。用于基于唯一設(shè)備的數(shù)目估計(jì)流行率的統(tǒng)計(jì)模型可以將查詢?cè)O(shè)備表示為具有位的隨機(jī)分布的二進(jìn)制數(shù)。例如,散列函數(shù)可以應(yīng)用于與查詢?cè)O(shè)備相關(guān)聯(lián)的唯一標(biāo)識(shí)符(例如,設(shè)備ID),以便生成具有位的隨機(jī)(或偽隨機(jī))分布的位序列。在一種實(shí)現(xiàn)方式中,散列函數(shù)可以是若干眾所周知的散列算法之一。例如,散列函數(shù)可以是消息摘要算法5(MD5)、安全散列算法1(SHA1)、和/或安全散列算法(SHA256)之一。二進(jìn)制數(shù)可以是查詢值。當(dāng)從設(shè)備接收到針對(duì)對(duì)象的第一查詢時(shí),生成所述設(shè)備的查詢值(即,具有位的隨機(jī)分布的二進(jìn)制數(shù))并將其存儲(chǔ)作為目標(biāo)值。對(duì)于來(lái)自第一設(shè)備之外的設(shè)備的每一個(gè)隨后的查詢,將傳入查詢的查詢值與第一設(shè)備的查詢值(即,目標(biāo)值)進(jìn)行比較,以便從序列中的第一位開始確定連續(xù)匹配位的數(shù)目。僅在匹配位數(shù)目大于最大匹配位數(shù)目(n_max)的情況下,才可以對(duì)匹配位數(shù)目進(jìn)行存儲(chǔ)。最大匹配位數(shù)目(n_max)表示針對(duì)對(duì)象所觀察到的最多匹配位數(shù)目。高匹配位數(shù)目的可能性與已經(jīng)查詢對(duì)象的唯一設(shè)備的高數(shù)目的可能性關(guān)聯(lián)。換言之,增長(zhǎng)的最大匹配位數(shù)目與已經(jīng)查詢對(duì)象的唯一設(shè)備的較高數(shù)目的增長(zhǎng)的可能性關(guān)聯(lián)。因此,所述模型基于已經(jīng)查詢對(duì)象的唯一設(shè)備的數(shù)目在數(shù)學(xué)上合理的估計(jì)值提供流行率的估計(jì)值。
[0040]在這個(gè)模型中,來(lái)自同一設(shè)備對(duì)同一文件的重復(fù)查詢對(duì)已經(jīng)查詢對(duì)象的唯一設(shè)備的數(shù)目的估計(jì)值無(wú)影響。以下是情況就是這樣的簡(jiǎn)單證明:
(1)來(lái)自針對(duì)其與第一設(shè)備匹配的位的數(shù)目(n_i)大于當(dāng)前最大匹配位數(shù)目(n_max)的設(shè)備的任何傳入查詢導(dǎo)致n_max采取n_i的值。如果設(shè)備提交另一個(gè)對(duì)同一文件的查詢,n_i必定小于或等于n_max,因此隨后的查詢對(duì)n_max值將無(wú)影響。
(2)來(lái)自針對(duì)其與第一設(shè)備匹配的位的數(shù)目(n_i)小于或等于當(dāng)前最大匹配位數(shù)目(n_max)的設(shè)備的任何傳入查詢并不使n_max改變。如果設(shè)備提交隨后的對(duì)同一文件的查詢,n_i必定小于或等于n_max,因此隨后的查詢對(duì)n_max值將無(wú)影響。
[0041]所述模型的統(tǒng)計(jì)特性可以至少部分地基于二進(jìn)制數(shù)的長(zhǎng)度(S卩,位序列的長(zhǎng)度、或N)來(lái)得到。對(duì)于給定長(zhǎng)度的位序列,唯一位序列的數(shù)目是有限的并且由(2N-1)限定。唯一位序列的數(shù)目表示所述模型針對(duì)N的值可以表示的唯一設(shè)備的數(shù)目。此外,所述數(shù)目的唯一設(shè)備可以被排序的方式的數(shù)目是有限的并且由((2N-1)!)限定。所述數(shù)目的設(shè)備可以被排序的方式的數(shù)目表示所述設(shè)備可以查詢對(duì)象的方式(即,查詢?cè)O(shè)備的次序)的數(shù)目。因此,對(duì)于任何所希望的連續(xù)匹配位數(shù)目(n_match),其中,0〈n_match<N,有可能生成第x個(gè)針對(duì)對(duì)象的查詢導(dǎo)致連續(xù)匹配位數(shù)目等于njnatch的概率的有限概率分布。
[0042]作為說明,白球數(shù)目(n_white)可以表示對(duì)于其連續(xù)匹配位數(shù)目等于n_match的設(shè)備的數(shù)目;黑球數(shù)目(n_black)可以表示所有其他設(shè)備(S卩,針對(duì)其連續(xù)匹配位數(shù)目不等于n_match的設(shè)備)的數(shù)目。所述模型對(duì)應(yīng)于包括所述數(shù)目的白球和所述數(shù)目的黑球的袋子。所述袋子中的球的總數(shù)(total)表示由所述模型表示的唯一設(shè)備的總數(shù)(例如,唯一位序列的數(shù)目)。因此,從所述袋子中抽出的第X個(gè)球是白色的概率(即,PU))從所述袋子中抽出的第X個(gè)球是白色的概率(即,PU))可以如下表示:
[0043]total = (2N-1)
[0044]n_whi te = ((2'(N-n_match))-1)
[0045]n_black = total_n_white
[0046]P(I) =n_white/n_total
[0047]P(x)=P(x_l)*(n_black-(x_l))/(total_(x_l))
[0048]圖4是根據(jù)本說明書一個(gè)或多個(gè)實(shí)施例的用于針對(duì)變化的連續(xù)值數(shù)目使查詢值與目標(biāo)值相匹配的概率分布的圖形表示。圖4中的概率分布是使用以上等式生成的,其中,N =10并且11_13作61:被給予范圍是從1-8的給定整數(shù)值。
[0049]圖5是示出最大匹配值數(shù)目(例如,n_max)與流行率信息之間的基于累積概率的示例性對(duì)應(yīng)性的圖表,其中,N=64。確切地,n_max值具有相應(yīng)的以下各項(xiàng):
(1)數(shù)量級(jí)(OOM)值(例如,I;10; 100; I,000; 10,000; 100,000;等)范圍;
(2)00M精確范圍的準(zhǔn)確度,在圖5中被標(biāo)注為“Prob”。確切地,這個(gè)值表示:對(duì)于給定11_max來(lái)說實(shí)際查詢值數(shù)目位于OOM范圍內(nèi)的概率。應(yīng)用了>0.7+/-0.2的閾值概率;以及
(3)OOM精確范圍、加或減一個(gè)OOM范圍的準(zhǔn)確度,在圖5中被標(biāo)注為“00M+-Prob”。確切地,這個(gè)值表示:對(duì)于給定n_max來(lái)說實(shí)際查詢值數(shù)目位于給定OOM范圍、所述給定OOM范圍加一個(gè)OOM范圍、或所述給定OOM范圍減一個(gè)OOM范圍內(nèi)的概率。應(yīng)用了 >0.95的閾值概率。
[0050]累積概率提供了使匹配值數(shù)目(或匹配值數(shù)目的范圍)與相應(yīng)流行率值相關(guān)的示例性統(tǒng)計(jì)基礎(chǔ)djiiax的具體數(shù)目可以基于所希望系統(tǒng)細(xì)節(jié)層次來(lái)計(jì)算。例如,所希望細(xì)節(jié)層次可以是數(shù)量級(jí)(OOM)值(例如,I; 10; 100; I,000; 10,000; 100,000;等)或范圍。OOM值提供已經(jīng)查詢對(duì)象的唯一設(shè)備的數(shù)目的數(shù)量級(jí)的估計(jì)值。為了獲得所希望范圍的OOM值,所述系統(tǒng)可以提供達(dá)到指定累積概率的相應(yīng)n_max值??梢陨深愃频膶?duì)應(yīng)性數(shù)據(jù)以獲得所希望細(xì)節(jié)層次的任何選定值。
[0051]在圖5中,〈5的n_max對(duì)應(yīng)于累積概率為0.4的1-10的數(shù)量級(jí)(OOM)范圍,并且對(duì)應(yīng)于累積概率為I的1-100的OOM范圍。剩余的n_max值中的每一個(gè)(S卩,5、9、12、15、以及19)對(duì)應(yīng)于各自具有為至少0.68或近似0.7的累積概率的增長(zhǎng)的(OOM)范圍(即,對(duì)應(yīng)地,10-100 ;100-1,000;11(-101(;101(-1001(;1001(-1]\0。此外,剩余的11_11^1值中的每一個(gè)對(duì)應(yīng)于累積概率為至少0.98的00M、加或減一個(gè)00M。對(duì)于n_max的任何選定值,可以生成類似的對(duì)應(yīng)性數(shù)據(jù)。在這個(gè)示例中,針對(duì)X的任何值,其中,n_max = x,等于范圍10z—1至102的0011的累積概率可以由Δ [P(10z—11 n_max = x),P(10Z | n_max = x)]計(jì)算,并且加或減一個(gè)OOM的累積概率可以由A [P(10z—2 n_max = x),P(10Z+11n_max = x)]計(jì)算。這些表達(dá)式表示對(duì)應(yīng)地范圍10z—1至102與范圍10z—2至1z+1的端點(diǎn)之間的累積概率之差。
[0052]在一種實(shí)現(xiàn)方式中,與圖5中數(shù)據(jù)類似的數(shù)據(jù)可以用于使比較查詢值與目標(biāo)值(例如,比較310和/或618)的結(jié)果與已經(jīng)查詢對(duì)象的唯一設(shè)備的數(shù)目的估計(jì)值相關(guān)。這類數(shù)據(jù)基于已經(jīng)查詢對(duì)象的唯一設(shè)備的數(shù)目在數(shù)學(xué)上合理的估計(jì)值提供流行率的估計(jì)值。
[0053]示例性算法可以如下實(shí)現(xiàn)用于基于唯一設(shè)備的數(shù)目估計(jì)流行率的統(tǒng)計(jì)模型:
1.針對(duì)對(duì)文件f_x的第一傳入查詢0_1,存儲(chǔ)設(shè)備標(biāo)識(shí)符0_1,其中,所述設(shè)備標(biāo)識(shí)符標(biāo)識(shí)所述查詢所來(lái)自于的設(shè)備。將n_max初始化為等于零,其中,n_max表示:針對(duì)文件€_1,D_1與其他設(shè)備標(biāo)識(shí)符之間的當(dāng)前所記錄的最大匹配數(shù)目。
i1.對(duì)于來(lái)自具有設(shè)備標(biāo)識(shí)符D_y的設(shè)備的每一個(gè)隨后的對(duì)文件f_x的查詢Q_z,進(jìn)行以下操作:
如果D_y不等于D_l:從其中,Dj和D_y相匹配的第一位開始并向上增長(zhǎng)以確定連續(xù)匹配位數(shù)目n_y ;并且如果n_max小于n_y,那么將n_max設(shè)定成n_y。
[0054]所遇到的唯一設(shè)備標(biāo)識(shí)符越多,我們將越有可能遇到η的較高值。因此,當(dāng)前針對(duì)任何文件所記錄的n_max是已經(jīng)查詢文件f_x的唯一設(shè)備的數(shù)目在統(tǒng)計(jì)上合理的指示符。
[0055]以上的示例性算法可以如下擴(kuò)展以便跟蹤三個(gè)最普及的國(guó)家:
1.針對(duì)每個(gè)文件f_x,記錄呈(c,n_max)形式的三個(gè)元組,其中,c是國(guó)家代碼并且n_max是根據(jù)來(lái)自相關(guān)聯(lián)國(guó)家j對(duì)£_1的查詢所計(jì)算的η的最大值。 i 1.針對(duì)來(lái)自位于國(guó)家c_j內(nèi)的設(shè)備D_i的對(duì)文件f_x的每個(gè)傳入查詢:
如果c_ j匹配三個(gè)元組中的國(guó)家之一:
如果n_i大于當(dāng)前針對(duì)c_ j所記錄的n_max,那么將n_max設(shè)定成n_i。
如果c_j不匹配三個(gè)元組中的任何國(guó)家:
如果n_i大于當(dāng)前針對(duì)三個(gè)元組中的任何國(guó)家所記錄的n_max值,那么用(c_ j,n_i)替換具有最小n_max值的元組。
[0056]這種示例性算法存儲(chǔ)三個(gè)元組以便保持三個(gè)國(guó)家的針對(duì)文件f_x報(bào)告最高n_max值的標(biāo)識(shí)符,并且因此,提供了三個(gè)國(guó)家的具有報(bào)告文件f_x的存在的最多設(shè)備的統(tǒng)計(jì)上合理的指示。此外,對(duì)于每個(gè)元組變化,n_max值是增長(zhǎng)的,所以數(shù)據(jù)變化(波動(dòng))的數(shù)目可以不大于跟蹤同一文件的全球流行率所要求的波動(dòng)數(shù)目的3倍。
[0057]有利地,這種算法的實(shí)現(xiàn)方式并不需要對(duì)唯一設(shè)備ID進(jìn)行計(jì)數(shù),并且因此,時(shí)間復(fù)雜度并不取決于唯一設(shè)備ID的數(shù)目。替代地,結(jié)果的提供可以是0(1)時(shí)間復(fù)雜度(S卩,恒定時(shí)間),并且因此,可以實(shí)時(shí)地(例如,在萬(wàn)維服務(wù)器中在查詢時(shí)間)被應(yīng)用。此外,這種算法的空間要求相對(duì)于存儲(chǔ)所有唯一設(shè)備ID的要求得到降低。
[0058]在一種實(shí)現(xiàn)方式中,統(tǒng)計(jì)法可以存儲(chǔ)設(shè)備ID以便有利地解決其中一個(gè)設(shè)備發(fā)送對(duì)同一對(duì)象的多個(gè)查詢的情況。設(shè)備ID的存儲(chǔ)可以是例如單個(gè)參考點(diǎn),這針對(duì)來(lái)自同一設(shè)備的隨后的查詢提供可再現(xiàn)輸出,而不是對(duì)所有先前針對(duì)對(duì)象的查詢進(jìn)行計(jì)數(shù)。此外,多個(gè)設(shè)備(例如,萬(wàn)維服務(wù)器和/或數(shù)據(jù)中心)可以有利地使用不記錄每個(gè)查詢?cè)O(shè)備的設(shè)備ID的數(shù)據(jù)系統(tǒng)來(lái)提供對(duì)全球查詢業(yè)務(wù)的響應(yīng)。
[0059]圖6A和圖6B描繪了展示根據(jù)本說明書一個(gè)或多個(gè)實(shí)施例的用于提供文件的散列的流行率信息的邏輯的流程圖。圖6A和圖6B所描繪的邏輯是以上所描述的流行率估計(jì)算法的示例性實(shí)現(xiàn)方式。在這個(gè)示例中,邏輯600包括:起點(diǎn)602;從設(shè)備604接收文件的散列;基于設(shè)備的標(biāo)識(shí)符生成位序列606;確定文件的散列是否已經(jīng)存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中608;將位序列、散列、以及位序列與散列之間的關(guān)聯(lián)性存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中610;將等于零的最大匹配位數(shù)目存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中612;基于存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中的最大匹配位數(shù)目輸出查詢數(shù)據(jù)的流行率614;確定位序列是否已經(jīng)與跟散列的關(guān)聯(lián)性一起存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中616;將所生成的位序列與存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中的位序列進(jìn)行比較618;確定所述比較是否產(chǎn)生超過存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中的最大匹配位數(shù)目的匹配位數(shù)目620;基于所述比較更新存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中的最大匹配位數(shù)目622;以及終點(diǎn)624。
[0060 ]邏輯600從起點(diǎn)602開始。起點(diǎn)602可以與其他邏輯、例程、應(yīng)用或線程的起點(diǎn)/終點(diǎn)重合。此外,在起點(diǎn)602處,可以對(duì)數(shù)據(jù)(例如,對(duì)象、值、變量等)進(jìn)行初始化、檢索、或訪問,所述系統(tǒng)可以針對(duì)對(duì)象和/或變量進(jìn)行初始化或檢索以供在邏輯600中使用。
[0061]接著,在程序604處,從設(shè)備接收文件的散列。文件的散列是示例性查詢數(shù)據(jù)(例如,查詢數(shù)據(jù)204)??商娲?,可以從設(shè)備接收文件,并且作為邏輯600的執(zhí)行部分可以生成文件的散列,或文件的散列可以由第三方生成。散列可以由查詢系統(tǒng)202、信譽(yù)系統(tǒng)104或安全服務(wù)器102中的至少一個(gè)接收。
[0062]在程序606處,可以基于設(shè)備的標(biāo)識(shí)符生成位序列。在一種實(shí)現(xiàn)方式中,標(biāo)識(shí)符可以是以下各項(xiàng)中的一項(xiàng):設(shè)備的唯一標(biāo)識(shí)符、生成和/或提交查詢的設(shè)備的全球唯一隱式標(biāo)識(shí)符、設(shè)備上所存在的操作系統(tǒng)、設(shè)備擁有者的姓名、或與設(shè)備相關(guān)聯(lián)的任何其他標(biāo)識(shí)符。例如,散列函數(shù)可以應(yīng)用于標(biāo)識(shí)符,以便生成具有位的隨機(jī)(或偽隨機(jī))分布的位序列。在一種實(shí)現(xiàn)方式中,散列函數(shù)可以是MD5、SHAl、和/或SHA256之一。
[0063]接著,在程序608處,邏輯600確定文件的散列是否已經(jīng)存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中。這個(gè)程序檢驗(yàn)所接收的文件的散列是否表示對(duì)文件的第一查詢。
[0064]如果確定文件的散列已經(jīng)存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中,那么根據(jù)程序610,將位序列、散列、以及位序列與散列之間的關(guān)聯(lián)性存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中。邏輯600的這個(gè)分支可以處理其中散列表示對(duì)文件的第一查詢的情況。在對(duì)文件的第一查詢的情況下,最大匹配位數(shù)目(例如,n_max)的當(dāng)前值為零。因此,在程序612處,將最大匹配位數(shù)目設(shè)定成等于零。在程序614處,基于存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中的最大匹配位數(shù)目輸出查詢數(shù)據(jù)的流行率。在對(duì)文件的第一查詢的情況下,流行率可以指示:這個(gè)查詢是針對(duì)對(duì)象的第一查詢。例如,可以輸出為零、一、低值、和/或空之一的流行率值。
[0065]如果在程序616處確定文件的散列尚未存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中,那么在程序616處進(jìn)行另一確定。確切地,確定所生成的位序列是否已經(jīng)與跟散列的關(guān)聯(lián)性一起存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中。這可以表示其中從設(shè)備接收到散列并不表示來(lái)自先前查詢同一散列的設(shè)備的隨后查詢的情況。盡管所接收查詢可以不是對(duì)文件的散列的第一查詢,它可以表示這個(gè)設(shè)備已經(jīng)查詢所述散列的第一時(shí)間。
[0066]如果在程序616處確定所生成的位序列已經(jīng)與跟散列的關(guān)聯(lián)性一起被存儲(chǔ),那么可以基于存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中的最大匹配位數(shù)目輸出文件的流行率。這表示其中從設(shè)備接收到散列表示來(lái)自先前查詢同一文件的設(shè)備的隨后查詢的情況。
[0067]如果確定所生成的位序列尚未與跟散列的關(guān)聯(lián)性一起被存儲(chǔ),那么在程序618處,將所生成的位序列與存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中的位序列進(jìn)行比較。存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中的位序列可以表示響應(yīng)于對(duì)文件的散列的第一查詢而存儲(chǔ)的目標(biāo)值。所生成的位序列可以表示響應(yīng)于對(duì)文件的散列的隨后查詢而生成的查詢值。在一種實(shí)現(xiàn)方式中,所述比較可以如關(guān)于程序310和/或圖5所描述地執(zhí)行。
[0068]在程序620處,確定所述比較是否產(chǎn)生超過存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中的最大匹配位數(shù)目的匹配位數(shù)目。來(lái)自先前已經(jīng)查詢同一文件的設(shè)備的隨后查詢對(duì)存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中的最大位數(shù)目無(wú)影響。在從通信設(shè)備接收到隨后的查詢數(shù)據(jù)時(shí),所述比較將產(chǎn)生小于或等于當(dāng)前所存儲(chǔ)的最大匹配位數(shù)目的匹配位數(shù)目。因此,邏輯600通過不更新最大數(shù)目來(lái)維持?jǐn)?shù)據(jù)存儲(chǔ)區(qū)中的最大匹配數(shù)目。在此針對(duì)用于基于唯一設(shè)備的數(shù)目估計(jì)流行率的統(tǒng)計(jì)模型提供了這種結(jié)果的簡(jiǎn)單證明。
[0069]如果所述比較產(chǎn)生超過存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中的最大匹配位數(shù)目(例如,n_max)的匹配位數(shù)目,根據(jù)程序622,基于所述比較更新所述值(n_max)。在一種實(shí)現(xiàn)方式中,在程序622處,可以更新最大匹配位數(shù)目以便采取根據(jù)程序620處的比較所確定的匹配位數(shù)目的值。
[0070]在程序614處,基于存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中的最大匹配位數(shù)目示出查詢數(shù)據(jù)的流行率614。使用至少一個(gè)統(tǒng)計(jì)模型,可以基于最大匹配位數(shù)目(n_max)確定流行率值和/或流行率值的置信度。例如,使用圖5中的值,可以輸出流行率值。在圖5中,等于9的n_max對(duì)應(yīng)于為
0.69的實(shí)際流行率在100與I,000之間的概率。例如,(多個(gè))輸出流行率值可以包括OOM值(例如,100和I,000)的范圍、范圍中的單個(gè)值(例如,999)、或范圍的端點(diǎn)(例如,100或I,000)。流行率值可以基于流行率值的置信度、諸如實(shí)際流行率等于流行率值或在其范圍f內(nèi)的概率來(lái)進(jìn)行加權(quán)。
[0071]最后,在終點(diǎn)624處,所述邏輯結(jié)束。終點(diǎn)624可以用作其他邏輯、例程、應(yīng)用或線程的起點(diǎn)。例如,終點(diǎn)624可以在接收到隨后的查詢時(shí)指揮處理器執(zhí)行從起點(diǎn)602開始的邏輯。此外,可以修改邏輯600以便跟蹤三個(gè)最普及的國(guó)家,如關(guān)于基礎(chǔ)算法的擴(kuò)展所討論的。
[0072]在一種實(shí)現(xiàn)方式中,邏輯600能夠以與邏輯300類似的方式進(jìn)行操作。程序604中的從設(shè)備接收文件的散列可以對(duì)應(yīng)于程序304中的接收查詢數(shù)據(jù)。基于程序606-612,所述系統(tǒng)可以基于第一設(shè)備的標(biāo)識(shí)符生成并存儲(chǔ)位序列,所述位序列可以對(duì)應(yīng)于如程序304中所提供的目標(biāo)值。在程序616-622處,所述系統(tǒng)訪問數(shù)據(jù)存儲(chǔ)區(qū)并且對(duì)若干位序列進(jìn)行比較,這可以對(duì)應(yīng)于程序310。在程序614處,所述系統(tǒng)還基于存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中的數(shù)據(jù)輸出流行率,這可以對(duì)應(yīng)于程序312。
[0073]對(duì)于邏輯300和/或600,值(例如,查詢值、目標(biāo)值、或位)序列的長(zhǎng)度可以基于閾值來(lái)確定。例如,域值可以對(duì)應(yīng)于:流行率大小的上限(例如,I,000個(gè)唯一設(shè)備、或I,000,000個(gè)唯一設(shè)備)、系統(tǒng)的設(shè)計(jì)參數(shù)、和/或所述系統(tǒng)將遇到的設(shè)備的估計(jì)數(shù)目。在使用位作為值的示例中,等于64的序列長(zhǎng)度可以提供足夠的唯一位序列來(lái)表示264個(gè)、或18 X 118個(gè)唯一設(shè)備。
[0074]圖7展示了根據(jù)本說明書實(shí)施例的對(duì)應(yīng)于三個(gè)設(shè)備的三個(gè)示例性位序列。在這個(gè)示例中,設(shè)備I對(duì)應(yīng)于從01101000……(例如,第一設(shè)備id)開始的位序列,設(shè)備2對(duì)應(yīng)于從00101011……(例如,第二設(shè)備id)開始的位序列,并且設(shè)備3對(duì)應(yīng)于從01101010……(例如,第三設(shè)備id)開始的位序列。三個(gè)位序列的指數(shù)被標(biāo)記Si^in。為了簡(jiǎn)單起見,未示出完整的位序列。
[0075]位序列的長(zhǎng)度(S卩,N的值)可以基于閾值來(lái)確定,例如像針對(duì)邏輯300和600所討論的。在一種實(shí)現(xiàn)方式中,使用等于64的η可以提供足夠的唯一位序列來(lái)表示264個(gè)、或18 X118個(gè)唯一設(shè)備,這可足以避免潛在問題(例如,具有精確匹配的位序列的兩個(gè)不同設(shè)備)。
[0076]在這個(gè)示例中,三個(gè)設(shè)備中的每一個(gè)發(fā)送與同一文件相關(guān)的查詢數(shù)據(jù)。設(shè)備I首先發(fā)送查詢數(shù)據(jù)、之后是設(shè)備2、并且然后是設(shè)備3。因此,例如,基于由程序304或610提供的邏輯,將第一設(shè)備id存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)(例如,數(shù)據(jù)存儲(chǔ)區(qū)208)中。對(duì)于來(lái)自新設(shè)備的與同一文件相關(guān)的每個(gè)隨后的查詢,例如,基于由程序606、608、616和618提供的邏輯,通過比較新的位序列與第一設(shè)備id來(lái)標(biāo)識(shí)匹配位數(shù)目。
[0077]所述比較可以包括:從第一位序列和第二位序列中的每一個(gè)中的第一位開始,成對(duì)地比較第一位序列中的連續(xù)位與第二位序列中的相應(yīng)連續(xù)位。第一設(shè)備id和第二設(shè)備id的示例性成對(duì)比較產(chǎn)生等于一的匹配值數(shù)目。這是因?yàn)樵趦蓚€(gè)設(shè)備id之間僅第一個(gè)值(SP,指數(shù)為的值)相匹配,但第二值(即,指數(shù)為i2的值)不匹配。盡管在第一設(shè)備id與第二設(shè)備id之間第三值相匹配,但第三值并不位于從第一位(S卩,指數(shù)Si1的值)開始的連續(xù)匹配位序列之內(nèi),并且因此,并不計(jì)入匹配位數(shù)目。第一設(shè)備id與第三設(shè)備id之間的類似比較產(chǎn)生等于六的匹配值數(shù)目,例如,基于由程序620和622提供的邏輯,可以將所述匹配值數(shù)目存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中。對(duì)于與同一文件相關(guān)的每個(gè)隨后的查詢,將對(duì)應(yīng)于查詢?cè)O(shè)備的位序列與對(duì)應(yīng)于已經(jīng)針對(duì)同一文件查詢的第一設(shè)備的位序列(即,第一設(shè)備id)進(jìn)行比較。通過比較連續(xù)值(即,可能值的排列)而不是所述系統(tǒng)所維持的任何匹配相應(yīng)值對(duì),較大的唯一值數(shù)目因此可以模擬較大的流行率值。
[0078]代替對(duì)應(yīng)于已經(jīng)針對(duì)所述文件查詢的第一設(shè)備的位序列,可以使用其他值或值序列。例如,隨機(jī)值序列、隨機(jī)位序列、對(duì)應(yīng)于已經(jīng)針對(duì)同一文件查詢的第二設(shè)備的位序列、對(duì)應(yīng)于已經(jīng)針對(duì)所述文件查詢的任何設(shè)備的位序列、或隨機(jī)數(shù)。
[0079]圖8是根據(jù)實(shí)施例的耦合到示例處理器上的存儲(chǔ)器的方框圖。圖8展示了根據(jù)一個(gè)實(shí)施例的處理器核800。處理器核800可以是用于任何類型的處理器的核,所述處理器諸如微處理器、嵌入式處理器、數(shù)字信號(hào)處理器(DSP)、網(wǎng)絡(luò)處理器、或執(zhí)行代碼的其他設(shè)備。盡管圖8展示了僅一個(gè)處理器核800,處理元件可以可替代地包括多于一個(gè)圖8所展示的處理器核800。(參見,例如,以下圖9中的多核實(shí)施例)。處理器800可以是任何類型的處理器,諸如微處理器、嵌入式處理器、數(shù)字信號(hào)處理器(DSP)、網(wǎng)絡(luò)處理器、多核處理器、單核處理器、或執(zhí)行代碼的其他設(shè)備。處理器核800可以是單線程核,或者,對(duì)于至少一個(gè)實(shí)施例,處理器核800可以是多線程的,因?yàn)樗赡馨亢硕嘤谝粋€(gè)硬件線程描述表(或“邏輯處理器”)。這類核800可以被配置成用于以在此公開的方式執(zhí)行指令碼。圖8所示的這種系統(tǒng)可以用于實(shí)現(xiàn)在此被描述為是由安全服務(wù)器、信譽(yù)信息系統(tǒng)、查詢系統(tǒng)、以及圖1、圖2所示的任何部件等執(zhí)彳丁的功能。
[0080]圖8還展示了耦合到處理器800上的存儲(chǔ)器870。存儲(chǔ)器870可以是如本領(lǐng)域的技術(shù)人員已知的或以其他方式可獲得的多種多樣的存儲(chǔ)器(包括存儲(chǔ)器層級(jí)的不同層)中的任何存儲(chǔ)器。存儲(chǔ)器870可以包括有待由處理器800核執(zhí)行的一個(gè)或多個(gè)碼指令813。處理器核800遵循由代碼813指示的指令程序序列。每個(gè)指令進(jìn)入前端部分810并且由一個(gè)或多個(gè)解碼器820處理。解碼器可以生成呈預(yù)定義格式的微操作(諸如固定寬度微操作)作為其輸出,或者可以生成反映出原始碼指令的其他指令、微指令、或控制信號(hào)。前端810還包括寄存器重命名邏輯825和調(diào)度邏輯830,它們總體上分配資源并且將對(duì)應(yīng)于用于執(zhí)行的轉(zhuǎn)換指令的操作進(jìn)行排隊(duì)。
[0081]處理器800被示出為包括執(zhí)行邏輯850,所述執(zhí)行邏輯具有一組執(zhí)行單元855-1至855-N。一些實(shí)施例可以包括專用于特定功能或功能集的數(shù)個(gè)執(zhí)行單元。其他實(shí)施例可以包括僅一個(gè)執(zhí)行單元、或可以執(zhí)行特定功能的一個(gè)執(zhí)行單元。執(zhí)行邏輯850執(zhí)行由碼指令指定的操作。
[0082]在完成由碼指令指定的操作的執(zhí)行之后,后端邏輯860使代碼813的指令引退。在一個(gè)實(shí)施例中,處理器800允許指令的無(wú)序執(zhí)行但要求指令的有序引退。引退邏輯x65可以采取本領(lǐng)域的技術(shù)人員已知的多種形式(例如,重排序緩沖器等)。以此方式,在代碼813的執(zhí)行過程中,至少就由解碼器、寄存器重命名邏輯825所利用的硬件寄存器和表、以及由執(zhí)行邏輯850修改的任何寄存器(未示出)生成的輸出而言,處理器核800被變換。
[0083]盡管圖8未展示,但處理元件可以包括其他芯片內(nèi)元件與處理器核800。例如,處理元件可以包括存儲(chǔ)器控制邏輯(參見,例如,以下圖9的MC 972)連同處理器核200。處理元件可以包括I/O控制邏輯,和/或可以包括與存儲(chǔ)器控制邏輯集成的I/O控制邏輯。處理元件還可以包括一個(gè)或多個(gè)高速緩存。
[0084]圖9是根據(jù)實(shí)施例的以點(diǎn)對(duì)點(diǎn)(PtP)配置安排的示例計(jì)算系統(tǒng)的方框圖。圖9示出了多處理器系統(tǒng)900,所述多處理器系統(tǒng)包括第一處理元件970和第二處理元件980。雖然示出了兩個(gè)處理元件970和980,應(yīng)當(dāng)理解的是,系統(tǒng)900的實(shí)施例還可以包括僅一個(gè)此類的處理元件。圖9所示的這種系統(tǒng)可以用于實(shí)現(xiàn)在此被描述為是由安全服務(wù)器、信譽(yù)信息系統(tǒng)、查詢系統(tǒng)、以及圖1、圖2所示的任何部件等執(zhí)行的功能。
[0085]系統(tǒng)900被展示為點(diǎn)對(duì)點(diǎn)互連系統(tǒng),其中,第一處理元件970和第二處理元件980經(jīng)由點(diǎn)對(duì)點(diǎn)互連件950耦合。應(yīng)當(dāng)理解的是,圖9所展示的任何或所有互連件可以被實(shí)現(xiàn)為多站式總線而不是點(diǎn)對(duì)點(diǎn)互連件。
[0086]如圖9所示,處理元件970和980中的每一個(gè)可以是多核處理器,包括第一處理器核和第二處理器核(即,處理器核974a和974b以及處理器核984a和984b)。這類核974、974b、984a、984b可以被配置成用于以在此公開的方式執(zhí)行指令碼。
[0087]每個(gè)處理元件970、980可以包括至少一個(gè)共享高速緩存1896。共享高速緩存1896a、1896b可以存儲(chǔ)由處理器的一個(gè)或多個(gè)部件、諸如對(duì)應(yīng)地核974a、974b以及984a、984b利用的數(shù)據(jù)(例如,指令)。例如,共享高速緩存可以本地高速緩存存儲(chǔ)在存儲(chǔ)器932、934中的數(shù)據(jù),以便由處理器的部件更快地訪問。在一個(gè)或多個(gè)實(shí)施例中,共享高速緩存可以包括一個(gè)或多個(gè)中間級(jí)高速緩存(諸如2級(jí)(L2)、3級(jí)(L3)、4級(jí)(L4)、或其他級(jí)高速緩存)、最后一級(jí)高速緩存(LLC)、和/或其組合
[0088]雖然僅示出了兩個(gè)處理元件970、980,應(yīng)當(dāng)理解的是,本說明書的范圍不限于此。在其他實(shí)施例中,給定處理器中可以存在一個(gè)或多個(gè)另外的處理元件??商娲?,處理元件970、980中的一個(gè)或多個(gè)可以是處理器之外的元件,諸如ASIC芯片或現(xiàn)場(chǎng)可編程門陣列。例如,(多個(gè))另外的處理元件可以包括與第一處理器970相同的(多個(gè))另外的處理器、與第一處理器970異構(gòu)或不對(duì)稱的(多個(gè))另外的處理器、加速器(例如像圖形加速器或數(shù)字信號(hào)處理(DSP)單元)、現(xiàn)場(chǎng)可編程門陣列、或任何其他處理元件。就一系列品質(zhì)量度(包括體系結(jié)構(gòu)、微體系結(jié)構(gòu)、熱、功耗特性等)而言,處理元件970、980之間存在多種差異。這些差異可以有效地表明它們是處理元件970、980之間的不對(duì)稱性和異構(gòu)性。對(duì)于至少一個(gè)實(shí)施例,不同處理元件970、980可以駐留在同一管芯封裝中。
[0089]第一處理元件970可以進(jìn)一步包括存儲(chǔ)器控制器邏輯(MC)972以及點(diǎn)對(duì)點(diǎn)(P-P)接口 976和978。類似地,第二處理元件980可以包括MC 982以及P-P接口 986和988。如圖9所示,MC 972和982將處理器耦合到對(duì)應(yīng)存儲(chǔ)器、即存儲(chǔ)器932和存儲(chǔ)器934上,所述存儲(chǔ)器可以是主存儲(chǔ)器的本地附接到對(duì)應(yīng)處理器上的部分。雖然MC邏輯972和982被展示為集成到處理元件970、980中,但對(duì)于替代性實(shí)施例,MC邏輯可以是位于處理元件970、980外部而不是集成在其中的離散邏輯。
[0090]第一處理元件970和第二處理元件980可以對(duì)應(yīng)地經(jīng)由P-P互連件976、986和984而耦合到I/o子系統(tǒng)990上。如圖9所示,I/O子系統(tǒng)990包括P-P接口994和998。此外,I/O子系統(tǒng)990包括接口992以便將I/O子系統(tǒng)990與高性能圖形引擎938耦合起來(lái)。在一個(gè)實(shí)施例中,可以使用總線949來(lái)將圖形引擎938耦合到I/O子系統(tǒng)990上??商娲兀c(diǎn)對(duì)點(diǎn)互連件939可以耦合這些部件。
[0091 ] I/O子系統(tǒng)990進(jìn)而可以經(jīng)由接口 996耦合到第一總線916上。在一個(gè)實(shí)施例中,第一總線916可以是外圍部件互連(PCI)總線,或諸如PCI Express總線或另一種第三代I/O互連總線的總線,盡管本說明書的范圍不限于此。
[0092]如圖9所示,不同I/O設(shè)備914可以連同總線橋918耦合到第一總線916上,所述總線橋可以將第一總線916耦合到第二總線910上。在一個(gè)實(shí)施例中,第二總線920可以是低引腳數(shù)(LPC)總線。不同設(shè)備可以耦合到第二總線920上,所述不同設(shè)備包括例如:鍵盤八氧標(biāo)912、(多個(gè))通信設(shè)備926(所述通信設(shè)備進(jìn)而可以與計(jì)算機(jī)網(wǎng)絡(luò)202通信)、以及數(shù)據(jù)存儲(chǔ)單元928 (諸如磁盤驅(qū)動(dòng)器或其他大容量存儲(chǔ)設(shè)備),在一個(gè)實(shí)施例中,所述數(shù)據(jù)存儲(chǔ)單元可以包括代碼930。代碼930可以包括用于執(zhí)行以上所描述方法中的一種或多種的實(shí)施例的指令。另外,音頻I/O 924可以耦合到第二總線920上。
[0093]應(yīng)當(dāng)注意:考慮到其他實(shí)施例。例如,替代圖9的點(diǎn)對(duì)點(diǎn)體系結(jié)構(gòu),系統(tǒng)可以實(shí)現(xiàn)多站式總線或另一種這樣的通信拓?fù)浣Y(jié)構(gòu)。另外,圖9元件可以可替代地使用比圖9所示多或少的集成芯片來(lái)進(jìn)行分區(qū)。
[0094]應(yīng)當(dāng)注意:通過在此提供的示例,可以關(guān)于兩個(gè)、三個(gè)、或更多個(gè)計(jì)算設(shè)備描述交互。然而,這樣做只是出于清楚和示例的目的。在某些情況下,通過僅參考有限數(shù)目的計(jì)算設(shè)備,可以更易于描述一組給定流程的一個(gè)或多個(gè)功能性。此外,根據(jù)本說明書的一個(gè)或多個(gè)實(shí)施例的對(duì)信譽(yù)信息、流行率信息以及安全數(shù)據(jù)分析的提供是容易縮放的,并且可以跨大數(shù)目的部件、以及更復(fù)雜/尖端的安排和配置實(shí)現(xiàn)。因此,所提供的示例不應(yīng)當(dāng)限制對(duì)信譽(yù)信息、流行率信息以及安全數(shù)據(jù)分析的提供的范圍或抑制其廣義傳授內(nèi)容,因?yàn)槠錆撛诘剡m用于無(wú)數(shù)其他體系結(jié)構(gòu)。
[0095]同樣重要的是應(yīng)當(dāng)注意:與對(duì)信譽(yù)信息、流行率信息以及安全數(shù)據(jù)分析的提供相關(guān)的功能展示了可以由圖1至圖9展示的系統(tǒng)執(zhí)行或在其內(nèi)執(zhí)行的可能功能中的僅一些功能。這些操作中的一些在適當(dāng)情況下可以被刪除或移除,或在不偏離本公開的范圍的情況下,這些操作可以被大幅修改或改變。另外,這些操作的時(shí)序可以被大幅改動(dòng)。已經(jīng)出于示例和討論的目的提供了前述操作流程。在此描述的實(shí)施例提供了很大靈活性,因?yàn)樵诓黄x本公開的傳授內(nèi)容的情況下,可以提供適合的安排、時(shí)間排序以及時(shí)序機(jī)制。
[0096]在一種示例實(shí)現(xiàn)方式中,實(shí)現(xiàn)在此描述的實(shí)施例所涉及的不同設(shè)備或部件可以包括用于實(shí)現(xiàn)所描述功能的軟件,并且在此描述的這些設(shè)備或部件可以包括用于促進(jìn)在此描述的活動(dòng)的在一個(gè)或多個(gè)非瞬態(tài)、有形介質(zhì)中具體化的軟件。在此公開的這些系統(tǒng)和設(shè)備(例如,安全服務(wù)器、信譽(yù)信息系統(tǒng)、查詢系統(tǒng)、以及圖1、圖2所示的任何部件等)中的至少一部分還可以包括用于存儲(chǔ)有待用于實(shí)現(xiàn)如在此概述的功能的信息的存儲(chǔ)器設(shè)備(或存儲(chǔ)器元件)。另外,在此描述的這些系統(tǒng)和設(shè)備(例如,安全服務(wù)器、信譽(yù)信息系統(tǒng)、查詢系統(tǒng)、以及圖1、圖2所示的任何部件等)可以包括一個(gè)或多個(gè)處理器,所述一個(gè)或多個(gè)處理器能夠執(zhí)行軟件或算法,以便執(zhí)行如本說明書中所討論的功能。這些設(shè)備可以進(jìn)一步將信息保持在任何適合的存儲(chǔ)器元件(隨機(jī)存取存儲(chǔ)器(“RAM” )、ROM、EPROM、EEPROM、ASIC等)、軟件、硬件中,或者在適當(dāng)情況下并且基于特定需要,將信息保持在任何其他適合的部件、設(shè)備、元件、或?qū)ο笾?。在此討論的任何存?chǔ)器術(shù)語(yǔ)(諸如(多個(gè))數(shù)據(jù)存儲(chǔ)區(qū)和(多個(gè))數(shù)據(jù)源)應(yīng)當(dāng)被解釋為涵蓋在廣義術(shù)語(yǔ)“存儲(chǔ)器元件”內(nèi)。類似地,本說明書中所描述的任何潛在處理元件、模塊和機(jī)器應(yīng)當(dāng)被解釋為涵蓋在廣義術(shù)語(yǔ)“處理器”內(nèi)。每個(gè)網(wǎng)絡(luò)元件還可以包括用于在網(wǎng)絡(luò)環(huán)境中接收、發(fā)射、和/或以其他方式傳達(dá)數(shù)據(jù)或信息的適合的接口。
[0097]應(yīng)當(dāng)注意:在某些示例實(shí)現(xiàn)方式中,在此并且在此所包括的附圖/圖示中所概述的功能可以由編碼在一個(gè)或多個(gè)有形介質(zhì)中的邏輯(例如,設(shè)置在應(yīng)用專用集成電路(“ASIC”)中的嵌入式邏輯、數(shù)字信號(hào)處理器(“DSP”)指令、有待由處理器或其他類似機(jī)器執(zhí)行的軟件(潛在地包括目標(biāo)碼和源代碼)等)。在這些實(shí)例中的一些中,提供存儲(chǔ)器元件以便存儲(chǔ)用于在此描述的操作的數(shù)據(jù)。這包括:存儲(chǔ)器元件能夠存儲(chǔ)被執(zhí)行以便實(shí)行本說明書所描述的活動(dòng)的軟件、邏輯、代碼、或處理器指令。處理器可以執(zhí)行與實(shí)現(xiàn)在此在本說明書中詳述的操作的數(shù)據(jù)相關(guān)聯(lián)的任何類型的指令。在一個(gè)示例中,處理器可以將元件或東西(例如,數(shù)據(jù))從一種狀態(tài)或事物轉(zhuǎn)變成另一種狀態(tài)或事物。在另一個(gè)示例中,在此概述的活動(dòng)可以利用固定邏輯或可編程邏輯(例如,由處理器執(zhí)行的軟件/計(jì)算機(jī)指令)實(shí)現(xiàn),并且在此標(biāo)識(shí)的元件可以是某種類型的可編程處理器,可編程數(shù)字邏輯(例如,現(xiàn)場(chǎng)可編程門陣列(“FPGA”)、可擦可編程只讀存儲(chǔ)器(“EPROM” )、電可擦除可編程ROM( “EEPROM” )),或包括數(shù)字邏輯、軟件、代碼、電子指令或其任何適合的組合的ASIC。
[0098]程序指令可以用于使編程有指令的通用或?qū)S锰幚硐到y(tǒng)執(zhí)行在此描述的操作。可替代地,這些操作可以由含有用于執(zhí)行這些操作的硬件連線的邏輯的特定硬件部件執(zhí)行,或者由程序計(jì)算機(jī)部件和自定義硬件部件的任意組合執(zhí)行。在此描述的這些方法可以作為計(jì)算機(jī)程序產(chǎn)品來(lái)提供,所述計(jì)算機(jī)程序產(chǎn)品可以包括一個(gè)或多個(gè)非瞬態(tài)的、有形的機(jī)器可讀介質(zhì),所述一個(gè)或多個(gè)介質(zhì)具有存儲(chǔ)在其上的指令,所述指令可以用于編程處理系統(tǒng)或其他電子設(shè)備以便執(zhí)行這些方法。在此使用的術(shù)語(yǔ)“機(jī)器可讀介質(zhì)”應(yīng)當(dāng)包括能夠存儲(chǔ)或編碼指令序列的任何介質(zhì),所述指令序列用于由機(jī)器執(zhí)行并且使機(jī)器執(zhí)行在此描述的任一種方法。術(shù)語(yǔ)“非瞬態(tài)機(jī)器可讀介質(zhì)”應(yīng)當(dāng)包括但不限于諸如固態(tài)存儲(chǔ)器、光盤或磁盤的存儲(chǔ)器。此外,在本領(lǐng)域中常常將呈一種或另一種形式(例如,程序、規(guī)程、過程、應(yīng)用、模塊、邏輯等)說成采取行動(dòng)或造成結(jié)果。這類表述僅是陳述由處理系統(tǒng)對(duì)軟件的執(zhí)行使處理器執(zhí)行行動(dòng)或產(chǎn)生結(jié)果的簡(jiǎn)寫方式。
[0099]應(yīng)當(dāng)注意:在此描述的基礎(chǔ)結(jié)構(gòu)(例如,安全服務(wù)器、信譽(yù)信息系統(tǒng)、查詢系統(tǒng)、以及圖1、圖2所示的任何部件等)的大部分被設(shè)置為任何類型的網(wǎng)絡(luò)元件的部分。在此使用的,用于對(duì)信譽(yù)信息、流行率信息以及安全數(shù)據(jù)分析的提供的術(shù)語(yǔ)安全服務(wù)器、信譽(yù)信息系統(tǒng)、查詢系統(tǒng)、以及圖1、圖2所示的任何部件可以涵蓋:計(jì)算機(jī)、服務(wù)器、網(wǎng)絡(luò)設(shè)備、主機(jī)、路由器、交換機(jī)、網(wǎng)關(guān)、橋、虛擬設(shè)備、負(fù)載均衡器、防火墻、處理器、模塊,或在網(wǎng)絡(luò)環(huán)境中可操作來(lái)交換信息的任何其他合適的設(shè)備、部件、元件或?qū)ο?。此外,這些網(wǎng)絡(luò)元件可以包括促進(jìn)其操作的任何適合的硬件、軟件、部件、模塊、接口或?qū)ο?。這可以包括允許數(shù)據(jù)或信息的有效交換的適當(dāng)?shù)乃惴ê屯ㄐ艆f(xié)議。
[0100]盡管已經(jīng)詳細(xì)參考特定安排和配置描述了本公開,但在不偏離本公開的范圍的情況下,可以大大地改變這些示例配置和布置。例如,盡管已經(jīng)參考特定通信交換描述了本公開,但在此描述的實(shí)施例可以可適用于其他體系結(jié)構(gòu)。
[0101]本領(lǐng)域的技術(shù)人員可以確定眾多其他改變、替代、變型、更改和變換,并且本公開意在涵蓋歸屬所附權(quán)利要求書的范圍的所有這類改變、替代、變型、更改和變換。為了幫助美國(guó)專利及商標(biāo)局(USPTO)以及另外本申請(qǐng)發(fā)布的任何專利的任何讀者理解本申請(qǐng)所附權(quán)利要求書,
【申請(qǐng)人】希望注意本
【申請(qǐng)人】:(a)并不旨在所附權(quán)利要求中的任一項(xiàng)因?yàn)樵诒旧暾?qǐng)的申請(qǐng)日存在而援引35U.S.C.第112章第(6)段,除非在特定權(quán)利要求中確切地使用了字詞“用于……的裝置”或“用于……的步驟”;并且(b)并不旨在通過本說明書中未在所附權(quán)利要求書中反映出的任何陳述以任何方式限制本公開。
[0102]根據(jù)非常確實(shí)的原則:“
【申請(qǐng)人】有權(quán)成為他或她自己的詞典編纂者”,MPEP2111.01(IV),引用In re Paulson案,30F.3d 1475,1480(聯(lián)邦巡回上訴法院(Fed.Cir.)1994),在此已經(jīng)明確定義了某些術(shù)語(yǔ)。明確地旨在:這些術(shù)語(yǔ)具有所提供的定義,并且它們并不被給予與這些定義不一致的任何解釋。
[0103]以下示例涉及本公開的一些實(shí)施例。
[0104]示例I是一種機(jī)器可讀非瞬態(tài)存儲(chǔ)介質(zhì),具有存儲(chǔ)在其上的用于基于查詢提供流行率信息的指令,其中,所述指令在由至少一個(gè)處理器執(zhí)行時(shí)使所述至少一個(gè)處理器執(zhí)行以下操作:從數(shù)據(jù)源檢索(retrieve)目標(biāo)值序列;從通信設(shè)備接收查詢數(shù)據(jù);基于與所述通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成查詢值序列;比較所述查詢值序列與所述目標(biāo)值序列以便標(biāo)識(shí)匹配值數(shù)目;以及至少部分地基于所述匹配值數(shù)目向所述通信設(shè)備輸出所述查詢數(shù)據(jù)的流行率值。
[0105]在示例2中,如示例I所述的主題可以可選地包括:在確定所述匹配值數(shù)目超過存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中的最大匹配數(shù)目時(shí),更新所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目;以及使用統(tǒng)計(jì)模型基于所述最大匹配數(shù)目來(lái)計(jì)算所述流行率值以及所述流行率值的置信度。
[0106]在示例3中,如示例I或2所述的主題可以可選地包括:從所述通信設(shè)備接收另外的查詢數(shù)據(jù),其中,所述另外的查詢數(shù)據(jù)與所述查詢數(shù)據(jù)是相同的;以及響應(yīng)于所述接收所述另外的查詢數(shù)據(jù),通過不更新所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目來(lái)維持所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目。
[0107]在示例4中,如示例I至示例3中任一項(xiàng)所述的主題可以可選地包括:所述比較包括:從所述查詢值序列和所述目標(biāo)值序列中的每一個(gè)中的第一個(gè)值開始,成對(duì)地比較所述查詢值序列中的連續(xù)值與所述目標(biāo)值序列中的相應(yīng)連續(xù)值。
[0108]在示例5中,如示例I至示例4中任一項(xiàng)所述的主題可以可選地包括:所述從所述數(shù)據(jù)源檢索所述目標(biāo)值序列包括:從第一通信設(shè)備接收第一查詢數(shù)據(jù);基于與所述第一通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成第一位序列;以及將所述第一位序列存儲(chǔ)在所述數(shù)據(jù)存儲(chǔ)區(qū)中作為所述目標(biāo)值序列。
[0109]在示例6中,如示例5所述的主題可以可選地包括:所述從所述通信設(shè)備接收所述查詢數(shù)據(jù)包括:從第二通信設(shè)備接收第二查詢數(shù)據(jù),并且其中,基于與所述通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成所述查詢值序列包括基于與所述第二通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成第二位序列。
[0110]在示例7中,如示例6所述的主題可以可選地包括:所述生成第一位序列包括將散列函數(shù)應(yīng)用于與所述第一通信設(shè)備相關(guān)聯(lián)的所述標(biāo)識(shí)符以便生成所述第一位序列;并且可選地包括生成所述第二位序列包括將所述散列函數(shù)應(yīng)用于與所述第二通信設(shè)備相關(guān)聯(lián)的所述標(biāo)識(shí)符以便生成所述第二位序列。
[0111]在示例8中,如示例7所述的主題可以可選地包括:所述散列函數(shù)包括以下各項(xiàng)中的至少一項(xiàng):消息摘要算法、加密散列函數(shù)、消息摘要算法5(MD5)、安全散列算法I(SHAl)、或安全散列算法(SHA256)。
[0112]在示例9中,如示例1-8中任一項(xiàng)所述的主題可以可選地包括:所述查詢數(shù)據(jù)是文件的散列。
[0113]在示例10中,如示例1-9中任一項(xiàng)所述的主題可以可選地包括:所述查詢值序列是基于閾值確定的。
[0114]在示例11中,如示例2-10中任一項(xiàng)所述的主題可以可選地包括:基于所述流行率值的所述置信度對(duì)所述流行率值進(jìn)行加權(quán)。
[0115]在示例12中,如示例1-11中任一項(xiàng)所述的主題可以可選地包括:其中,所述流行率值包括對(duì)應(yīng)于數(shù)量級(jí)的至少一個(gè)值。
[0116]在示例13中,如示例2-12中任一項(xiàng)所述的主題可以可選地包括:所述置信度包括針對(duì)所述至少一個(gè)值計(jì)算的概率。
[0117]示例14是一種用于基于查詢提供流行率信息的裝置,所述裝置包括:至少一個(gè)存儲(chǔ)器元件;至少一個(gè)處理器,所述至少一個(gè)處理器耦合到所述至少一個(gè)存儲(chǔ)器元件上;信譽(yù)信息服務(wù)器,所述信譽(yù)信息服務(wù)器耦合到所述至少一個(gè)處理器上,其中,所述信譽(yù)信息服務(wù)器被配置成用于:從數(shù)據(jù)源檢索目標(biāo)值序列;從通信設(shè)備接收查詢數(shù)據(jù);基于與所述通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成查詢值序列;比較所述查詢值序列與所述目標(biāo)值序列以便標(biāo)識(shí)匹配值數(shù)目;并且至少部分地基于所述匹配值數(shù)目向所述通信設(shè)備輸出所述查詢數(shù)據(jù)的流行率值。
[0118]在示例15中,如示例14所述的主題可以可選地包括:所述信譽(yù)信息服務(wù)器被進(jìn)一步被配置成用于:在確定所述匹配值數(shù)目超過存儲(chǔ)在所述數(shù)據(jù)存儲(chǔ)區(qū)中的最大匹配數(shù)目時(shí),更新所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目;并且使用統(tǒng)計(jì)模型基于所述最大匹配數(shù)目來(lái)計(jì)算所述流行率值以及所述流行率值的置信度。
[0119]在示例16中,如示例14或15所述的主題可以可選地包括:所述信譽(yù)信息服務(wù)器被進(jìn)一步被配置成用于:從所述通信設(shè)備接收另外的查詢數(shù)據(jù),其中,所述另外的查詢數(shù)據(jù)與所述查詢數(shù)據(jù)是相同的;并且響應(yīng)于所述接收所述另外的查詢數(shù)據(jù),通過不更新所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目來(lái)維持所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目。
[0120]在示例17中,如示例14-16中任一項(xiàng)所述的主題可以可選地包括:所述比較包括:從所述查詢值序列和所述目標(biāo)值序列中的每一個(gè)中的第一個(gè)值開始,成對(duì)地比較所述查詢值序列中的連續(xù)值與所述目標(biāo)值序列中的相應(yīng)連續(xù)值。
[0121]在示例18中,如示例14-17中任一項(xiàng)所述的主題可以可選地包括:從所述數(shù)據(jù)源檢索所述目標(biāo)值序列包括:從第一通信設(shè)備接收第一查詢數(shù)據(jù);基于與所述第一通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成第一位序列;以及將所述第一位序列存儲(chǔ)在所述數(shù)據(jù)存儲(chǔ)區(qū)中作為所述目標(biāo)值序列。
[0122]在示例19中,如示例18所述的主題可以可選地包括:所述從所述通信設(shè)備接收所述查詢數(shù)據(jù)包括從第二通信設(shè)備接收第二查詢數(shù)據(jù),并且可選地包括基于與所述通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成所述查詢值序列包括基于與所述第二通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成第二位序列。
[0123]在示例20中,如示例19所述的主題可以可選地包括:所述生成第一位序列包括將散列函數(shù)應(yīng)用于與所述第一通信設(shè)備相關(guān)聯(lián)的所述標(biāo)識(shí)符以便生成所述第一位序列;并且可選地包括生成所述第二位序列包括將所述散列函數(shù)應(yīng)用于與所述第二通信設(shè)備相關(guān)聯(lián)的所述標(biāo)識(shí)符以便生成所述第二位序列。
[0124]在示例21中,如示例20所述的主題可以可選地包括:所述散列函數(shù)包括以下各項(xiàng)中的至少一項(xiàng):消息摘要算法、加密散列函數(shù)、消息摘要算法5(MD5)、安全散列算法I(SHAl)、或安全散列算法(SHA256)。
[0125]在示例22中,如示例14-21中任一項(xiàng)所述的主題可以可選地包括:所述查詢數(shù)據(jù)是文件的散列。
[0126]在示例23中,如示例14-22中任一項(xiàng)所述的主題可以可選地包括:所述查詢值序列是基于閾值確定的。
[0127]在示例24中,如示例15-23中任一項(xiàng)所述的主題可以可選地包括:所述信譽(yù)信息服務(wù)器被進(jìn)一步被配置成用于:基于所述流行率值的所述置信度對(duì)所述流行率值進(jìn)行加權(quán)。
[0128]在示例25中,如示例14-24中任一項(xiàng)所述的主題可以可選地包括:所述流行率值包括對(duì)應(yīng)于數(shù)量級(jí)的至少一個(gè)值。
[0129]在示例26中,如示例15-25中任一項(xiàng)所述的主題可以可選地包括:所述置信度包括針對(duì)所述至少一個(gè)值計(jì)算的概率。
[0130]示例27是一種用于基于查詢提供流行率信息的方法,所述方法包括:從數(shù)據(jù)源檢索目標(biāo)值序列;從通信設(shè)備接收查詢數(shù)據(jù);基于與所述通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成查詢值序列;比較所述查詢值序列與所述目標(biāo)值序列以便標(biāo)識(shí)匹配值數(shù)目;以及至少部分地基于所述匹配值數(shù)目向所述通信設(shè)備輸出所述查詢數(shù)據(jù)的流行率值。
[0131]在示例28中,如示例27所述的主題可以可選地包括:在確定所述匹配值數(shù)目超過存儲(chǔ)在所述數(shù)據(jù)存儲(chǔ)區(qū)中的最大匹配數(shù)目時(shí),更新所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目;以及使用統(tǒng)計(jì)模型基于所述最大匹配數(shù)目來(lái)計(jì)算所述流行率值以及所述流行率值的置信度。
[0132]在示例29中,如示例27或28所述的主題可以可選地包括:從所述通信設(shè)備接收另外的查詢數(shù)據(jù),其中,所述另外的查詢數(shù)據(jù)與所述查詢數(shù)據(jù)是相同的;以及響應(yīng)于所述接收所述另外的查詢數(shù)據(jù),通過不更新所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目來(lái)維持所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目。
[0133]在示例30中,如示例27-29中任一項(xiàng)所述的主題可以可選地包括:所述比較包括:從所述查詢值序列和所述目標(biāo)值序列中的每一個(gè)中的第一個(gè)值開始,成對(duì)地比較所述查詢值序列中的連續(xù)值與所述目標(biāo)值序列中的相應(yīng)連續(xù)值。
[0134]在示例31中,如示例27-30中任一項(xiàng)所述的主題可以可選地包括:從所述數(shù)據(jù)源檢索所述目標(biāo)值序列包括:從第一通信設(shè)備接收第一查詢數(shù)據(jù);基于與所述第一通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成第一位序列;以及將所述第一位序列存儲(chǔ)在所述數(shù)據(jù)存儲(chǔ)區(qū)中作為所述目標(biāo)值序列。
[0135]在示例32中,如示例31所述的主題可以可選地包括:所述從所述通信設(shè)備接收所述查詢數(shù)據(jù)包括從第二通信設(shè)備接收第二查詢數(shù)據(jù),并且可選地包括,基于與所述通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成所述查詢值序列包括基于與所述第二通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成第二位序列。
[0136]在示例33中,如示例32所述的主題可以可選地包括:所述生成第一位序列包括將散列函數(shù)應(yīng)用于與所述第一通信設(shè)備相關(guān)聯(lián)的所述標(biāo)識(shí)符以便生成所述第一位序列;并且可選地包括生成所述第二位序列包括將所述散列函數(shù)應(yīng)用于與所述第二通信設(shè)備相關(guān)聯(lián)的所述標(biāo)識(shí)符以便生成所述第二位序列。
[0137]在示例34中,如示例33所述的主題可以可選地包括:所述散列函數(shù)包括以下各項(xiàng)中的至少一項(xiàng):消息摘要算法、加密散列函數(shù)、消息摘要算法5(MD5)、安全散列算法I(SHAl)、或安全散列算法(SHA256)。
[0138]在示例35中,如示例27-34中任一項(xiàng)所述的主題可以可選地包括:所述查詢數(shù)據(jù)是文件的散列。
[0139]在示例36中,如示例27-35中任一項(xiàng)所述的主題可以可選地包括:所述查詢值序列是基于閾值確定的。
[0140]在示例37中,如示例28-36中任一項(xiàng)所述的主題可以可選地包括:基于所述流行率值的所述置信度對(duì)所述流行率值進(jìn)行加權(quán)。
[0141]在示例38中,如示例27-37中任一項(xiàng)所述的主題可以可選地包括:所述流行率值包括對(duì)應(yīng)于數(shù)量級(jí)的至少一個(gè)值。
[0142]在示例39中,如示例28-38中任一項(xiàng)所述的主題可以可選地包括:所述置信度包括針對(duì)所述至少一個(gè)值計(jì)算的概率。
[0143]示例40是一種用于基于查詢提供流行率信息的裝置,所述裝置包括:用于從數(shù)據(jù)源檢索目標(biāo)值序列的裝置;用于從通信設(shè)備接收查詢數(shù)據(jù)的裝置;用于基于與所述通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成查詢值序列的裝置;用于比較所述查詢值序列與所述目標(biāo)值序列以便標(biāo)識(shí)匹配值數(shù)目的裝置;以及用于至少部分地基于所述匹配值數(shù)目向所述通信設(shè)備輸出所述查詢數(shù)據(jù)的流行率值的裝置。
[0144]在示例41中,如示例40所述的主題可以可選地包括:用于在確定所述匹配值數(shù)目超過存儲(chǔ)在所述數(shù)據(jù)存儲(chǔ)區(qū)中的最大匹配數(shù)目時(shí)更新所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目的裝置;以及用于使用統(tǒng)計(jì)模型基于所述最大匹配數(shù)目來(lái)計(jì)算所述流行率值以及所述流行率值的置信度的裝置。
[0145]在示例42中,如示例40-41中任一項(xiàng)所述的主題可以可選地包括:用于從所述通信設(shè)備接收另外的查詢數(shù)據(jù)的裝置,其中,所述另外的查詢數(shù)據(jù)與所述查詢數(shù)據(jù)是相同的;以及用于響應(yīng)于所述接收所述另外的查詢數(shù)據(jù)而通過不更新所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目來(lái)維持所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目的裝置。
[0146]在示例43中,如示例40-42中任一項(xiàng)所述的主題可以可選地包括:所述比較包括:從所述查詢值序列和所述目標(biāo)值序列中的每一個(gè)中的第一個(gè)值開始,成對(duì)地比較所述查詢值序列中的連續(xù)值與所述目標(biāo)值序列中的相應(yīng)連續(xù)值。
[0147]在示例44中,如示例40-43中任一項(xiàng)所述的主題可以可選地包括:所述用于從所述數(shù)據(jù)源檢索所述目標(biāo)值序列的裝置包括:用于從第一通信設(shè)備接收第一查詢數(shù)據(jù)的裝置;用于基于與所述第一通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成第一位序列的裝置;以及用于將所述第一位序列存儲(chǔ)在所述數(shù)據(jù)存儲(chǔ)區(qū)中作為所述目標(biāo)值序列的裝置。
[0148]在示例45中,如示例44所述的主題可以可選地包括:所述用于從所述通信設(shè)備接收所述查詢數(shù)據(jù)的裝置包括用于從第二通信設(shè)備接收第二查詢數(shù)據(jù)的裝置;并且所述用于基于與所述通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成所述查詢值序列的裝置包括用于基于與所述第二通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成第二位序列的裝置。
[0149]在示例46中,如示例45所述的主題可以可選地包括:所述用于生成第一位序列的裝置包括用于將散列函數(shù)應(yīng)用于與所述第一通信設(shè)備相關(guān)聯(lián)的所述標(biāo)識(shí)符以便生成所述第一位序列的裝置;并且所述用于生成所述第二位序列的裝置包括用于將所述散列函數(shù)應(yīng)用于與所述第二通信設(shè)備相關(guān)聯(lián)的所述標(biāo)識(shí)符以便生成所述第二位序列的裝置。
[0150]在示例47中,如示例46所述的主題可以可選地包括:所述散列函數(shù)包括以下各項(xiàng)中的至少一項(xiàng):消息摘要算法、加密散列函數(shù)、消息摘要算法5(MD5)、安全散列算法I(SHAl)、或安全散列算法(SHA256)。
[0151]在示例48中,如示例40-47中任一項(xiàng)所述的主題可以可選地包括:所述查詢數(shù)據(jù)是文件的散列。
[0152]在示例49中,如示例40-48中任一項(xiàng)所述的主題可以可選地包括:所述查詢值序列是基于閾值確定的。
[0153]在示例50中,如示例41-49中任一項(xiàng)所述的主題可以可選地包括:用于基于所述流行率值的所述置信度對(duì)所述流行率值進(jìn)行加權(quán)的裝置。
[0154]在示例51中,如示例40-50中任一項(xiàng)所述的主題可以可選地包括:所述流行率值包括對(duì)應(yīng)于數(shù)量級(jí)的至少一個(gè)值。
[0155]在示例52中,如示例41-51中任一項(xiàng)所述的主題可以可選地包括:所述置信度包括針對(duì)所述至少一個(gè)值計(jì)算的概率。
[0156]示例53是一種用于基于查詢提供流行率信息的裝置,所述裝置包括用于執(zhí)行如權(quán)利要求27-39中任一項(xiàng)所述的方法的裝置。
[0157]在示例54中,如示例40所示的主題可以可選地包括:所述用于執(zhí)行所述方法的裝置包括至少一個(gè)處理器和至少一個(gè)存儲(chǔ)器元件。
[0158]在示例55中,如示例54所示的主題可以可選地包括:所述至少一個(gè)存儲(chǔ)器元件包括機(jī)器可讀指令,所述機(jī)器可讀指令在被執(zhí)行時(shí)使所述裝置執(zhí)行如權(quán)利要求27-39中任一項(xiàng)所述的方法。
[0159]在示例56中,如示例53-55所述的主題可以可選地包括:所述裝置是計(jì)算設(shè)備。
[0160]示例57是至少一種機(jī)器可讀存儲(chǔ)介質(zhì),包括用于基于查詢提供流行率信息的指令,其中,所述指令在被執(zhí)行時(shí)實(shí)施如示例27-39中任一項(xiàng)所述的方法或?qū)崿F(xiàn)如示例53-56中任一項(xiàng)所述的裝置。
[0161]示例58是至少一種機(jī)器可讀介質(zhì),包括代碼,所述代碼在被執(zhí)行時(shí)使機(jī)器執(zhí)行如權(quán)利要求27-39中任一項(xiàng)所述的方法。
[0162]在示例59中,如示例40所述的主題可以可選地包括:所述裝置是計(jì)算設(shè)備。
【主權(quán)項(xiàng)】
1.一種機(jī)器可讀非瞬態(tài)存儲(chǔ)介質(zhì),具有存儲(chǔ)在其上的用于基于查詢提供流行率信息的指令,其中,所述指令在由至少一個(gè)處理器執(zhí)行時(shí)使所述至少一個(gè)處理器執(zhí)行以下操作: 從數(shù)據(jù)源檢索目標(biāo)值序列; 從通信設(shè)備接收查詢數(shù)據(jù); 基于與所述通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成查詢值序列; 比較所述查詢值序列與所述目標(biāo)值序列以便標(biāo)識(shí)匹配值數(shù)目;以及 至少部分地基于所述匹配值數(shù)目向所述通信設(shè)備輸出所述查詢數(shù)據(jù)的流行率值。2.如權(quán)利要求1所述的機(jī)器可讀非瞬態(tài)存儲(chǔ)介質(zhì),進(jìn)一步包括: 在確定所述匹配值數(shù)目超過存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中的最大匹配數(shù)目時(shí),更新所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目;以及 使用統(tǒng)計(jì)模型基于所述最大匹配數(shù)目來(lái)計(jì)算所述流行率值以及所述流行率值的置信度。3.如權(quán)利要求1或2所述的機(jī)器可讀非瞬態(tài)存儲(chǔ)介質(zhì),進(jìn)一步包括: 從所述通信設(shè)備接收另外的查詢數(shù)據(jù),其中,所述另外的查詢數(shù)據(jù)與所述查詢數(shù)據(jù)是相同的;以及 響應(yīng)于接收所述另外的查詢數(shù)據(jù),通過不更新所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目來(lái)維持所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目。4.如權(quán)利要求1或2所述的機(jī)器可讀非瞬態(tài)存儲(chǔ)介質(zhì),其中,所述比較包括:從所述查詢值序列和所述目標(biāo)值序列中的每一個(gè)中的第一個(gè)值開始,成對(duì)地比較所述查詢值序列中的連續(xù)值與所述目標(biāo)值序列中的相應(yīng)連續(xù)值。5.如權(quán)利要求1或2所述的機(jī)器可讀非瞬態(tài)存儲(chǔ)介質(zhì),其中,從所述數(shù)據(jù)源檢索所述目標(biāo)值序列包括: 從第一通信設(shè)備接收第一查詢數(shù)據(jù); 基于與所述第一通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成第一位序列;以及 將所述第一位序列存儲(chǔ)在所述數(shù)據(jù)存儲(chǔ)區(qū)中作為所述目標(biāo)值序列。6.如權(quán)利要求5所述的機(jī)器可讀非瞬態(tài)存儲(chǔ)介質(zhì),其中,所述從所述通信設(shè)備接收所述查詢數(shù)據(jù)包括從第二通信設(shè)備接收第二查詢數(shù)據(jù),并且其中,基于與所述通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成所述查詢值序列包括基于與所述第二通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成第二位序列。7.如權(quán)利要求6所述的機(jī)器可讀非瞬態(tài)存儲(chǔ)介質(zhì),其中,所述生成第一位序列包括將散列函數(shù)應(yīng)用于與所述第一通信設(shè)備相關(guān)聯(lián)的所述標(biāo)識(shí)符以便生成所述第一位序列;并且其中,生成所述第二位序列包括將所述散列函數(shù)應(yīng)用于與所述第二通信設(shè)備相關(guān)聯(lián)的所述標(biāo)識(shí)符以便生成所述第二位序列。8.如權(quán)利要求7所述的機(jī)器可讀非瞬態(tài)存儲(chǔ)介質(zhì),其中,所述散列函數(shù)包括以下各項(xiàng)中的至少一項(xiàng):消息摘要算法、加密散列函數(shù)、消息摘要算法5(MD5)、安全散列算法I(SHAl)、或安全散列算法(SHA256)。9.如權(quán)利要求1或2所述的機(jī)器可讀非瞬態(tài)存儲(chǔ)介質(zhì),其中,所述查詢數(shù)據(jù)是文件的散列。10.如權(quán)利要求1或2所述的機(jī)器可讀非瞬態(tài)存儲(chǔ)介質(zhì),其中,所述查詢值序列的長(zhǎng)度是基于閾值確定的。11.如權(quán)利要求2所述的機(jī)器可讀非瞬態(tài)存儲(chǔ)介質(zhì),進(jìn)一步包括: 基于所述流行率值的所述置信度對(duì)所述流行率值進(jìn)行加權(quán)。12.如權(quán)利要求1或2所述的機(jī)器可讀非瞬態(tài)存儲(chǔ)介質(zhì),其中,所述流行率值包括對(duì)應(yīng)于數(shù)量級(jí)的至少一個(gè)值。13.如權(quán)利要求2所述的機(jī)器可讀非瞬態(tài)存儲(chǔ)介質(zhì),其中,所述置信度包括針對(duì)所述至少一個(gè)值計(jì)算的概率。14.一種用于基于查詢提供流行率信息的裝置,所述裝置包括: 至少一個(gè)存儲(chǔ)器元件; 至少一個(gè)處理器,所述至少一個(gè)處理器耦合到所述至少一個(gè)存儲(chǔ)器元件上; 信譽(yù)信息服務(wù)器,所述信譽(yù)信息服務(wù)器耦合到所述至少一個(gè)處理器上,其中,所述信譽(yù)信息服務(wù)器被配置成用于: 從數(shù)據(jù)源檢索目標(biāo)值序列; 從通信設(shè)備接收查詢數(shù)據(jù); 基于與所述通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成查詢值序列; 比較所述查詢值序列與所述目標(biāo)值序列以便標(biāo)識(shí)匹配值數(shù)目;并且 至少部分地基于所述匹配值數(shù)目向所述通信設(shè)備輸出所述查詢數(shù)據(jù)的流行率值。15.如權(quán)利要求14所述的裝置,其中,所述信譽(yù)信息服務(wù)器進(jìn)一步被配置成用于: 在確定所述匹配值數(shù)目超過存儲(chǔ)在所述數(shù)據(jù)存儲(chǔ)區(qū)中的最大匹配數(shù)目時(shí),更新所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目;并且 使用統(tǒng)計(jì)模型基于所述最大匹配數(shù)目來(lái)計(jì)算所述流行率值以及所述流行率值的置信度。16.如權(quán)利要求14或15所述的裝置,其中,所述信譽(yù)信息服務(wù)器進(jìn)一步被配置成用于: 從所述通信設(shè)備接收另外的查詢數(shù)據(jù),其中,所述另外的查詢數(shù)據(jù)與所述查詢數(shù)據(jù)是相同的;并且 響應(yīng)于所述接收所述另外的查詢數(shù)據(jù),通過不更新所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目來(lái)維持所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目。17.如權(quán)利要求14或15所述的裝置,其中,從所述數(shù)據(jù)源檢索所述目標(biāo)值序列包括: 從第一通信設(shè)備接收第一查詢數(shù)據(jù); 基于與所述第一通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成第一位序列;以及 將所述第一位序列存儲(chǔ)在所述數(shù)據(jù)存儲(chǔ)區(qū)中作為所述目標(biāo)值序列。18.如權(quán)利要求17所述的裝置,其中,所述從所述通信設(shè)備接收所述查詢數(shù)據(jù)包括從第二通信設(shè)備接收第二查詢數(shù)據(jù),并且其中,基于與所述通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成所述查詢值序列包括基于與所述第二通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成第二位序列。19.如權(quán)利要求18所述的裝置,其中,所述生成第一位序列包括將散列函數(shù)應(yīng)用于與所述第一通信設(shè)備相關(guān)聯(lián)的所述標(biāo)識(shí)符以便生成所述第一位序列;并且其中,生成所述第二位序列包括將所述散列函數(shù)應(yīng)用于與所述第二通信設(shè)備相關(guān)聯(lián)的所述標(biāo)識(shí)符以便生成所述第二位序列。20.—種用于基于查詢提供流行率信息的方法,所述方法包括: 從數(shù)據(jù)源檢索目標(biāo)值序列; 從通信設(shè)備接收查詢數(shù)據(jù); 基于與所述通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成查詢值序列; 比較所述查詢值序列與所述目標(biāo)值序列以便標(biāo)識(shí)匹配值數(shù)目;以及 至少部分地基于所述匹配值數(shù)目向所述通信設(shè)備輸出所述查詢數(shù)據(jù)的流行率值。21.如權(quán)利要求20所述的方法,進(jìn)一步包括: 在確定所述匹配值數(shù)目超過存儲(chǔ)在數(shù)據(jù)存儲(chǔ)區(qū)中的最大匹配數(shù)目時(shí),更新所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目;以及 使用統(tǒng)計(jì)模型基于所述最大匹配數(shù)目來(lái)計(jì)算所述流行率值以及所述流行率值的置信度。22.如權(quán)利要求20或21所述的方法,進(jìn)一步包括: 從所述通信設(shè)備接收另外的查詢數(shù)據(jù),其中,所述另外的查詢數(shù)據(jù)與所述查詢數(shù)據(jù)是相同的;以及 響應(yīng)于所述接收所述另外的查詢數(shù)據(jù),通過不更新所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目來(lái)維持所述數(shù)據(jù)存儲(chǔ)區(qū)中的所述最大匹配數(shù)目。23.如權(quán)利要求20或21所述的方法,其中,從所述數(shù)據(jù)源檢索所述目標(biāo)值序列包括: 從第一通信設(shè)備接收第一查詢數(shù)據(jù); 基于與所述第一通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成第一位序列;以及 將所述第一位序列存儲(chǔ)在所述數(shù)據(jù)存儲(chǔ)區(qū)中作為所述目標(biāo)值序列。24.如權(quán)利要求23所述的方法,其中,所述從所述通信設(shè)備接收所述查詢數(shù)據(jù)包括從第二通信設(shè)備接收第二查詢數(shù)據(jù),并且其中,基于與所述通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成所述查詢值序列包括基于與所述第二通信設(shè)備相關(guān)聯(lián)的標(biāo)識(shí)符生成第二位序列。
【文檔編號(hào)】G06F17/30GK106062749SQ201580010965
【公開日】2016年10月26日
【申請(qǐng)日】2015年2月28日
【發(fā)明人】R·莫里, G·羅伯茨, R·文努戈帕蘭, N·威爾森
【申請(qǐng)人】邁克菲股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1