垃圾郵件的識(shí)別方法及裝置與流程

文檔序號(hào)：11253862閱讀：1318來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

本發(fā)明涉及垃圾郵件識(shí)別技術(shù)，尤其涉及一種垃圾郵件的識(shí)別方法及裝置。
背景技術(shù)：
：隨著互聯(lián)網(wǎng)的廣泛普及，郵件已經(jīng)成為常用的通信工具之一，但用戶常會(huì)收到各種垃圾郵件，嚴(yán)重影響用戶對(duì)正常郵件的查收和處理。因此，識(shí)別垃圾郵件越來越重要。目前基于概率統(tǒng)計(jì)的貝葉斯識(shí)別技術(shù)為常用的識(shí)別垃圾郵件技術(shù)，該技術(shù)會(huì)收集大量的正常郵件樣本和垃圾郵件樣本，把正常郵件樣本和垃圾郵件樣本的內(nèi)容進(jìn)行分詞，統(tǒng)計(jì)各個(gè)分詞在正常郵件樣本和垃圾郵件樣本的次數(shù)。然而，基于概率統(tǒng)計(jì)的貝葉斯識(shí)別技術(shù)對(duì)于不適合分詞的垃圾信息(如圖片等)識(shí)別的效果不佳，現(xiàn)亟需一種識(shí)別準(zhǔn)確率較高的識(shí)別垃圾郵件技術(shù)。技術(shù)實(shí)現(xiàn)要素：本發(fā)明提供一種垃圾郵件的識(shí)別方法及裝置，以解決現(xiàn)有的基于概率統(tǒng)計(jì)的貝葉斯識(shí)別技術(shù)識(shí)別準(zhǔn)確率較低的問題。本發(fā)明提供一種垃圾郵件的識(shí)別方法，包括：接收郵件并對(duì)所述郵件進(jìn)行解析，以獲取所述郵件的ip地址和郵件內(nèi)容，其中所述郵件內(nèi)容包括主題、正文和附件；通過預(yù)設(shè)校驗(yàn)算法，對(duì)所述郵件內(nèi)容進(jìn)行計(jì)算，得到所述郵件的校驗(yàn)碼；判斷所述郵件的校驗(yàn)碼是否存在于垃圾郵件樣本中，其中，所述垃圾郵件樣本中存儲(chǔ)有不同的垃圾郵件對(duì)應(yīng)的校驗(yàn)碼；若所述郵件的校驗(yàn)碼存在于所述垃圾郵件樣本中，則識(shí)別所述郵件為垃圾郵件?？蛇x地，若所述郵件的校驗(yàn)碼不存在于所述垃圾郵件樣本中，所述方法還包括：針對(duì)已接收到的郵件的ip值和校驗(yàn)碼，判斷所述郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值，所述郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址包括與所述郵件的校驗(yàn)碼相同的校驗(yàn)碼所對(duì)應(yīng)的已接收到的郵件的ip地址和所述郵件的ip地址；若所述個(gè)數(shù)大于預(yù)設(shè)閾值，則識(shí)別所述郵件為垃圾郵件，并將所述郵件的校驗(yàn)碼寫入到所述垃圾郵件樣本中；若所述個(gè)數(shù)小于預(yù)設(shè)閾值，則識(shí)別所述郵件為正常郵件。可選地，所述針對(duì)已接收到的郵件的校驗(yàn)碼和ip值，判斷所述郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值，包括：判斷臨時(shí)緩存中是否存儲(chǔ)有與所述郵件的校驗(yàn)碼相同的校驗(yàn)碼，所述臨時(shí)緩存中存儲(chǔ)有所述已接收到的郵件對(duì)應(yīng)的不同的校驗(yàn)碼和各所述校驗(yàn)碼對(duì)應(yīng)的ip地址集合；若是，則將所述郵件的ip地址寫入到與所述郵件的校驗(yàn)碼相同的校驗(yàn)碼對(duì)應(yīng)的ip地址集合中，并判斷所述相同的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值；若否，則將所述郵件的校驗(yàn)碼和ip地址寫入到所述臨時(shí)緩存中?？蛇x地，所述方法還包括：獲取所述臨時(shí)緩存中寫入校驗(yàn)碼的寫入時(shí)刻距當(dāng)前時(shí)刻的間隔時(shí)長；判斷所述間隔時(shí)長是否大于預(yù)設(shè)時(shí)長；若是，則釋放所述臨時(shí)緩存?？蛇x地，所述預(yù)設(shè)校驗(yàn)算法包括md5算法或sha1算法。本發(fā)明還提供一種垃圾郵件的識(shí)別裝置，包括：獲取模塊，用于接收郵件并對(duì)所述郵件進(jìn)行解析，以獲取所述郵件的ip地址和郵件內(nèi)容，其中所述郵件內(nèi)容包括主題、正文和附件；計(jì)算模塊，用于通過預(yù)設(shè)校驗(yàn)算法，對(duì)所述郵件內(nèi)容進(jìn)行計(jì)算，得到所述郵件的校驗(yàn)碼；判斷模塊，用于判斷所述郵件的校驗(yàn)碼是否存在于垃圾郵件樣本中，其中，所述垃圾郵件樣本中存儲(chǔ)有不同的垃圾郵件對(duì)應(yīng)的校驗(yàn)碼。確認(rèn)模塊，用于在所述郵件的校驗(yàn)碼存在于所述垃圾郵件樣本中時(shí)，識(shí)別所述郵件為垃圾郵件。可選地，所述判斷模塊，還用于針對(duì)已接收到的郵件的校驗(yàn)碼和ip值，判斷所述郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值，所述郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址包括與所述郵件的校驗(yàn)碼相同的校驗(yàn)碼所對(duì)應(yīng)的已接收到的郵件的ip地址和所述郵件的ip地址。所述確認(rèn)模塊，還用于在所述個(gè)數(shù)大于預(yù)設(shè)閾值時(shí)，識(shí)別所述郵件為垃圾郵件，并將所述郵件的校驗(yàn)碼寫入到所述垃圾郵件樣本中；所述確認(rèn)模塊，還用于在所述個(gè)數(shù)小于預(yù)設(shè)閾值時(shí)，識(shí)別所述郵件為正常郵件?？蛇x地，所述判斷模塊，具體用于判斷臨時(shí)緩存中是否存儲(chǔ)有與所述郵件的校驗(yàn)碼相同的校驗(yàn)碼，所述臨時(shí)緩存中存儲(chǔ)有所述已接收到的郵件對(duì)應(yīng)的不同的校驗(yàn)碼和各所述校驗(yàn)碼對(duì)應(yīng)的ip地址集合。所述確認(rèn)模塊，具體用于在所述判斷模塊的判斷結(jié)果為是時(shí)，將所述郵件的ip地址寫入到與所述郵件的校驗(yàn)碼相同的校驗(yàn)碼對(duì)應(yīng)的ip地址集合中，并判斷所述相同的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值；在所述判斷模塊的判斷結(jié)果為否時(shí)，將所述郵件的校驗(yàn)碼和ip地址寫入到所述臨時(shí)緩存中。可選地，所述獲取模塊，還用于獲取所述臨時(shí)緩存中寫入校驗(yàn)碼的寫入時(shí)刻距當(dāng)前時(shí)刻的間隔時(shí)長；所述判斷模塊，還具體用于判斷所述間隔時(shí)長是否大于預(yù)設(shè)時(shí)長。釋放模塊，具體用于在所述判斷模塊的判斷結(jié)果為是時(shí)，識(shí)別所述郵件為正常郵件，并釋放所述臨時(shí)緩存?？蛇x地，所述預(yù)設(shè)校驗(yàn)算法包括md5算法或sha1算法。本發(fā)明提供的垃圾郵件的識(shí)別方法及裝置，該方法通過接收郵件并對(duì)郵件進(jìn)行解析，以獲取郵件的ip地址和郵件內(nèi)容，再通過預(yù)設(shè)校驗(yàn)算法，對(duì)郵件內(nèi)容進(jìn)行計(jì)算，得到郵件的校驗(yàn)碼，接著判斷郵件的校驗(yàn)碼是否存在于垃圾郵件樣本中，其中，垃圾郵件樣本中存儲(chǔ)有不同的垃圾郵件對(duì)應(yīng)的校驗(yàn)碼。若郵件的校驗(yàn)碼存在于垃圾郵件樣本中，則識(shí)別郵件為垃圾郵件。本發(fā)明提供的方法以及裝置以多個(gè)ip地址發(fā)送相同郵件內(nèi)容的垃圾郵件為特征，將郵件內(nèi)容對(duì)應(yīng)的校驗(yàn)碼存在垃圾郵件樣本中，對(duì)接收的郵件進(jìn)行判斷是否為垃圾郵件，解決了現(xiàn)有概率統(tǒng)計(jì)的貝葉斯識(shí)別技術(shù)準(zhǔn)確率較低的問題，且過程簡單、高效，提升了垃圾郵件的識(shí)別率。附圖說明圖1為本發(fā)明提供的垃圾郵件的識(shí)別方法的場景示意圖；圖2為本發(fā)明提供的垃圾郵件的識(shí)別方法的流程圖一；圖3為本發(fā)明提供的垃圾郵件的識(shí)別方法的流程圖二；圖4為本發(fā)明提供的垃圾郵件的識(shí)別方法中一種存儲(chǔ)方式的流程圖；圖5為本發(fā)明提供的垃圾郵件的識(shí)別方法中一種釋放方式的流程圖；圖6為本發(fā)明提供的垃圾郵件的識(shí)別裝置的結(jié)構(gòu)示意圖。具體實(shí)施方式圖1為本發(fā)明提供的垃圾郵件的識(shí)別方法的場景示意圖，如圖1所示，郵件是由外域服務(wù)器或本域服務(wù)器發(fā)送的郵件，再由郵件服務(wù)器進(jìn)行接收。通常，發(fā)送者在外域服務(wù)器或本域服務(wù)器上會(huì)發(fā)送大量的垃圾郵件，若這些垃圾郵件僅僅是通過單個(gè)ip地址進(jìn)行發(fā)送，這個(gè)ip地址很容易被發(fā)現(xiàn)，進(jìn)而會(huì)被攔截。因此，發(fā)送者會(huì)使用大量的ip地址發(fā)送垃圾郵件。本實(shí)施例可利用郵件服務(wù)器能夠接收到由不同ip地址發(fā)送的相同內(nèi)容的大量郵件的特征對(duì)這些郵件進(jìn)行識(shí)別，以識(shí)別出該郵件是垃圾郵件還是正常郵件。圖2為本發(fā)明提供的垃圾郵件的識(shí)別方法的流程圖一，本實(shí)施例的執(zhí)行主體可以為圖1所示的郵件服務(wù)器，如圖2所示，本實(shí)施例垃圾郵件的識(shí)別方法包括：s201、接收郵件并對(duì)郵件進(jìn)行解析，以獲取郵件的ip地址和郵件內(nèi)容，其中郵件內(nèi)容包括主題、正文和附件。具體地，由大量的ip地址發(fā)送的垃圾郵件的內(nèi)容是相同的，這樣垃圾郵件的主題、正文和附件也就是相同的。對(duì)接收到的郵件進(jìn)行解析，可得到該郵件的各種信息，如郵件頭、時(shí)間戳、發(fā)送者、接收者、郵件內(nèi)容以及郵件的ip地址。但是郵件頭、時(shí)間戳、發(fā)送者、接收者會(huì)對(duì)識(shí)別該郵件是否為垃圾郵件產(chǎn)生影響，進(jìn)而做出錯(cuò)誤的判斷。而郵件內(nèi)容為郵件的實(shí)質(zhì)性內(nèi)容，因此，本實(shí)施例中解析獲取的郵件內(nèi)容是通過對(duì)該郵件的本質(zhì)內(nèi)容進(jìn)行識(shí)別。又由于郵件的ip地址為唯一的，且與該郵件內(nèi)容相同的郵件的個(gè)數(shù)相對(duì)應(yīng)，進(jìn)而可結(jié)合郵件內(nèi)容與郵件的ip地址對(duì)發(fā)送者會(huì)利用大量的ip地址發(fā)送大量的內(nèi)容相同的垃圾郵件這個(gè)特征進(jìn)行表征，以完成對(duì)垃圾郵件的識(shí)別。因此，本實(shí)施例中在接收到郵件時(shí)，可對(duì)該郵件進(jìn)行解析，以得到該郵件的ip地址和郵件內(nèi)容。本實(shí)施例對(duì)郵件的ip地址和郵件內(nèi)容的具體形式不做限定，只需滿足郵件的ip地址和郵件內(nèi)容能夠表征該郵件即可。為了便于對(duì)郵件的識(shí)別，可將郵件的ip地址和郵件內(nèi)容解析為計(jì)算機(jī)二進(jìn)制機(jī)器語言。s202、通過預(yù)設(shè)校驗(yàn)算法，對(duì)郵件內(nèi)容進(jìn)行計(jì)算，得到郵件的校驗(yàn)碼。具體地，在獲得郵件內(nèi)容后，通過預(yù)設(shè)校驗(yàn)算法計(jì)算郵件內(nèi)容對(duì)應(yīng)的校驗(yàn)碼，其中郵件的校驗(yàn)碼為唯一的，對(duì)應(yīng)的，郵件內(nèi)容便可唯一表征該郵件。本實(shí)施例中預(yù)設(shè)校驗(yàn)算法由很多種實(shí)現(xiàn)形式，只需滿足該預(yù)設(shè)校驗(yàn)算法計(jì)算郵件內(nèi)容得到的郵件的校驗(yàn)碼為唯一的即可?？蛇x地，預(yù)設(shè)校驗(yàn)算法包括md5算法或sha1算法。具體地，本實(shí)施例可采用md5算法對(duì)郵件內(nèi)容計(jì)算得到md5碼。由于md5碼有128位那么長，因此，任意郵件的郵件內(nèi)容之間具有相同md5碼的可能性非常低，通常被認(rèn)為是不可能的。這樣，當(dāng)郵件為垃圾郵件時(shí)，便可很容易找到相同的md5碼；當(dāng)郵件為正常郵件時(shí)，便很難找到相同的md5碼。本實(shí)施例采用sha1算法得到sha1碼并將sha1碼作為郵件的校驗(yàn)碼判斷郵件是否為垃圾郵件的過程與采用md5算法識(shí)別垃圾郵件的過程類似，本實(shí)施例對(duì)此不做限定。s203、判斷郵件的校驗(yàn)碼是否存在于垃圾郵件樣本中，其中，垃圾郵件樣本中存儲(chǔ)有不同的垃圾郵件對(duì)應(yīng)的校驗(yàn)碼。s204、若郵件的校驗(yàn)碼存在于垃圾郵件樣本中，則識(shí)別郵件為垃圾郵件。具體地，本實(shí)施例可直接利用垃圾郵件樣本中存儲(chǔ)的校驗(yàn)碼判斷該郵件是否為垃圾郵件，由于垃圾郵件樣本存儲(chǔ)著不同垃圾郵件對(duì)應(yīng)的校驗(yàn)碼，當(dāng)計(jì)算得到該郵件的校驗(yàn)碼后，便可在垃圾郵件樣本中搜索，看能否找到相同的校驗(yàn)碼。當(dāng)該郵件的校驗(yàn)碼存在與垃圾郵件樣本中，便可快速、準(zhǔn)確的識(shí)別出該郵件為垃圾郵件。本實(shí)施例提供的垃圾郵件的識(shí)別方法，通過接收郵件并對(duì)郵件進(jìn)行解析，以獲取郵件的ip地址和郵件內(nèi)容，再通過預(yù)設(shè)校驗(yàn)算法，對(duì)郵件內(nèi)容進(jìn)行計(jì)算，得到郵件的校驗(yàn)碼，接著判斷郵件的校驗(yàn)碼是否存在于垃圾郵件樣本中，其中，垃圾郵件樣本中存儲(chǔ)有不同的垃圾郵件對(duì)應(yīng)的校驗(yàn)碼。若郵件的校驗(yàn)碼存在于垃圾郵件樣本中，則識(shí)別郵件為垃圾郵件。即本實(shí)施例以多個(gè)ip地址發(fā)送相同郵件內(nèi)容的垃圾郵件為特征，將郵件內(nèi)容對(duì)應(yīng)的校驗(yàn)碼存在垃圾郵件樣本中，對(duì)接收的郵件進(jìn)行判斷是否為垃圾郵件，解決了現(xiàn)有概率統(tǒng)計(jì)的貝葉斯識(shí)別技術(shù)準(zhǔn)確率較低的問題，且過程簡單、高效，提升了垃圾郵件的識(shí)別率?，F(xiàn)有的基于概率統(tǒng)計(jì)的貝葉斯識(shí)別技術(shù)往往需要通過用戶舉報(bào)等方式中得到正常郵件樣本和垃圾郵件樣本才能夠識(shí)別垃圾郵件，時(shí)效性會(huì)嚴(yán)重滯后。然而本實(shí)施例可將識(shí)別過程化被動(dòng)為主動(dòng)，其中垃圾郵件樣本可直接通過接收到的郵件獲得，而并不是事先由用戶舉報(bào)等方式獲得的垃圾郵件樣本。下面結(jié)合圖3，對(duì)本實(shí)施例垃圾郵件的識(shí)別方法的具體實(shí)現(xiàn)方式進(jìn)行詳細(xì)說明。圖3為本發(fā)明提供的垃圾郵件的識(shí)別方法的流程圖二，如圖3所示，該方法包括：s301、接收郵件并對(duì)郵件進(jìn)行解析，以獲取郵件的ip地址和郵件內(nèi)容，其中郵件內(nèi)容包括主題、正文和附件。s302、通過預(yù)設(shè)校驗(yàn)算法，對(duì)郵件內(nèi)容進(jìn)行計(jì)算，得到郵件的校驗(yàn)碼。s303、判斷郵件的校驗(yàn)碼是否存在于垃圾郵件樣本中，其中，垃圾郵件樣本中存儲(chǔ)有不同的垃圾郵件對(duì)應(yīng)的校驗(yàn)碼；若是，則執(zhí)行s304，若否，則執(zhí)行s305。s304、識(shí)別郵件為垃圾郵件。其中，s301、s302、s303與s304與圖2實(shí)施例中的s201、s202、s203與s204等實(shí)現(xiàn)方式類似，本實(shí)施例此處不再贅述。s305、針對(duì)已接收到的郵件的ip值和校驗(yàn)碼，判斷郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值，郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址包括與郵件的校驗(yàn)碼相同的校驗(yàn)碼所對(duì)應(yīng)的已接收到的郵件的ip地址和郵件的ip地址。具體地，已收到的郵件是由郵件服務(wù)器接收到該郵件之前的郵件，本實(shí)施例可將已接收到的郵件的校驗(yàn)碼和ip值保存在臨時(shí)緩存或數(shù)據(jù)庫中。根據(jù)該郵件的校驗(yàn)碼，可在已收到的郵件中確定與該郵件的校驗(yàn)碼相同的檢驗(yàn)碼對(duì)應(yīng)的ip地址的個(gè)數(shù)。因此，需要將該郵件的ip地址與之前已經(jīng)收到的郵件相同校驗(yàn)碼對(duì)應(yīng)的ip地址之和作為郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)，接著判斷郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閾值，其中，預(yù)設(shè)閾值可根據(jù)經(jīng)驗(yàn)進(jìn)行設(shè)定，本實(shí)施例對(duì)此不做限定。進(jìn)一步地，本實(shí)施例中無論在已收到的郵件中是否能夠找到與該郵件的校驗(yàn)碼相同的校驗(yàn)碼對(duì)應(yīng)的ip地址，在判斷過程中，都應(yīng)該將已收到的郵件的ip地址與該郵件的ip地址之和得到的總個(gè)數(shù)與預(yù)設(shè)閥值進(jìn)行比較。進(jìn)一步地，無論采用上述哪種存儲(chǔ)方式，在計(jì)算得到相同校驗(yàn)碼的郵件對(duì)應(yīng)的ip地址的個(gè)數(shù)之后，若個(gè)數(shù)大于預(yù)設(shè)閾值，則執(zhí)行s306；若個(gè)數(shù)小于預(yù)設(shè)閾值，則執(zhí)行s307。為了便于說明，本實(shí)施例可將已接收到的郵件的校驗(yàn)碼和ip值保存在臨時(shí)緩存中。s306、識(shí)別郵件為垃圾郵件，并將郵件的校驗(yàn)碼寫入到垃圾郵件樣本中。s307、識(shí)別郵件為正常郵件。具體地，當(dāng)郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)大于預(yù)設(shè)閾值時(shí)，該郵件為垃圾郵件，且將該郵件的校驗(yàn)碼寫入到垃圾郵件樣本中。當(dāng)郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)小于預(yù)設(shè)閾值時(shí)，該郵件為正常郵件。本實(shí)施例可對(duì)接收的郵件能夠及時(shí)、快速進(jìn)行識(shí)別，以區(qū)分是正常郵件還是垃圾郵件，過程簡單、高效且不會(huì)依賴于事先由用戶舉報(bào)等方式獲得的垃圾郵件樣本。而且，本實(shí)施例不僅可接收其他識(shí)別垃圾郵件方法過濾得到的正常郵件，還可將區(qū)分得到的正常郵件采用其他識(shí)別垃圾郵件方法進(jìn)行再次識(shí)別，以實(shí)現(xiàn)垃圾郵件的過濾。在上述圖3實(shí)施例的基礎(chǔ)上，在步驟305中本實(shí)施例可采用多種存儲(chǔ)方式將已接收到的郵件的校驗(yàn)碼和ip值保存在臨時(shí)緩存中。一種可行的存儲(chǔ)方式，如表1所示，本實(shí)施例具體可將郵件的校驗(yàn)碼和ip地址一起一組一組的存入到臨時(shí)緩存中。例如，存入郵件一的校驗(yàn)碼一和ip地址一，存入郵件二的校驗(yàn)碼二和ip地址二，存入郵件三的校驗(yàn)碼三和ip地址三，……，等等，其中校驗(yàn)碼一、校驗(yàn)碼二和校驗(yàn)碼三可能相同也可能不同。本實(shí)施例中無論已接收到的檢驗(yàn)碼是否相同，都會(huì)將郵件的校驗(yàn)碼和ip地址一組組直接存儲(chǔ)到臨時(shí)緩存中。表1臨時(shí)緩存中郵件的檢驗(yàn)碼和ip地址的存儲(chǔ)方式一校驗(yàn)碼一ip地址一校驗(yàn)碼二ip地址二校驗(yàn)碼三ip地址三…………另一種可行的存儲(chǔ)方式，如表2所示，本實(shí)施例具體還可將郵件的不同的校驗(yàn)碼和各校驗(yàn)碼對(duì)應(yīng)的ip地址集合的方式存到臨時(shí)緩中，即相同的校驗(yàn)碼對(duì)應(yīng)的ip地址寫入一個(gè)集合中，不同的檢驗(yàn)碼對(duì)應(yīng)的ip地址寫入到另一個(gè)集合中。例如，在已收到的郵件中，將相同的校驗(yàn)碼的郵件對(duì)應(yīng)的ip地址寫入到ip地址集合中，其中校驗(yàn)碼為校驗(yàn)碼一的郵件對(duì)應(yīng)的ip地址一、ip地址二等放入到一個(gè)集合中，校驗(yàn)碼為校驗(yàn)碼二的郵件對(duì)應(yīng)的ip地址三、ip地址四等放入到一個(gè)集合中，校驗(yàn)碼為校驗(yàn)碼三的郵件對(duì)應(yīng)的ip地址五、ip地址六等放入到一個(gè)集合中等等，校驗(yàn)碼一、校驗(yàn)碼二和校驗(yàn)碼三皆不相同。表2臨時(shí)緩存中郵件的檢驗(yàn)碼和ip地址的存儲(chǔ)方式二校驗(yàn)碼一(ip地址一，ip地址二，……)校驗(yàn)碼二(ip地址三，ip地址四，……)校驗(yàn)碼三(ip地址五，ip地址六，……)…………進(jìn)一步地，本實(shí)施例對(duì)郵件的校驗(yàn)碼和ip值的存儲(chǔ)方式不做限定。為了方便說明，結(jié)合圖4，本實(shí)施例s305中通過將郵件的不同的校驗(yàn)碼和各校驗(yàn)碼對(duì)應(yīng)的ip地址集合的方式存到臨時(shí)緩存中這一具體的存儲(chǔ)方式進(jìn)行具體說明。圖4為本發(fā)明提供的垃圾郵件的識(shí)別方法中一種存儲(chǔ)方式的流程圖，如圖4所示，該方法包括：s401、判斷臨時(shí)緩存中是否存儲(chǔ)有與郵件的校驗(yàn)碼相同的校驗(yàn)碼，臨時(shí)緩存中存儲(chǔ)有已接收到的郵件對(duì)應(yīng)的不同的校驗(yàn)碼和各校驗(yàn)碼對(duì)應(yīng)的ip地址集合。若是，則執(zhí)行s402；若否，則執(zhí)行s403。s402、將郵件的ip地址寫入到與郵件的校驗(yàn)碼相同的校驗(yàn)碼對(duì)應(yīng)的ip地址集合中，并判斷相同的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值。s403、將郵件的校驗(yàn)碼和ip地址寫入到臨時(shí)緩存中。具體地，由于臨時(shí)緩存中已經(jīng)存儲(chǔ)了已接收到的郵件對(duì)應(yīng)的校驗(yàn)碼和ip地址，因此，可直接判斷臨時(shí)緩存中是否存儲(chǔ)有與該郵件的校驗(yàn)碼相同的校驗(yàn)碼。若臨時(shí)緩存中存儲(chǔ)有與該郵件的校驗(yàn)碼相同的校驗(yàn)碼，則將該郵件的ip地址存儲(chǔ)到相同校驗(yàn)碼對(duì)應(yīng)的ip地址集合中，再計(jì)算相同校驗(yàn)碼對(duì)應(yīng)的ip地址的個(gè)數(shù)。若臨時(shí)緩存中沒存儲(chǔ)有與該郵件的校驗(yàn)碼相同的校驗(yàn)碼，則將該郵件的校驗(yàn)碼和ip地址都存儲(chǔ)到臨時(shí)緩存中，則該郵件的校驗(yàn)碼對(duì)應(yīng)的ip地址的個(gè)數(shù)為1。在上述圖3實(shí)施例的基礎(chǔ)上，由于臨時(shí)緩存中存儲(chǔ)著大量校驗(yàn)碼占用內(nèi)存，會(huì)影響識(shí)別垃圾郵件的速率。為了加快垃圾郵件的識(shí)別速率，結(jié)合圖5，對(duì)本實(shí)施例中釋放臨時(shí)緩存的具體過程進(jìn)行詳細(xì)說明。圖5為本發(fā)明提供的垃圾郵件的識(shí)別方法中一種釋放方式的流程圖，如圖5所示，該方法還包括：s501、獲取臨時(shí)緩存中寫入校驗(yàn)碼的寫入時(shí)刻距當(dāng)前時(shí)刻的間隔時(shí)長。具體地，由于臨時(shí)緩存會(huì)在預(yù)設(shè)時(shí)長之后釋放變?yōu)榭?，因此，本?shí)施例可會(huì)記錄向空的臨時(shí)緩存寫入校驗(yàn)碼的寫入時(shí)刻，再用當(dāng)前時(shí)刻減去寫入時(shí)刻得到間隔時(shí)長，這樣隨著時(shí)間的流逝，間隔時(shí)長會(huì)越來越大。s502、判斷間隔時(shí)長是否大于預(yù)設(shè)時(shí)長，若是，則執(zhí)行s503；若否，則返回執(zhí)行s301。s503、釋放臨時(shí)緩存。具體地，本實(shí)施例中預(yù)設(shè)時(shí)長可為經(jīng)驗(yàn)設(shè)置，可為半天，也可為1個(gè)小時(shí)，本實(shí)施例對(duì)此不做限定。若間隔時(shí)長大于預(yù)設(shè)時(shí)長，則釋放臨時(shí)緩存，這樣臨時(shí)緩存的存儲(chǔ)內(nèi)容不會(huì)占用過多的資源，識(shí)別效率變高。若間隔時(shí)長小于預(yù)設(shè)時(shí)長，則不釋放臨時(shí)緩存，繼續(xù)接收新的郵件執(zhí)行s301，直至識(shí)別出該郵件是否為垃圾郵件還是正常郵件。圖6為本發(fā)明提供的垃圾郵件的識(shí)別裝置的結(jié)構(gòu)示意圖，如圖6所示，本實(shí)施例垃圾郵件的識(shí)別裝置包括：獲取模塊10，用于接收郵件并對(duì)郵件進(jìn)行解析，以獲取郵件的ip地址和郵件內(nèi)容，其中郵件內(nèi)容包括主題、正文和附件；計(jì)算模塊20，用于通過預(yù)設(shè)校驗(yàn)算法，對(duì)郵件內(nèi)容進(jìn)行計(jì)算，得到郵件的校驗(yàn)碼；判斷模塊30，用于判斷郵件的校驗(yàn)碼是否存在于垃圾郵件樣本中，其中，垃圾郵件樣本中存儲(chǔ)有不同的垃圾郵件對(duì)應(yīng)的校驗(yàn)碼。確認(rèn)模塊40，用于在郵件的校驗(yàn)碼存在于垃圾郵件樣本中時(shí)，識(shí)別郵件為垃圾郵件?？蛇x地，判斷模塊30，還用于針對(duì)已接收到的郵件的校驗(yàn)碼和ip值，判斷郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值，郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址包括與郵件的校驗(yàn)碼相同的校驗(yàn)碼所對(duì)應(yīng)的已接收到的郵件的ip地址和郵件的ip地址。確認(rèn)模塊40，還用于在個(gè)數(shù)大于預(yù)設(shè)閾值時(shí)，識(shí)別郵件為垃圾郵件，并將郵件的校驗(yàn)碼寫入到垃圾郵件樣本中；確認(rèn)模塊40，還用于在個(gè)數(shù)小于預(yù)設(shè)閾值時(shí)，識(shí)別郵件為正常郵件。可選地，判斷模塊30，具體用于判斷臨時(shí)緩存中是否存儲(chǔ)有與郵件的校驗(yàn)碼相同的校驗(yàn)碼，臨時(shí)緩存中存儲(chǔ)有已接收到的郵件對(duì)應(yīng)的不同的校驗(yàn)碼和各校驗(yàn)碼對(duì)應(yīng)的ip地址集合。確認(rèn)模塊40，具體用于在判斷模塊的判斷結(jié)果為是時(shí)，將郵件的ip地址寫入到與郵件的校驗(yàn)碼相同的校驗(yàn)碼對(duì)應(yīng)的ip地址集合中，并判斷相同的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值；在判斷模塊的判斷結(jié)果為否時(shí)，將郵件的校驗(yàn)碼和ip地址寫入到臨時(shí)緩存中。可選地，獲取模塊10，還用于獲取郵件的接收時(shí)刻與臨時(shí)緩存中寫入與郵件的校驗(yàn)碼相同的校驗(yàn)碼的寫入時(shí)刻之間的間隔時(shí)長；判斷模塊30，還具體用于判斷間隔時(shí)長是否大于預(yù)設(shè)時(shí)長。釋放模塊50，具體用于在判斷模塊30的判斷結(jié)果為是時(shí)，識(shí)別郵件為正常郵件，并釋放臨時(shí)緩存。可選地，預(yù)設(shè)校驗(yàn)算法包括md5算法或sha1算法。本發(fā)明實(shí)施例提供的垃圾郵件的識(shí)別裝置，可執(zhí)行上述方法實(shí)施例，其具體實(shí)現(xiàn)原理和技術(shù)效果，可參見上述方法實(shí)施例，本實(shí)施例此處不再贅述。本領(lǐng)域普通技術(shù)人員可以理解：實(shí)現(xiàn)上述各方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成。前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。該程序在執(zhí)行時(shí)，執(zhí)行包括上述各方法實(shí)施例的步驟；而前述的存儲(chǔ)介質(zhì)包括：rom、ram、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。最后應(yīng)說明的是：以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案，而非對(duì)其限制；盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明，本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解：其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改，或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換；而這些修改或者替換，并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。當(dāng)前第1頁12

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：黃福昌;王海斌;李寧寧
技術(shù)所有人：北京二六三企業(yè)通信有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測試系統(tǒng)設(shè)計(jì) 2.汽車檢測系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

垃圾郵件識(shí)別相關(guān)技術(shù)

郵件被識(shí)別為垃圾郵件相關(guān)技術(shù)

垃圾郵件解決方法相關(guān)技術(shù)

垃圾郵件過濾方法相關(guān)技術(shù)

垃圾郵件處理方法相關(guān)技術(shù)

無線識(shí)別裝置的用途相關(guān)技術(shù)

win10usb裝置無法識(shí)別相關(guān)技術(shù)

日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

垃圾郵件的識(shí)別方法及裝置與流程