本發(fā)明涉及垃圾郵件識(shí)別技術(shù),尤其涉及一種垃圾郵件的識(shí)別方法及裝置。
背景技術(shù):
:隨著互聯(lián)網(wǎng)的廣泛普及,郵件已經(jīng)成為常用的通信工具之一,但用戶常會(huì)收到各種垃圾郵件,嚴(yán)重影響用戶對(duì)正常郵件的查收和處理。因此,識(shí)別垃圾郵件越來越重要。目前基于概率統(tǒng)計(jì)的貝葉斯識(shí)別技術(shù)為常用的識(shí)別垃圾郵件技術(shù),該技術(shù)會(huì)收集大量的正常郵件樣本和垃圾郵件樣本,把正常郵件樣本和垃圾郵件樣本的內(nèi)容進(jìn)行分詞,統(tǒng)計(jì)各個(gè)分詞在正常郵件樣本和垃圾郵件樣本的次數(shù)。然而,基于概率統(tǒng)計(jì)的貝葉斯識(shí)別技術(shù)對(duì)于不適合分詞的垃圾信息(如圖片等)識(shí)別的效果不佳,現(xiàn)亟需一種識(shí)別準(zhǔn)確率較高的識(shí)別垃圾郵件技術(shù)。技術(shù)實(shí)現(xiàn)要素:本發(fā)明提供一種垃圾郵件的識(shí)別方法及裝置,以解決現(xiàn)有的基于概率統(tǒng)計(jì)的貝葉斯識(shí)別技術(shù)識(shí)別準(zhǔn)確率較低的問題。本發(fā)明提供一種垃圾郵件的識(shí)別方法,包括:接收郵件并對(duì)所述郵件進(jìn)行解析,以獲取所述郵件的ip地址和郵件內(nèi)容,其中所述郵件內(nèi)容包括主題、正文和附件;通過預(yù)設(shè)校驗(yàn)算法,對(duì)所述郵件內(nèi)容進(jìn)行計(jì)算,得到所述郵件的校驗(yàn)碼;判斷所述郵件的校驗(yàn)碼是否存在于垃圾郵件樣本中,其中,所述垃圾郵件樣本中存儲(chǔ)有不同的垃圾郵件對(duì)應(yīng)的校驗(yàn)碼;若所述郵件的校驗(yàn)碼存在于所述垃圾郵件樣本中,則識(shí)別所述郵件為垃圾郵件??蛇x地,若所述郵件的校驗(yàn)碼不存在于所述垃圾郵件樣本中,所述方法還包括:針對(duì)已接收到的郵件的ip值和校驗(yàn)碼,判斷所述郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值,所述郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址包括與所述郵件的校驗(yàn)碼相同的校驗(yàn)碼所對(duì)應(yīng)的已接收到的郵件的ip地址和所述郵件的ip地址;若所述個(gè)數(shù)大于預(yù)設(shè)閾值,則識(shí)別所述郵件為垃圾郵件,并將所述郵件的校驗(yàn)碼寫入到所述垃圾郵件樣本中;若所述個(gè)數(shù)小于預(yù)設(shè)閾值,則識(shí)別所述郵件為正常郵件。可選地,所述針對(duì)已接收到的郵件的校驗(yàn)碼和ip值,判斷所述郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值,包括:判斷臨時(shí)緩存中是否存儲(chǔ)有與所述郵件的校驗(yàn)碼相同的校驗(yàn)碼,所述臨時(shí)緩存中存儲(chǔ)有所述已接收到的郵件對(duì)應(yīng)的不同的校驗(yàn)碼和各所述校驗(yàn)碼對(duì)應(yīng)的ip地址集合;若是,則將所述郵件的ip地址寫入到與所述郵件的校驗(yàn)碼相同的校驗(yàn)碼對(duì)應(yīng)的ip地址集合中,并判斷所述相同的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值;若否,則將所述郵件的校驗(yàn)碼和ip地址寫入到所述臨時(shí)緩存中??蛇x地,所述方法還包括:獲取所述臨時(shí)緩存中寫入校驗(yàn)碼的寫入時(shí)刻距當(dāng)前時(shí)刻的間隔時(shí)長;判斷所述間隔時(shí)長是否大于預(yù)設(shè)時(shí)長;若是,則釋放所述臨時(shí)緩存??蛇x地,所述預(yù)設(shè)校驗(yàn)算法包括md5算法或sha1算法。本發(fā)明還提供一種垃圾郵件的識(shí)別裝置,包括:獲取模塊,用于接收郵件并對(duì)所述郵件進(jìn)行解析,以獲取所述郵件的ip地址和郵件內(nèi)容,其中所述郵件內(nèi)容包括主題、正文和附件;計(jì)算模塊,用于通過預(yù)設(shè)校驗(yàn)算法,對(duì)所述郵件內(nèi)容進(jìn)行計(jì)算,得到所述郵件的校驗(yàn)碼;判斷模塊,用于判斷所述郵件的校驗(yàn)碼是否存在于垃圾郵件樣本中,其中,所述垃圾郵件樣本中存儲(chǔ)有不同的垃圾郵件對(duì)應(yīng)的校驗(yàn)碼。確認(rèn)模塊,用于在所述郵件的校驗(yàn)碼存在于所述垃圾郵件樣本中時(shí),識(shí)別所述郵件為垃圾郵件。可選地,所述判斷模塊,還用于針對(duì)已接收到的郵件的校驗(yàn)碼和ip值,判斷所述郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值,所述郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址包括與所述郵件的校驗(yàn)碼相同的校驗(yàn)碼所對(duì)應(yīng)的已接收到的郵件的ip地址和所述郵件的ip地址。所述確認(rèn)模塊,還用于在所述個(gè)數(shù)大于預(yù)設(shè)閾值時(shí),識(shí)別所述郵件為垃圾郵件,并將所述郵件的校驗(yàn)碼寫入到所述垃圾郵件樣本中;所述確認(rèn)模塊,還用于在所述個(gè)數(shù)小于預(yù)設(shè)閾值時(shí),識(shí)別所述郵件為正常郵件??蛇x地,所述判斷模塊,具體用于判斷臨時(shí)緩存中是否存儲(chǔ)有與所述郵件的校驗(yàn)碼相同的校驗(yàn)碼,所述臨時(shí)緩存中存儲(chǔ)有所述已接收到的郵件對(duì)應(yīng)的不同的校驗(yàn)碼和各所述校驗(yàn)碼對(duì)應(yīng)的ip地址集合。所述確認(rèn)模塊,具體用于在所述判斷模塊的判斷結(jié)果為是時(shí),將所述郵件的ip地址寫入到與所述郵件的校驗(yàn)碼相同的校驗(yàn)碼對(duì)應(yīng)的ip地址集合中,并判斷所述相同的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值;在所述判斷模塊的判斷結(jié)果為否時(shí),將所述郵件的校驗(yàn)碼和ip地址寫入到所述臨時(shí)緩存中。可選地,所述獲取模塊,還用于獲取所述臨時(shí)緩存中寫入校驗(yàn)碼的寫入時(shí)刻距當(dāng)前時(shí)刻的間隔時(shí)長;所述判斷模塊,還具體用于判斷所述間隔時(shí)長是否大于預(yù)設(shè)時(shí)長。釋放模塊,具體用于在所述判斷模塊的判斷結(jié)果為是時(shí),識(shí)別所述郵件為正常郵件,并釋放所述臨時(shí)緩存??蛇x地,所述預(yù)設(shè)校驗(yàn)算法包括md5算法或sha1算法。本發(fā)明提供的垃圾郵件的識(shí)別方法及裝置,該方法通過接收郵件并對(duì)郵件進(jìn)行解析,以獲取郵件的ip地址和郵件內(nèi)容,再通過預(yù)設(shè)校驗(yàn)算法,對(duì)郵件內(nèi)容進(jìn)行計(jì)算,得到郵件的校驗(yàn)碼,接著判斷郵件的校驗(yàn)碼是否存在于垃圾郵件樣本中,其中,垃圾郵件樣本中存儲(chǔ)有不同的垃圾郵件對(duì)應(yīng)的校驗(yàn)碼。若郵件的校驗(yàn)碼存在于垃圾郵件樣本中,則識(shí)別郵件為垃圾郵件。本發(fā)明提供的方法以及裝置以多個(gè)ip地址發(fā)送相同郵件內(nèi)容的垃圾郵件為特征,將郵件內(nèi)容對(duì)應(yīng)的校驗(yàn)碼存在垃圾郵件樣本中,對(duì)接收的郵件進(jìn)行判斷是否為垃圾郵件,解決了現(xiàn)有概率統(tǒng)計(jì)的貝葉斯識(shí)別技術(shù)準(zhǔn)確率較低的問題,且過程簡單、高效,提升了垃圾郵件的識(shí)別率。附圖說明圖1為本發(fā)明提供的垃圾郵件的識(shí)別方法的場景示意圖;圖2為本發(fā)明提供的垃圾郵件的識(shí)別方法的流程圖一;圖3為本發(fā)明提供的垃圾郵件的識(shí)別方法的流程圖二;圖4為本發(fā)明提供的垃圾郵件的識(shí)別方法中一種存儲(chǔ)方式的流程圖;圖5為本發(fā)明提供的垃圾郵件的識(shí)別方法中一種釋放方式的流程圖;圖6為本發(fā)明提供的垃圾郵件的識(shí)別裝置的結(jié)構(gòu)示意圖。具體實(shí)施方式圖1為本發(fā)明提供的垃圾郵件的識(shí)別方法的場景示意圖,如圖1所示,郵件是由外域服務(wù)器或本域服務(wù)器發(fā)送的郵件,再由郵件服務(wù)器進(jìn)行接收。通常,發(fā)送者在外域服務(wù)器或本域服務(wù)器上會(huì)發(fā)送大量的垃圾郵件,若這些垃圾郵件僅僅是通過單個(gè)ip地址進(jìn)行發(fā)送,這個(gè)ip地址很容易被發(fā)現(xiàn),進(jìn)而會(huì)被攔截。因此,發(fā)送者會(huì)使用大量的ip地址發(fā)送垃圾郵件。本實(shí)施例可利用郵件服務(wù)器能夠接收到由不同ip地址發(fā)送的相同內(nèi)容的大量郵件的特征對(duì)這些郵件進(jìn)行識(shí)別,以識(shí)別出該郵件是垃圾郵件還是正常郵件。圖2為本發(fā)明提供的垃圾郵件的識(shí)別方法的流程圖一,本實(shí)施例的執(zhí)行主體可以為圖1所示的郵件服務(wù)器,如圖2所示,本實(shí)施例垃圾郵件的識(shí)別方法包括:s201、接收郵件并對(duì)郵件進(jìn)行解析,以獲取郵件的ip地址和郵件內(nèi)容,其中郵件內(nèi)容包括主題、正文和附件。具體地,由大量的ip地址發(fā)送的垃圾郵件的內(nèi)容是相同的,這樣垃圾郵件的主題、正文和附件也就是相同的。對(duì)接收到的郵件進(jìn)行解析,可得到該郵件的各種信息,如郵件頭、時(shí)間戳、發(fā)送者、接收者、郵件內(nèi)容以及郵件的ip地址。但是郵件頭、時(shí)間戳、發(fā)送者、接收者會(huì)對(duì)識(shí)別該郵件是否為垃圾郵件產(chǎn)生影響,進(jìn)而做出錯(cuò)誤的判斷。而郵件內(nèi)容為郵件的實(shí)質(zhì)性內(nèi)容,因此,本實(shí)施例中解析獲取的郵件內(nèi)容是通過對(duì)該郵件的本質(zhì)內(nèi)容進(jìn)行識(shí)別。又由于郵件的ip地址為唯一的,且與該郵件內(nèi)容相同的郵件的個(gè)數(shù)相對(duì)應(yīng),進(jìn)而可結(jié)合郵件內(nèi)容與郵件的ip地址對(duì)發(fā)送者會(huì)利用大量的ip地址發(fā)送大量的內(nèi)容相同的垃圾郵件這個(gè)特征進(jìn)行表征,以完成對(duì)垃圾郵件的識(shí)別。因此,本實(shí)施例中在接收到郵件時(shí),可對(duì)該郵件進(jìn)行解析,以得到該郵件的ip地址和郵件內(nèi)容。本實(shí)施例對(duì)郵件的ip地址和郵件內(nèi)容的具體形式不做限定,只需滿足郵件的ip地址和郵件內(nèi)容能夠表征該郵件即可。為了便于對(duì)郵件的識(shí)別,可將郵件的ip地址和郵件內(nèi)容解析為計(jì)算機(jī)二進(jìn)制機(jī)器語言。s202、通過預(yù)設(shè)校驗(yàn)算法,對(duì)郵件內(nèi)容進(jìn)行計(jì)算,得到郵件的校驗(yàn)碼。具體地,在獲得郵件內(nèi)容后,通過預(yù)設(shè)校驗(yàn)算法計(jì)算郵件內(nèi)容對(duì)應(yīng)的校驗(yàn)碼,其中郵件的校驗(yàn)碼為唯一的,對(duì)應(yīng)的,郵件內(nèi)容便可唯一表征該郵件。本實(shí)施例中預(yù)設(shè)校驗(yàn)算法由很多種實(shí)現(xiàn)形式,只需滿足該預(yù)設(shè)校驗(yàn)算法計(jì)算郵件內(nèi)容得到的郵件的校驗(yàn)碼為唯一的即可??蛇x地,預(yù)設(shè)校驗(yàn)算法包括md5算法或sha1算法。具體地,本實(shí)施例可采用md5算法對(duì)郵件內(nèi)容計(jì)算得到md5碼。由于md5碼有128位那么長,因此,任意郵件的郵件內(nèi)容之間具有相同md5碼的可能性非常低,通常被認(rèn)為是不可能的。這樣,當(dāng)郵件為垃圾郵件時(shí),便可很容易找到相同的md5碼;當(dāng)郵件為正常郵件時(shí),便很難找到相同的md5碼。本實(shí)施例采用sha1算法得到sha1碼并將sha1碼作為郵件的校驗(yàn)碼判斷郵件是否為垃圾郵件的過程與采用md5算法識(shí)別垃圾郵件的過程類似,本實(shí)施例對(duì)此不做限定。s203、判斷郵件的校驗(yàn)碼是否存在于垃圾郵件樣本中,其中,垃圾郵件樣本中存儲(chǔ)有不同的垃圾郵件對(duì)應(yīng)的校驗(yàn)碼。s204、若郵件的校驗(yàn)碼存在于垃圾郵件樣本中,則識(shí)別郵件為垃圾郵件。具體地,本實(shí)施例可直接利用垃圾郵件樣本中存儲(chǔ)的校驗(yàn)碼判斷該郵件是否為垃圾郵件,由于垃圾郵件樣本存儲(chǔ)著不同垃圾郵件對(duì)應(yīng)的校驗(yàn)碼,當(dāng)計(jì)算得到該郵件的校驗(yàn)碼后,便可在垃圾郵件樣本中搜索,看能否找到相同的校驗(yàn)碼。當(dāng)該郵件的校驗(yàn)碼存在與垃圾郵件樣本中,便可快速、準(zhǔn)確的識(shí)別出該郵件為垃圾郵件。本實(shí)施例提供的垃圾郵件的識(shí)別方法,通過接收郵件并對(duì)郵件進(jìn)行解析,以獲取郵件的ip地址和郵件內(nèi)容,再通過預(yù)設(shè)校驗(yàn)算法,對(duì)郵件內(nèi)容進(jìn)行計(jì)算,得到郵件的校驗(yàn)碼,接著判斷郵件的校驗(yàn)碼是否存在于垃圾郵件樣本中,其中,垃圾郵件樣本中存儲(chǔ)有不同的垃圾郵件對(duì)應(yīng)的校驗(yàn)碼。若郵件的校驗(yàn)碼存在于垃圾郵件樣本中,則識(shí)別郵件為垃圾郵件。即本實(shí)施例以多個(gè)ip地址發(fā)送相同郵件內(nèi)容的垃圾郵件為特征,將郵件內(nèi)容對(duì)應(yīng)的校驗(yàn)碼存在垃圾郵件樣本中,對(duì)接收的郵件進(jìn)行判斷是否為垃圾郵件,解決了現(xiàn)有概率統(tǒng)計(jì)的貝葉斯識(shí)別技術(shù)準(zhǔn)確率較低的問題,且過程簡單、高效,提升了垃圾郵件的識(shí)別率?,F(xiàn)有的基于概率統(tǒng)計(jì)的貝葉斯識(shí)別技術(shù)往往需要通過用戶舉報(bào)等方式中得到正常郵件樣本和垃圾郵件樣本才能夠識(shí)別垃圾郵件,時(shí)效性會(huì)嚴(yán)重滯后。然而本實(shí)施例可將識(shí)別過程化被動(dòng)為主動(dòng),其中垃圾郵件樣本可直接通過接收到的郵件獲得,而并不是事先由用戶舉報(bào)等方式獲得的垃圾郵件樣本。下面結(jié)合圖3,對(duì)本實(shí)施例垃圾郵件的識(shí)別方法的具體實(shí)現(xiàn)方式進(jìn)行詳細(xì)說明。圖3為本發(fā)明提供的垃圾郵件的識(shí)別方法的流程圖二,如圖3所示,該方法包括:s301、接收郵件并對(duì)郵件進(jìn)行解析,以獲取郵件的ip地址和郵件內(nèi)容,其中郵件內(nèi)容包括主題、正文和附件。s302、通過預(yù)設(shè)校驗(yàn)算法,對(duì)郵件內(nèi)容進(jìn)行計(jì)算,得到郵件的校驗(yàn)碼。s303、判斷郵件的校驗(yàn)碼是否存在于垃圾郵件樣本中,其中,垃圾郵件樣本中存儲(chǔ)有不同的垃圾郵件對(duì)應(yīng)的校驗(yàn)碼;若是,則執(zhí)行s304,若否,則執(zhí)行s305。s304、識(shí)別郵件為垃圾郵件。其中,s301、s302、s303與s304與圖2實(shí)施例中的s201、s202、s203與s204等實(shí)現(xiàn)方式類似,本實(shí)施例此處不再贅述。s305、針對(duì)已接收到的郵件的ip值和校驗(yàn)碼,判斷郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值,郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址包括與郵件的校驗(yàn)碼相同的校驗(yàn)碼所對(duì)應(yīng)的已接收到的郵件的ip地址和郵件的ip地址。具體地,已收到的郵件是由郵件服務(wù)器接收到該郵件之前的郵件,本實(shí)施例可將已接收到的郵件的校驗(yàn)碼和ip值保存在臨時(shí)緩存或數(shù)據(jù)庫中。根據(jù)該郵件的校驗(yàn)碼,可在已收到的郵件中確定與該郵件的校驗(yàn)碼相同的檢驗(yàn)碼對(duì)應(yīng)的ip地址的個(gè)數(shù)。因此,需要將該郵件的ip地址與之前已經(jīng)收到的郵件相同校驗(yàn)碼對(duì)應(yīng)的ip地址之和作為郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù),接著判斷郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閾值,其中,預(yù)設(shè)閾值可根據(jù)經(jīng)驗(yàn)進(jìn)行設(shè)定,本實(shí)施例對(duì)此不做限定。進(jìn)一步地,本實(shí)施例中無論在已收到的郵件中是否能夠找到與該郵件的校驗(yàn)碼相同的校驗(yàn)碼對(duì)應(yīng)的ip地址,在判斷過程中,都應(yīng)該將已收到的郵件的ip地址與該郵件的ip地址之和得到的總個(gè)數(shù)與預(yù)設(shè)閥值進(jìn)行比較。進(jìn)一步地,無論采用上述哪種存儲(chǔ)方式,在計(jì)算得到相同校驗(yàn)碼的郵件對(duì)應(yīng)的ip地址的個(gè)數(shù)之后,若個(gè)數(shù)大于預(yù)設(shè)閾值,則執(zhí)行s306;若個(gè)數(shù)小于預(yù)設(shè)閾值,則執(zhí)行s307。為了便于說明,本實(shí)施例可將已接收到的郵件的校驗(yàn)碼和ip值保存在臨時(shí)緩存中。s306、識(shí)別郵件為垃圾郵件,并將郵件的校驗(yàn)碼寫入到垃圾郵件樣本中。s307、識(shí)別郵件為正常郵件。具體地,當(dāng)郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)大于預(yù)設(shè)閾值時(shí),該郵件為垃圾郵件,且將該郵件的校驗(yàn)碼寫入到垃圾郵件樣本中。當(dāng)郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)小于預(yù)設(shè)閾值時(shí),該郵件為正常郵件。本實(shí)施例可對(duì)接收的郵件能夠及時(shí)、快速進(jìn)行識(shí)別,以區(qū)分是正常郵件還是垃圾郵件,過程簡單、高效且不會(huì)依賴于事先由用戶舉報(bào)等方式獲得的垃圾郵件樣本。而且,本實(shí)施例不僅可接收其他識(shí)別垃圾郵件方法過濾得到的正常郵件,還可將區(qū)分得到的正常郵件采用其他識(shí)別垃圾郵件方法進(jìn)行再次識(shí)別,以實(shí)現(xiàn)垃圾郵件的過濾。在上述圖3實(shí)施例的基礎(chǔ)上,在步驟305中本實(shí)施例可采用多種存儲(chǔ)方式將已接收到的郵件的校驗(yàn)碼和ip值保存在臨時(shí)緩存中。一種可行的存儲(chǔ)方式,如表1所示,本實(shí)施例具體可將郵件的校驗(yàn)碼和ip地址一起一組一組的存入到臨時(shí)緩存中。例如,存入郵件一的校驗(yàn)碼一和ip地址一,存入郵件二的校驗(yàn)碼二和ip地址二,存入郵件三的校驗(yàn)碼三和ip地址三,……,等等,其中校驗(yàn)碼一、校驗(yàn)碼二和校驗(yàn)碼三可能相同也可能不同。本實(shí)施例中無論已接收到的檢驗(yàn)碼是否相同,都會(huì)將郵件的校驗(yàn)碼和ip地址一組組直接存儲(chǔ)到臨時(shí)緩存中。表1臨時(shí)緩存中郵件的檢驗(yàn)碼和ip地址的存儲(chǔ)方式一校驗(yàn)碼一ip地址一校驗(yàn)碼二ip地址二校驗(yàn)碼三ip地址三…………另一種可行的存儲(chǔ)方式,如表2所示,本實(shí)施例具體還可將郵件的不同的校驗(yàn)碼和各校驗(yàn)碼對(duì)應(yīng)的ip地址集合的方式存到臨時(shí)緩中,即相同的校驗(yàn)碼對(duì)應(yīng)的ip地址寫入一個(gè)集合中,不同的檢驗(yàn)碼對(duì)應(yīng)的ip地址寫入到另一個(gè)集合中。例如,在已收到的郵件中,將相同的校驗(yàn)碼的郵件對(duì)應(yīng)的ip地址寫入到ip地址集合中,其中校驗(yàn)碼為校驗(yàn)碼一的郵件對(duì)應(yīng)的ip地址一、ip地址二等放入到一個(gè)集合中,校驗(yàn)碼為校驗(yàn)碼二的郵件對(duì)應(yīng)的ip地址三、ip地址四等放入到一個(gè)集合中,校驗(yàn)碼為校驗(yàn)碼三的郵件對(duì)應(yīng)的ip地址五、ip地址六等放入到一個(gè)集合中等等,校驗(yàn)碼一、校驗(yàn)碼二和校驗(yàn)碼三皆不相同。表2臨時(shí)緩存中郵件的檢驗(yàn)碼和ip地址的存儲(chǔ)方式二校驗(yàn)碼一(ip地址一,ip地址二,……)校驗(yàn)碼二(ip地址三,ip地址四,……)校驗(yàn)碼三(ip地址五,ip地址六,……)…………進(jìn)一步地,本實(shí)施例對(duì)郵件的校驗(yàn)碼和ip值的存儲(chǔ)方式不做限定。為了方便說明,結(jié)合圖4,本實(shí)施例s305中通過將郵件的不同的校驗(yàn)碼和各校驗(yàn)碼對(duì)應(yīng)的ip地址集合的方式存到臨時(shí)緩存中這一具體的存儲(chǔ)方式進(jìn)行具體說明。圖4為本發(fā)明提供的垃圾郵件的識(shí)別方法中一種存儲(chǔ)方式的流程圖,如圖4所示,該方法包括:s401、判斷臨時(shí)緩存中是否存儲(chǔ)有與郵件的校驗(yàn)碼相同的校驗(yàn)碼,臨時(shí)緩存中存儲(chǔ)有已接收到的郵件對(duì)應(yīng)的不同的校驗(yàn)碼和各校驗(yàn)碼對(duì)應(yīng)的ip地址集合。若是,則執(zhí)行s402;若否,則執(zhí)行s403。s402、將郵件的ip地址寫入到與郵件的校驗(yàn)碼相同的校驗(yàn)碼對(duì)應(yīng)的ip地址集合中,并判斷相同的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值。s403、將郵件的校驗(yàn)碼和ip地址寫入到臨時(shí)緩存中。具體地,由于臨時(shí)緩存中已經(jīng)存儲(chǔ)了已接收到的郵件對(duì)應(yīng)的校驗(yàn)碼和ip地址,因此,可直接判斷臨時(shí)緩存中是否存儲(chǔ)有與該郵件的校驗(yàn)碼相同的校驗(yàn)碼。若臨時(shí)緩存中存儲(chǔ)有與該郵件的校驗(yàn)碼相同的校驗(yàn)碼,則將該郵件的ip地址存儲(chǔ)到相同校驗(yàn)碼對(duì)應(yīng)的ip地址集合中,再計(jì)算相同校驗(yàn)碼對(duì)應(yīng)的ip地址的個(gè)數(shù)。若臨時(shí)緩存中沒存儲(chǔ)有與該郵件的校驗(yàn)碼相同的校驗(yàn)碼,則將該郵件的校驗(yàn)碼和ip地址都存儲(chǔ)到臨時(shí)緩存中,則該郵件的校驗(yàn)碼對(duì)應(yīng)的ip地址的個(gè)數(shù)為1。在上述圖3實(shí)施例的基礎(chǔ)上,由于臨時(shí)緩存中存儲(chǔ)著大量校驗(yàn)碼占用內(nèi)存,會(huì)影響識(shí)別垃圾郵件的速率。為了加快垃圾郵件的識(shí)別速率,結(jié)合圖5,對(duì)本實(shí)施例中釋放臨時(shí)緩存的具體過程進(jìn)行詳細(xì)說明。圖5為本發(fā)明提供的垃圾郵件的識(shí)別方法中一種釋放方式的流程圖,如圖5所示,該方法還包括:s501、獲取臨時(shí)緩存中寫入校驗(yàn)碼的寫入時(shí)刻距當(dāng)前時(shí)刻的間隔時(shí)長。具體地,由于臨時(shí)緩存會(huì)在預(yù)設(shè)時(shí)長之后釋放變?yōu)榭?,因此,本?shí)施例可會(huì)記錄向空的臨時(shí)緩存寫入校驗(yàn)碼的寫入時(shí)刻,再用當(dāng)前時(shí)刻減去寫入時(shí)刻得到間隔時(shí)長,這樣隨著時(shí)間的流逝,間隔時(shí)長會(huì)越來越大。s502、判斷間隔時(shí)長是否大于預(yù)設(shè)時(shí)長,若是,則執(zhí)行s503;若否,則返回執(zhí)行s301。s503、釋放臨時(shí)緩存。具體地,本實(shí)施例中預(yù)設(shè)時(shí)長可為經(jīng)驗(yàn)設(shè)置,可為半天,也可為1個(gè)小時(shí),本實(shí)施例對(duì)此不做限定。若間隔時(shí)長大于預(yù)設(shè)時(shí)長,則釋放臨時(shí)緩存,這樣臨時(shí)緩存的存儲(chǔ)內(nèi)容不會(huì)占用過多的資源,識(shí)別效率變高。若間隔時(shí)長小于預(yù)設(shè)時(shí)長,則不釋放臨時(shí)緩存,繼續(xù)接收新的郵件執(zhí)行s301,直至識(shí)別出該郵件是否為垃圾郵件還是正常郵件。圖6為本發(fā)明提供的垃圾郵件的識(shí)別裝置的結(jié)構(gòu)示意圖,如圖6所示,本實(shí)施例垃圾郵件的識(shí)別裝置包括:獲取模塊10,用于接收郵件并對(duì)郵件進(jìn)行解析,以獲取郵件的ip地址和郵件內(nèi)容,其中郵件內(nèi)容包括主題、正文和附件;計(jì)算模塊20,用于通過預(yù)設(shè)校驗(yàn)算法,對(duì)郵件內(nèi)容進(jìn)行計(jì)算,得到郵件的校驗(yàn)碼;判斷模塊30,用于判斷郵件的校驗(yàn)碼是否存在于垃圾郵件樣本中,其中,垃圾郵件樣本中存儲(chǔ)有不同的垃圾郵件對(duì)應(yīng)的校驗(yàn)碼。確認(rèn)模塊40,用于在郵件的校驗(yàn)碼存在于垃圾郵件樣本中時(shí),識(shí)別郵件為垃圾郵件??蛇x地,判斷模塊30,還用于針對(duì)已接收到的郵件的校驗(yàn)碼和ip值,判斷郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值,郵件的校驗(yàn)碼所對(duì)應(yīng)的ip地址包括與郵件的校驗(yàn)碼相同的校驗(yàn)碼所對(duì)應(yīng)的已接收到的郵件的ip地址和郵件的ip地址。確認(rèn)模塊40,還用于在個(gè)數(shù)大于預(yù)設(shè)閾值時(shí),識(shí)別郵件為垃圾郵件,并將郵件的校驗(yàn)碼寫入到垃圾郵件樣本中;確認(rèn)模塊40,還用于在個(gè)數(shù)小于預(yù)設(shè)閾值時(shí),識(shí)別郵件為正常郵件。可選地,判斷模塊30,具體用于判斷臨時(shí)緩存中是否存儲(chǔ)有與郵件的校驗(yàn)碼相同的校驗(yàn)碼,臨時(shí)緩存中存儲(chǔ)有已接收到的郵件對(duì)應(yīng)的不同的校驗(yàn)碼和各校驗(yàn)碼對(duì)應(yīng)的ip地址集合。確認(rèn)模塊40,具體用于在判斷模塊的判斷結(jié)果為是時(shí),將郵件的ip地址寫入到與郵件的校驗(yàn)碼相同的校驗(yàn)碼對(duì)應(yīng)的ip地址集合中,并判斷相同的校驗(yàn)碼所對(duì)應(yīng)的ip地址的個(gè)數(shù)是否大于預(yù)設(shè)閥值;在判斷模塊的判斷結(jié)果為否時(shí),將郵件的校驗(yàn)碼和ip地址寫入到臨時(shí)緩存中。可選地,獲取模塊10,還用于獲取郵件的接收時(shí)刻與臨時(shí)緩存中寫入與郵件的校驗(yàn)碼相同的校驗(yàn)碼的寫入時(shí)刻之間的間隔時(shí)長;判斷模塊30,還具體用于判斷間隔時(shí)長是否大于預(yù)設(shè)時(shí)長。釋放模塊50,具體用于在判斷模塊30的判斷結(jié)果為是時(shí),識(shí)別郵件為正常郵件,并釋放臨時(shí)緩存。可選地,預(yù)設(shè)校驗(yàn)算法包括md5算法或sha1算法。本發(fā)明實(shí)施例提供的垃圾郵件的識(shí)別裝置,可執(zhí)行上述方法實(shí)施例,其具體實(shí)現(xiàn)原理和技術(shù)效果,可參見上述方法實(shí)施例,本實(shí)施例此處不再贅述。本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述各方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成。前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。該程序在執(zhí)行時(shí),執(zhí)行包括上述各方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:rom、ram、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。當(dāng)前第1頁12