本發(fā)明涉及電子郵件技術領域,尤其涉及一種反垃圾郵件的方法及系統(tǒng)。
背景技術:
垃圾電子郵件一般指接受者不愿意接受而發(fā)送者強行發(fā)送到接受者郵箱的郵件。隨著國際互聯網的高速發(fā)展,垃圾電子郵件已經以不可控制的勢頭發(fā)展成為網絡上的一大公害。垃圾電子郵件不僅騷擾郵件用戶,而且還會極大地占用網絡服務提供商的帶寬資源,影響網絡服務質量,帶來重大的損失。目前反垃圾郵件方法大概可分為以下三種:黑名單方案、白名單方案、內容過濾方案。
對于黑名單方案,需要郵箱用戶事先人工設置好,只能防范同一個發(fā)件者重復發(fā)來的垃圾郵件。對首次發(fā)來的垃圾郵件,仍然無法防范。如果垃圾郵件發(fā)送者每次發(fā)送垃圾郵件后換一個發(fā)件箱地址發(fā)送,這個防范方法就無效了,而這對于垃圾郵件的發(fā)件者來說很容易做到的。
對于白名單方案,只能對接收熟人的多次來往的郵件有效。其無法接收許多朋友的第一次發(fā)送來的郵件。該方案在反垃圾郵件的同時往往會將非垃圾郵件也屏蔽過濾掉。
而內容過濾方案的可靠性不高。垃圾郵件過濾系統(tǒng)總是分析了現有的垃圾郵件特征后才制定的。垃圾郵件發(fā)送者可以很容易地針對現有的過濾系統(tǒng)不斷變換策略,躲過過濾系統(tǒng)的規(guī)律規(guī)則將垃圾成功發(fā)送到用戶郵箱中。雖然許多郵箱服務商聲明其郵件系統(tǒng)已經過濾掉了大部分垃圾郵件,但許多用戶收到的垃圾郵件還是遠高于有用郵件。
技術實現要素:
本發(fā)明實施例所要解決的技術問題在于,提供一種反垃圾郵件的方法及系統(tǒng),以使不易被垃圾郵件突破,提高垃圾郵件屏蔽的可靠性。
為了解決上述技術問題,本發(fā)明實施例提出了一種反垃圾郵件的方法,包括:
信譽度檢查步驟:將收到的郵件的發(fā)件人ip及域名與預設的ip及域名信譽度進行對比檢查,并判斷對應的信譽度是否符合預設要求,不符合的退回郵件;
名單檢查步驟:將郵件的發(fā)件人地址與預設的黑/白名單內的發(fā)件人地址信息進行對比檢查,并判斷是否通過檢查,不通過則將郵件發(fā)送至垃圾箱;
內容清洗步驟:對郵件的內容以模擬收件人可視化的方式進行清洗,并輸出清洗掉加擾數據的內容;
特征檢查步驟:將輸出的內容的特征與預設的垃圾郵件內容特征進行對比檢查,并判斷是否包含垃圾郵件內容特征,不包含則將郵件發(fā)送至收件箱,包含則發(fā)送至垃圾箱。
相應地,本發(fā)明實施例還提供了一種反垃圾郵件的系統(tǒng),包括:
信譽度檢查模塊:將收到的郵件的發(fā)件人ip及域名與預設的ip及域名信譽度進行對比檢查,并判斷對應的信譽度是否符合預設要求,不符合的退回郵件;
名單檢查模塊:將郵件的發(fā)件人地址與預設的黑/白名單內的發(fā)件人地址信息進行對比檢查,并判斷是否通過檢查,不通過則將郵件發(fā)送至垃圾箱;
內容清洗模塊:對郵件的內容以模擬收件人可視化的方式進行清洗,并輸出清洗掉加擾數據的內容;
特征檢查模塊:將輸出的內容的特征與預設的垃圾郵件內容特征進行對比檢查,并判斷是否包含垃圾郵件內容特征,不包含則將郵件發(fā)送至收件箱,包含則發(fā)送至垃圾箱。
本發(fā)明實施例通過提出一種反垃圾郵件的方法及系統(tǒng),所述方法包括信譽度檢查步驟、名單檢查步驟、內容清洗步驟及特征檢查步驟,通過采用模擬收件人可視化的方式對原始郵件進行渲染后輸出清洗后的內容,解決了容易被垃圾郵件突破的問題,進而提高了垃圾郵件屏蔽的可靠性。
附圖說明
圖1是本發(fā)明實施例的反垃圾郵件的方法的流程示意圖。
圖2是本發(fā)明實施例的郵件清洗前的內容的示意圖。
圖3是本發(fā)明實施例的郵件清洗后的內容的示意圖。
圖4是本發(fā)明實施例的反垃圾郵件的系統(tǒng)的結構示意圖。
圖5是本發(fā)明實施例的內容清洗模塊的結構示意圖。
附圖標號說明
信譽度檢查步驟s1
名單檢查步驟s2
內容清洗步驟s3
特征檢查步驟s4
投訴處理步驟s5
回復監(jiān)測步驟s6
垃圾郵件處理步驟s7。
具體實施方式
需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互結合,下面結合附圖和具體實施例對本發(fā)明作進一步詳細說明。
本發(fā)明實施例中若有方向性指示(諸如上、下、左、右、前、后……)僅用于解釋在某一特定姿態(tài)(如附圖所示)下各部件之間的相對位置關系、運動情況等,如果該特定姿態(tài)發(fā)生改變時,則該方向性指示也相應地隨之改變。
另外,在本發(fā)明中若涉及“第一”、“第二”等的描述僅用于描述目的,而不能理解為指示或暗示其相對重要性或者隱含指明所指示的技術特征的數量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個該特征。
請參照圖1,本發(fā)明實施例的反垃圾郵件的方法主要包括信譽度檢查步驟s1、名單檢查步驟s2、內容清洗步驟s3及特征檢查步驟s4。
信譽度檢查步驟s1:將收到的郵件的發(fā)件人ip及域名與預設的ip及域名信譽度進行對比檢查,并判斷對應的信譽度是否符合預設要求,不符合的退回郵件。
名單檢查步驟s2:對收到的郵件報文進行解析,獲得發(fā)件人地址信息,將發(fā)件人地址與預設的黑/白名單內的發(fā)件人地址信息進行對比檢查,并判斷是否通過檢查,不通過則將郵件發(fā)送至垃圾箱。
內容清洗步驟s3:對收到的郵件報文進行解析,獲得郵件的內容,對郵件的內容以模擬收件人可視化的方式進行清洗,并輸出清洗掉加擾數據的內容。優(yōu)選地,采用小型化的網頁瀏覽器對原始郵件進行渲染后輸出清洗后的內容。
特征檢查步驟s4:將輸出的內容的特征與預設的垃圾郵件內容特征進行對比檢查,并判斷是否包含垃圾郵件內容特征,不包含則將郵件發(fā)送至收件箱,包含則發(fā)送至垃圾箱。例如,傳統(tǒng)的郵件內容過濾功能主要通過特定的關鍵詞識別是否是垃圾郵件,垃圾郵件發(fā)件人可以通過在原文關鍵詞中隨機插入一些加擾的字符干擾,使郵件內容中的關鍵詞被混淆,導致郵件內容過濾模塊無法識別垃圾郵件的關鍵詞,從而突破過濾;而無論加擾前后,收件人看到的內容是一樣的,只是為了騙過郵件內容的過濾程序;如圖2所示,垃圾郵件數據庫中的關鍵詞“xraxxestore.com”被用<spanclass=“mmpn”>…</span>標簽方式加擾了,如果直接掃描原始郵件是無法匹配到這個關鍵詞的,躲過了基于內容掃描的垃圾郵件過濾模塊的檢測;如圖3所示,渲染、清洗后郵件內容,收件人(人類)視覺可見的內容一致,垃圾郵件特征關鍵字匹配“xraxxestore.com”這個詞能成功匹配,因此這封郵件被檢測為垃圾郵件。
作為一種實施方式,內容清洗步驟s3包括構建框架子步驟、渲染內容子步驟及輸出內容子步驟。
構建框架子步驟:根據郵件內容格式解析郵件內容,并構建內容的框架,將內容分段,分為多個區(qū)塊。大部分郵件(包括垃圾郵件)的內容格式都是html格式,把內容提提取出來后,根據html標簽框架構建內容的框架,例如<head>區(qū)塊、<body>區(qū)塊、<div>區(qū)塊等,每個區(qū)塊存儲在內存空間中。
渲染內容子步驟:根據郵件內容格式的樣式逐個渲染所述區(qū)塊內的對應內容,過濾干擾信息。根據郵件內容格式的樣式(例如,html格式郵件的css樣式)逐個渲染每個區(qū)塊,具體的,通過把區(qū)塊包含的標簽及文字填入內存中區(qū)塊內部,如果內部嵌套有區(qū)塊,以同樣的方式遞歸式的處理。渲染區(qū)塊的時候,如果遇到渲染樣式屬性,則根據樣式的內容對對應的區(qū)塊內容進行渲染,例如顏色、透明度、是否隱藏等處理。
輸出內容子步驟:輸出渲染后與視覺可見的內容一致的郵件內容。內存中的各個區(qū)塊構成的渲染后內容,即清洗后的郵件內容,可以把各種垃圾郵件的混淆機器用的多余標簽和信息都過濾掉,只保留與收件人(人類)視覺可見的內容一致的信息。
作為一種實施方式,特征檢查步驟s4后還包括:
投訴處理步驟s5:將收件人投訴的郵件的發(fā)件人地址保存至預設的黑名單內;降低所述投訴的郵件的發(fā)件人ip及域名的信譽度;提取所述投訴的郵件的內容特征并將其增加到預設的垃圾郵件內容特征內。
作為一種實施方式,特征檢查步驟s4后還包括:
回復監(jiān)測步驟s6:監(jiān)測收件人未投訴的郵件的回復信息,如果收件人回復所述未投訴的郵件,則將所述未投訴的郵件的發(fā)件人地址保存至預設的白名單內,并提高所述未投訴的郵件的發(fā)件人ip及域名的信譽度;如果收件人未回復所述未投訴的郵件,則提高所述未投訴的郵件的發(fā)件人ip及域名的信譽度。
作為一種實施方式,特征檢查步驟s4后還包括:
垃圾郵件處理步驟s7:降低垃圾箱內郵件的發(fā)件人ip及域名的信譽度,提取所述垃圾箱內郵件的內容特征并將其增加到預設的垃圾郵件內容特征內。
請參照圖4,本發(fā)明實施例的反垃圾郵件的系統(tǒng)主要包括信譽度檢查模塊、名單檢查模塊、內容清洗模塊及特征檢查模塊。
信譽度檢查模塊:將收到的郵件的發(fā)件人ip及域名與預設的ip及域名信譽度進行對比檢查,并判斷對應的信譽度是否符合預設要求,不符合的退回郵件;
名單檢查模塊:將郵件的發(fā)件人地址與預設的黑/白名單內的發(fā)件人地址信息進行對比檢查,并判斷是否通過檢查,不通過則將郵件發(fā)送至垃圾箱;
內容清洗模塊:對郵件的內容以模擬收件人可視化的方式進行清洗,并輸出清洗掉加擾數據的內容;
特征檢查模塊:將輸出的內容的特征與預設的垃圾郵件內容特征進行對比檢查,并判斷是否包含垃圾郵件內容特征,不包含則將郵件發(fā)送至收件箱,包含則發(fā)送至垃圾箱。
作為一種實施方式,內容清洗模塊包括構建框架子模塊、渲染內容子模塊及輸出內容子模塊,請參照圖5。
構建框架子模塊:根據郵件內容格式解析郵件內容,并構建內容的框架,將內容分段,分為多個區(qū)塊。
渲染內容子模塊:根據郵件內容格式的樣式逐個渲染所述區(qū)塊內的對應內容,過濾干擾信息。
輸出內容子模塊:輸出渲染后與視覺可見的內容一致的郵件內容。
作為一種實施方式,反垃圾郵件的系統(tǒng)還包括投訴處理模塊:將收件人投訴的郵件的發(fā)件人地址保存至預設的黑名單內;降低所述投訴的郵件的發(fā)件人ip及域名的信譽度;提取所述投訴的郵件的內容特征并將其增加到預設的垃圾郵件內容特征內。
作為一種實施方式,反垃圾郵件的系統(tǒng)還包括回復監(jiān)測模塊:監(jiān)測收件人未投訴的郵件的回復信息,如果收件人回復所述未投訴的郵件,則將所述未投訴的郵件的發(fā)件人地址保存至預設的白名單內,并提高所述未投訴的郵件的發(fā)件人ip及域名的信譽度;如果收件人未回復所述未投訴的郵件,則提高所述未投訴的郵件的發(fā)件人ip及域名的信譽度。
作為一種實施方式,反垃圾郵件的系統(tǒng)還包括垃圾郵件處理模塊:降低垃圾箱內郵件的發(fā)件人ip及域名的信譽度,提取所述垃圾箱內郵件的內容特征并將其增加到預設的垃圾郵件內容特征內。
另外,本領域普通技術人員可以理解實現上述實施例方法中的全部或部分流程,是可以通過程序來指令相關的硬件來完成,所述的程序可存儲于一計算機可讀存儲介質中,該程序在執(zhí)行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質可為磁碟、光盤、只讀存儲記憶體(read-onlymemory,rom)或隨機存儲記憶體(randomaccessmemory,ram)等。
盡管已經示出和描述了本發(fā)明的實施例,對于本領域的普通技術人員而言,可以理解在不脫離本發(fā)明的原理和精神的情況下可以對這些實施例進行多種變化、修改、替換和變型,本發(fā)明的范圍由所附權利要求及其等同范圍限定。