日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種電子郵件的信息抽離方法、裝置和系統(tǒng)的制作方法

文檔序號(hào):10687790閱讀:521來源:國(guó)知局
一種電子郵件的信息抽離方法、裝置和系統(tǒng)的制作方法
【專利摘要】本發(fā)明實(shí)施例公開了一種電子郵件的信息抽離方法、裝置和系統(tǒng);本發(fā)明實(shí)施例在接收到電子郵件后,可以根據(jù)該電子郵件的發(fā)信地址獲取對(duì)應(yīng)的預(yù)設(shè)模板,并確定郵件內(nèi)容是否與該預(yù)設(shè)模板匹配,若是,則采用該預(yù)設(shè)模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離;否則,則按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,并根據(jù)分類結(jié)果生成模板,然后,采用生成的模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離;該方案可以提高其靈活性、以及信息抽離的可靠性和準(zhǔn)確性。
【專利說明】
_種電子郵件的信息抽禹方法、裝置和系統(tǒng)
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及通信技術(shù)領(lǐng)域,具體涉及一種電子郵件的信息抽離方法、裝置和系統(tǒng)。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,電子郵件已經(jīng)成互聯(lián)網(wǎng)應(yīng)用最廣的服務(wù)。電子郵件給人們帶來低廉且快速的通信方式的同時(shí),也帶來一些問題,比如,如何在眾多的電子郵件信息中快速提取所需要的信息,而這種從電子郵件中提取信息的技術(shù),我們稱為電子郵件的信息抽離。
[0003]在現(xiàn)有技術(shù)中,電子郵件的信息抽離,一般會(huì)通過對(duì)電子郵件內(nèi)容進(jìn)行關(guān)鍵字匹配、或通過正則表達(dá)式進(jìn)行過濾的方式來實(shí)現(xiàn)。例如,以銀行電子賬單為例,若需要抽離該銀行電子賬單的內(nèi)容,則可以在電子郵件內(nèi)容中查找“還款金額”、和“還款日期”等字樣,然后再根據(jù)查找到的字樣定位到具體的值上,等等。
[0004]在對(duì)現(xiàn)有技術(shù)的研究和實(shí)踐過程中,本發(fā)明的發(fā)明人發(fā)現(xiàn),現(xiàn)有方案在郵件內(nèi)容格式發(fā)生變化時(shí),若沒有及時(shí)更新匹配方法,則容易出現(xiàn)匹配錯(cuò)誤等情況,最終導(dǎo)致信息抽離失效或不準(zhǔn)確,靈活性較差。

【發(fā)明內(nèi)容】

[0005]本發(fā)明實(shí)施例提供一種電子郵件的信息抽離方法、裝置和系統(tǒng),可以提高其靈活性、信息抽離的可靠性和準(zhǔn)確性。
[0006]本發(fā)明實(shí)施例還提供一種電子郵件的信息抽離方法,包括:
[0007]接收電子郵件,所述電子郵件包括郵件內(nèi)容和發(fā)信地址;
[0008]根據(jù)所述發(fā)信地址獲取對(duì)應(yīng)的預(yù)設(shè)模板,并確定所述郵件內(nèi)容是否與所述預(yù)設(shè)模板匹配;
[0009]若是,則確定所述預(yù)設(shè)模板為抽離模板;
[0010]若否,則按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,根據(jù)分類結(jié)果生成模板,將生成的模板作為抽離模板;
[0011 ]采用抽離模板對(duì)所述郵件內(nèi)容進(jìn)行信息抽離。
[0012]相應(yīng)的,本發(fā)明實(shí)施例還提供一種電子郵件的信息抽離裝置,包括:
[0013]接收單元,用于接收電子郵件,所述電子郵件包括郵件內(nèi)容和發(fā)信地址;
[0014]獲取單元,用于根據(jù)所述發(fā)信地址獲取對(duì)應(yīng)的預(yù)設(shè)模板;
[0015]模板確定單元,用于確定所述郵件內(nèi)容是否與所述預(yù)設(shè)模板匹配,若是,則確定所述預(yù)設(shè)模板為抽離模板;若否,則按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,根據(jù)分類結(jié)果生成模板,將生成的模板作為抽離模板;
[0016]處理單元,用于采用抽離模板對(duì)所述郵件內(nèi)容進(jìn)行信息抽離。
[0017]此外,本發(fā)明實(shí)施例還提供一種電子郵件的信息抽離系統(tǒng),包括本發(fā)明實(shí)施例所提供的任一種電子郵件的信息抽離裝置。
[0018]本發(fā)明實(shí)施例在接收到電子郵件后,可以根據(jù)該電子郵件的發(fā)信地址獲取對(duì)應(yīng)的預(yù)設(shè)模板,并確定郵件內(nèi)容是否與該預(yù)設(shè)模板匹配,若是,則采用該預(yù)設(shè)模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離;否則,則按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,并根據(jù)分類結(jié)果生成模板,然后,采用生成的模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離;由于該方案在預(yù)設(shè)模板不適用時(shí),可以根據(jù)郵件內(nèi)容靈活地生成新的模板,并基于該新的模板進(jìn)行信息抽離,因此,即便郵件內(nèi)容格式發(fā)生變化,也不會(huì)有影響,大大減少識(shí)別錯(cuò)誤或匹配失效的情況的發(fā)生;總而言之,該方案相對(duì)于現(xiàn)有技術(shù)而言,可以提高其靈活性、以及信息抽離的可靠性和準(zhǔn)確性。
【附圖說明】
[0019]為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0020]圖1a是本發(fā)明實(shí)施例提供的電子郵件的信息抽離方法的場(chǎng)景示意圖;
[0021 ]圖1b是本發(fā)明實(shí)施例提供的電子郵件的信息抽離方法的流程圖;
[0022]圖2是本發(fā)明實(shí)施例提供的電子郵件的信息抽離方法的另一流程圖;
[0023]圖3a是本發(fā)明實(shí)施例提供的電子郵件的信息抽離裝置的結(jié)構(gòu)示意圖;
[0024]圖3b是本發(fā)明實(shí)施例提供的電子郵件的信息抽離裝置的另一結(jié)構(gòu)示意圖;
[0025]圖4是本發(fā)明實(shí)施例提供的服務(wù)器的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0026]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0027]本發(fā)明實(shí)施例提供一種電子郵件的信息抽離方法、裝置和系統(tǒng)。
[0028]其中,該電子郵件的信息抽離裝置具體可以集成在服務(wù)器,比如郵件服務(wù)器中,例如,如圖1a所示,郵件服務(wù)器在接收到發(fā)信服務(wù)器發(fā)送的電子郵件之后,可以根據(jù)該電子郵件的發(fā)信地址獲取對(duì)應(yīng)的預(yù)設(shè)模板,并確定該電子郵件的郵件內(nèi)容是否命中該預(yù)設(shè)模板(即確定該電子郵件的郵件內(nèi)容是否與該預(yù)設(shè)模板匹配),若是,則采用該預(yù)設(shè)模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離,否則,若不命中,則根據(jù)郵件內(nèi)容生成新的模板,比如,具體可以按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,根據(jù)分類結(jié)果生成模板,然后,采用該新的模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離;也就是說,若預(yù)設(shè)模板可以適用,則采用預(yù)設(shè)模板作為抽離模板,而若該預(yù)設(shè)模板不適用,則生成新的模板作為抽離模板,從而使得該抽離模板可以隨著郵件內(nèi)容格式的變化進(jìn)行自適應(yīng)調(diào)整,大大減少識(shí)別錯(cuò)誤或匹配失效的情況的發(fā)生;此后,還可以將抽離的信息發(fā)送給終端,以進(jìn)行顯示,比如以頁(yè)面或通過終端應(yīng)用(APP,AppliCat1n)的形式在終端中進(jìn)行顯示,以便用戶查看。
[0029]以下將分別進(jìn)行詳細(xì)說明。需說明的是,以下實(shí)施例的編號(hào)并不作為對(duì)實(shí)施例優(yōu)選次序的限制。
[0030]實(shí)施例一、
[0031]本實(shí)施例將從電子郵件的信息抽離裝置的角度進(jìn)行描述,該電子郵件的信息抽離裝置具體可以集成在服務(wù)器,比如郵件服務(wù)器中。
[0032]—種電子郵件的信息抽離方法,包括:接收電子郵件,該電子郵件包括郵件內(nèi)容和發(fā)信地址;根據(jù)該發(fā)信地址獲取對(duì)應(yīng)的預(yù)設(shè)模板,并確定該郵件內(nèi)容是否與該預(yù)設(shè)模板匹配;若是,則確定該預(yù)設(shè)模板為抽離模板;若否,則按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,根據(jù)分類結(jié)果生成模板,將生成的模板作為抽離模板;采用抽離模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離。
[0033]如圖1b所示,該電子郵件的信息抽離方法的具體流程可以如下:
[0034]101、接收電子郵件,比如,具體可以接收發(fā)信服務(wù)器發(fā)送的電子郵件。
[0035]其中,該電子郵件可以包括郵件內(nèi)容和發(fā)信地址等信息,發(fā)信地址指的是該電子郵件中發(fā)信人的地址,郵件內(nèi)容指的是該電子郵件正文的內(nèi)容。
[0036]102、根據(jù)該發(fā)信地址獲取對(duì)應(yīng)的預(yù)設(shè)模板。
[0037]例如,具體可以根據(jù)該發(fā)信地址從預(yù)設(shè)模板集合中獲取對(duì)應(yīng)的預(yù)設(shè)模板。
[0038]其中,該預(yù)設(shè)模板集合可以包括多個(gè)預(yù)設(shè)模板,分別對(duì)應(yīng)著不同的發(fā)信地址;該預(yù)設(shè)模板可以根據(jù)實(shí)際應(yīng)用的需求預(yù)先進(jìn)行設(shè)置,例如,以銀行電子賬單為例,可以根據(jù)不同的銀行的賬單電子郵件的內(nèi)容和格式設(shè)置不同的模板格式。其中,該模板可以采用多種形式來表示,比如,可以采用可擴(kuò)展標(biāo)記語言的路徑語言(XPath,XML Path)來表示。XPath是一種用來確定可擴(kuò)展標(biāo)記語言(XML,Extensible Markup Language)文檔中某部分信息位置的語言。比如,若該銀行電子賬單的內(nèi)容包括用戶姓名、還款金額、還款日期、以及還款明細(xì)等信息,則該模板具體可以為用戶姓名、還款金額、還款日期、以及還款明細(xì)等XPath集合的賬單模版,以此類推,等等。
[0039]需說明的是,該模板除了可以用XPath來表示之外,還可以采用其他的語音來表示,比如XPointer。該模板采用的語言具體可以與電子郵件的郵件內(nèi)容所采用的語言相匹配,若郵件內(nèi)容采用XPath,則模板也采用XPath,而若郵件內(nèi)容采用其他的語言,比如XPointer,則模板也可以進(jìn)行相應(yīng)調(diào)整,比如也采用XPointer,等等。
[0040]103、確定該郵件內(nèi)容是否與該預(yù)設(shè)模板匹配,即確定該郵件內(nèi)容是否可以命中該預(yù)設(shè)模板,若可以命中(即郵件內(nèi)容與該預(yù)設(shè)模板匹配),則確定該預(yù)設(shè)模板為抽離模板,并執(zhí)行步驟105;否則,若未能命中(S卩郵件內(nèi)容與該預(yù)設(shè)模板不匹配),則執(zhí)行步驟104。
[0041]其中,確定該郵件內(nèi)容是否命中該預(yù)設(shè)模板的方式可以有多種,例如,可以從該郵件內(nèi)容中從預(yù)設(shè)字段中提取關(guān)鍵字,得到第一關(guān)鍵字組,以及從預(yù)設(shè)模板的預(yù)設(shè)字段中提取關(guān)鍵字,得到第二關(guān)鍵字組,然后將第一關(guān)鍵字組與第二關(guān)鍵字組進(jìn)行匹配,若匹配,比如差異小于預(yù)設(shè)值(若預(yù)設(shè)值為0,則表示兩者一致),則確定該郵件內(nèi)容命中該預(yù)設(shè)模板;否則,若不匹配,比如差異不小于預(yù)設(shè)值,則確定該郵件內(nèi)容不命中該預(yù)設(shè)模板。又例如,還可以根據(jù)提取的位置信息來進(jìn)行匹配,具體可以如下:
[0042]S1、從該郵件內(nèi)容中提取位置信息,得到第一位置信息。
[0043]其中,根據(jù)郵件內(nèi)容所采用的頁(yè)面編程語言的不同,該位置信息的表現(xiàn)形式也會(huì)有所不同,比如,若該郵件內(nèi)容采用的是XML等語言,則此時(shí)可以從該郵件內(nèi)容中提取XPath信息,得到第一位置信息,等等。
[0044]S2、從該預(yù)設(shè)模板中提取位置信息,得到第二位置信息。
[0045]比如,若在步驟SI中,位置信息為XPath信息,則此時(shí),也可以從該預(yù)設(shè)模板中提取XPath信息,得到第二位置信息。
[0046]S3、確定該第一位置信息與第二位置信息是否匹配,若匹配,則確定該郵件內(nèi)容命中該預(yù)設(shè)模板;若不匹配,則確定該郵件內(nèi)容不命中該預(yù)設(shè)模板。
[0047]其中,匹配指的是差異小于預(yù)設(shè)值,即步驟S3具體可以如下:
[0048]確定該第一位置信息與第二位置信息二者的差異是否小于預(yù)設(shè)值,若是,則確定該郵件內(nèi)容命中該預(yù)設(shè)模板;若否,則確定該郵件內(nèi)容不命中該預(yù)設(shè)模板。
[0049]其中,該預(yù)設(shè)值可以根據(jù)實(shí)際應(yīng)用的需求進(jìn)行設(shè)置,在此不再贅述。
[0050]104、按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,根據(jù)分類結(jié)果生成模板,將生成的模板作為抽離模板。
[0051]其中,該預(yù)設(shè)策略可以根據(jù)實(shí)際應(yīng)用的需求而定,比如,可以采用樸素貝葉斯分類法、決策樹或相似分類法等來進(jìn)行分類,即步驟“按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類”具體可以如下:
[0052]采用樸素貝葉斯分類法構(gòu)建分類器,通過該分類器對(duì)郵件內(nèi)容進(jìn)行分類;或者,
[0053]采用決策樹構(gòu)建分類器,通過該分類器對(duì)郵件內(nèi)容進(jìn)行分類;或者,
[0054]采用相似分類法構(gòu)建分類器,通過該分類器對(duì)郵件內(nèi)容進(jìn)行分類。
[0055]在通過分類器對(duì)郵件內(nèi)容進(jìn)行分類時(shí),可以利用該分類器將郵件內(nèi)容劃分為多個(gè)字段,然后對(duì)劃分后的多個(gè)字段進(jìn)行合成以生成模板,例如,還是以XPath為例,則步驟“通過該分類器對(duì)郵件內(nèi)容進(jìn)行分類,根據(jù)分類結(jié)果生成模板”可以包括:
[0056]從郵件內(nèi)容中提取XPath信息,通過該分類器將提取到的XPath信息劃分為多個(gè)字段,對(duì)劃分后的多個(gè)字段進(jìn)行合成,以生成模板。
[0057]可選的,為了提高模板的適用率,在根據(jù)分類結(jié)果生成模板之后,還可以對(duì)生成的模板進(jìn)行審核,具體可以如下:
[0058]對(duì)生成的模板進(jìn)行審核,若審核通過,則執(zhí)行將生成的模板作為抽離模板的步驟;若審核未通過,則對(duì)郵件內(nèi)容進(jìn)行調(diào)整后,返回執(zhí)行按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類的步驟,即此時(shí)可以重新對(duì)郵件內(nèi)容進(jìn)行分類,并根據(jù)分類結(jié)果生成模板,然后再進(jìn)行審核,以此類推,直至生成的模板審核通過為止。
[0059]此外,在生成的模板審核通過時(shí),還可以將生成的模板添加至預(yù)設(shè)模板集合中,從而使得該預(yù)設(shè)模板集合中的模板可以不斷得到更新或補(bǔ)充。
[0060]105、采用抽離模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離。
[0061 ]例如,具體根據(jù)抽離模板中多個(gè)劃分字段分別從郵件內(nèi)容中提取相應(yīng)的內(nèi)容,并將提取的內(nèi)容添加至目標(biāo)文本相應(yīng)的劃分字段下。
[0062]其中,目標(biāo)文本指的是用于記錄抽離信息,且最終顯示給用戶的載體,比如銀行電子賬單、或水費(fèi)通知書,等等。
[0063]比如,以目標(biāo)文本為銀行電子賬單為例,則可以從郵件內(nèi)容中將命中抽離模板的用戶名稱、還款金額、還款時(shí)間、以及消費(fèi)明細(xì)等XPath信息對(duì)應(yīng)的內(nèi)容提取出來,分別對(duì)應(yīng)到銀行電子賬單的用戶名稱、還款金額、還款時(shí)間、以及消費(fèi)明細(xì)等信息上,等等。
[0064]可選的,在將信息抽離后,還可以將抽離信息通過頁(yè)面或APP等形式發(fā)送給終端,以提供給用戶。比如,可以將目標(biāo)文本,比如銀行電子賬單或水費(fèi)通知書等發(fā)送給終端,并在終端上進(jìn)彳丁顯不,等等。
[0065]由上可知,本實(shí)施例在接收到電子郵件后,可以根據(jù)該電子郵件的發(fā)信地址獲取對(duì)應(yīng)的預(yù)設(shè)模板,并確定郵件內(nèi)容是否命中該預(yù)設(shè)模板,若是,則采用該預(yù)設(shè)模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離;否則,則按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,并根據(jù)分類結(jié)果生成模板,然后,采用生成的模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離;由于該方案在預(yù)設(shè)模板不適用時(shí),可以根據(jù)郵件內(nèi)容靈活地生成新的模板,并基于該新的模板進(jìn)行信息抽離,因此,即便郵件內(nèi)容格式發(fā)生變化,也不會(huì)有影響,大大減少識(shí)別錯(cuò)誤或匹配失效的情況的發(fā)生;總而言之,該方案相對(duì)于現(xiàn)有技術(shù)而言,可以提高其靈活性、以及信息抽離的可靠性和準(zhǔn)確性。
[0066]實(shí)施例二、
[0067]根據(jù)實(shí)施例一所描述的方法,以下將舉例作進(jìn)一步詳細(xì)說明。
[0068]在本實(shí)施例中,將以銀行電子賬單,且該電子郵件的信息抽離裝置具體集成在郵件服務(wù)器中為例進(jìn)行說明。
[0069]如圖2所示,一種電子郵件的信息抽離方法,具體流程可以如下:
[0070]201、郵件服務(wù)器接收發(fā)信服務(wù)器發(fā)送的電子郵件。
[0071]其中,該電子郵件可以包括郵件內(nèi)容和發(fā)信地址等信息。
[0072]202、郵件服務(wù)器根據(jù)該發(fā)信地址從預(yù)設(shè)模板集合中獲取對(duì)應(yīng)的預(yù)設(shè)模板。
[0073]其中,該預(yù)設(shè)模板集合可以包括多個(gè)預(yù)設(shè)模板,分別對(duì)應(yīng)著不同的發(fā)信地址;該預(yù)設(shè)模板可以根據(jù)實(shí)際應(yīng)用的需求預(yù)先進(jìn)行設(shè)置。
[0074]例如,以銀行電子賬單為例,可以根據(jù)不同的銀行的賬單電子郵件的內(nèi)容和格式設(shè)置不同的模板格式,比如,若A銀行采用的是A格式,比如字段順序?yàn)椤坝脩裘Q”、“消費(fèi)明細(xì)”、“還款時(shí)間”、以及“還款金額”等,則對(duì)于A銀行,可以采用A格式的模板;而若B銀行采用的是B格式,比如字段順序?yàn)椤坝脩裘Q”、“還款金額”、“還款時(shí)間”、以及“消費(fèi)明細(xì)”等,則對(duì)于B銀行,可以采用B格式的模板。
[0075]其中,該模板可以采用多種形式來表示,比如,可以采用XPath或XPointer來表示,為例描述方便,在本實(shí)施例中,將均以XPath為例進(jìn)行說明。
[0076]203、郵件服務(wù)器確定該郵件內(nèi)容是否命中該預(yù)設(shè)模板,若可以命中,則確定該預(yù)設(shè)模板為抽離模板,并執(zhí)行步驟206;否則,若未能命中,則執(zhí)行步驟204。
[0077]例如,郵件服務(wù)器具體可以從該電子郵件的郵件內(nèi)容中提取XPath信息,得到第一位置信息,以及從該預(yù)設(shè)模板中提取XPath信息,得到第二位置信息,然后,確定該第一位置信息與第二位置信息是否匹配,若匹配,則確定該郵件內(nèi)容命中該預(yù)設(shè)模板;若不匹配,則確定該郵件內(nèi)容不命中該預(yù)設(shè)模板。
[0078]比如,以銀行電子賬單包括用戶名稱、還款金額、還款時(shí)間、以及消費(fèi)明細(xì)等信息為例,則郵件服務(wù)器具體可以從該電子郵件的郵件內(nèi)容中提取XPath信息,然后確定該XPath信息是否與預(yù)設(shè)模板中的用戶名稱、還款金額、還款時(shí)間、以及消費(fèi)明細(xì)等XPath信息匹配,若匹配,則確定該郵件內(nèi)容命中該預(yù)設(shè)模板,否則,若不匹配,則確定該郵件內(nèi)容不命中該預(yù)設(shè)模板。
[0079]204、郵件服務(wù)器采用樸素貝葉斯分類法構(gòu)建分類器,并通過該分類器對(duì)郵件內(nèi)容進(jìn)行分類,得到分類結(jié)果。
[0080]例如,郵件服務(wù)器可以從該電子郵件的郵件內(nèi)容中提取XPath信息,通過該分類器將提取到的XPath信息劃分為多個(gè)字段,將這多個(gè)字段作為分類結(jié)果。
[0081]比如,還是以銀行電子賬單包括用戶名稱、還款金額、還款時(shí)間、以及消費(fèi)明細(xì)等信息為例,則從該電子郵件的郵件內(nèi)容中提取XPath信息之后,可以通過分類器將提取到的XPath信息劃分為“用戶名稱字段”、“還款金額字段”、“還款時(shí)間字段”、“消費(fèi)明細(xì)字段”、以及“其他字段”等。
[0082]需說明的是,除了樸素貝葉斯分類法之外,還可以采用其他的方法進(jìn)行分類,比如決策樹或相似分類法等,在此不再贅述。
[0083]205、郵件服務(wù)器根據(jù)分類結(jié)果生成模板,將生成的模板作為抽離模板。
[0084]例如,若在步驟204中,已經(jīng)通過分類器將提取到的XPath信息劃分為多個(gè)字段,比如“用戶名稱字段”、“還款金額字段”、“還款時(shí)間字段”、“消費(fèi)明細(xì)字段”、以及“其他字段”等,則此時(shí),可以對(duì)劃分后的多個(gè)字段(即分類好的XPath信息)進(jìn)行合成,以生成模板。
[0085]可選的,為了提高模板的適用率,在根據(jù)分類結(jié)果生成模板之后,還可以對(duì)生成的模板進(jìn)行審核,具體可以如下:
[0086]對(duì)生成的模板進(jìn)行審核,若審核通過,則執(zhí)行將生成的模板作為抽離模板的步驟;若審核未通過,則對(duì)郵件內(nèi)容進(jìn)行調(diào)整后,返回執(zhí)行按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類的步驟,即此時(shí)可以重新對(duì)郵件內(nèi)容進(jìn)行分類,并根據(jù)分類結(jié)果生成模板,然后再進(jìn)行審核,以此類推,直至生成的模板審核通過為止。
[0087]此外,在生成的模板審核通過時(shí),還可以將生成的模板添加至預(yù)設(shè)模板集合中,從而使得該預(yù)設(shè)模板集合中的模板可以不斷得到更新或補(bǔ)充。
[0088]206、郵件服務(wù)器采用抽離模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離。
[0089]例如,還是以銀行電子賬單為例,則此時(shí)可以從郵件內(nèi)容中將命中抽離模板的用戶名稱、還款金額、還款時(shí)間、以及消費(fèi)明細(xì)等XPath信息對(duì)應(yīng)的內(nèi)容提取出來,分別對(duì)應(yīng)到銀行電子賬單的用戶名稱、還款金額、還款時(shí)間、以及消費(fèi)明細(xì)等信息上,等等。
[0090]比如,若郵件內(nèi)容中用戶名稱為“張三”,還款金額為“10000元”,還款時(shí)間為“20160501”,消費(fèi)明細(xì)為 “2016040 IXXXXl000元,20160420XXXX9000元”,則此時(shí),可以將“張三,,、“10000元”、“20160501”、以及 “20160401XXXX1000元,20160420XXXX9000元”等信息從郵件內(nèi)容中提取出來,然后,分別添加至銀行電子賬單中的用戶名稱、還款金額、還款時(shí)間、以及消費(fèi)明細(xì)等信息上,即添加完畢后,銀行電子賬單上將會(huì)顯示“用戶名稱:張三”,“還款金額:10000 元,,,“還款時(shí)間:20160501",“消費(fèi)明細(xì):2 O I 6 O 40 IXXXX I O O O 元,20160420XXXX9000元”,等等。
[0091]207、郵件服務(wù)器將抽離信息通過頁(yè)面或APP等形式發(fā)送給終端,以提供給用戶。
[0092]由上可知,本實(shí)施例的郵件服務(wù)器在接收到電子郵件后,可以根據(jù)該電子郵件的發(fā)信地址獲取對(duì)應(yīng)的預(yù)設(shè)模板,并從郵件內(nèi)容中提取XPath信息,確定提取的XPath信息是否命中該預(yù)設(shè)模板中的XPath信息,若是,則采用該預(yù)設(shè)模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離;否則,則按照預(yù)設(shè)策略對(duì)郵件內(nèi)容中提取出來的XPath信息進(jìn)行分類,并根據(jù)分類結(jié)果生成模板,然后,采用生成的模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離;由于該方案在預(yù)設(shè)模板不適用時(shí),可以根據(jù)郵件內(nèi)容靈活地生成新的模板,并基于該新的模板進(jìn)行信息抽離,因此,即便郵件內(nèi)容格式發(fā)生變化,也不會(huì)有影響,大大減少了識(shí)別錯(cuò)誤或匹配失效的情況的發(fā)生;而且,只需要簡(jiǎn)單的維護(hù)如用戶名稱、還款金額、還款時(shí)間、以及消費(fèi)明細(xì)等分類樣本,就可以應(yīng)對(duì)不斷變化的銀行電子賬單,因此,也可以大大提高其靈活性,以及維護(hù)成本;總而言之,該方案相對(duì)于現(xiàn)有技術(shù)而言,不僅可以提高其靈活性、以及信息抽離的可靠性和準(zhǔn)確性,而且,還可以降低維護(hù)的復(fù)雜性和成本。
[0093]實(shí)施例三、
[0094]為了更好地實(shí)施以上方法,本發(fā)明實(shí)施例還提供一種電子郵件的信息抽離裝置,簡(jiǎn)稱信息抽離裝置,如圖3a所示,該信息抽離裝置包括接收單元301、獲取單元302、模板確定單元303和處理單元304,如下:
[0095](D接收單元301;
[0096]接收單元301,用于接收電子郵件。
[0097]比如,接收單元301,具體可以用于接收發(fā)信服務(wù)器發(fā)送的電子郵件。
[0098]其中,該電子郵件可以包括郵件內(nèi)容和發(fā)信地址等信息,發(fā)信地址指的是該電子郵件中發(fā)信人的地址,郵件內(nèi)容指的是該電子郵件正文的內(nèi)容。
[0099](2)獲取單元 302;
[0100]獲取單元302,用于根據(jù)該發(fā)信地址獲取對(duì)應(yīng)的預(yù)設(shè)模板。
[0101]例如,獲取單元302,具體可以用于根據(jù)該發(fā)信地址從預(yù)設(shè)模板集合中獲取對(duì)應(yīng)的預(yù)設(shè)模板。
[0102]其中,該預(yù)設(shè)模板集合可以包括多個(gè)預(yù)設(shè)模板,分別對(duì)應(yīng)著不同的發(fā)信地址;該預(yù)設(shè)模板可以根據(jù)實(shí)際應(yīng)用的需求預(yù)先進(jìn)行設(shè)置,例如,以銀行電子賬單為例,可以根據(jù)不同的銀行的賬單電子郵件的內(nèi)容和格式設(shè)置不同的模板格式。其中,該模板可以采用多種形式來表示,比如,可以采用XPath或XPointer等來表示。
[0103](3)模板確定單元303;
[0104]模板確定單元303,用于確定該郵件內(nèi)容是否與該預(yù)設(shè)模板匹配(即確定該郵件內(nèi)容是否命中該預(yù)設(shè)模板),若是,則確定該預(yù)設(shè)模板為抽離模板;若否,則按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,根據(jù)分類結(jié)果生成模板,將生成的模板作為抽離模板;
[0105]其中,確定該郵件內(nèi)容是否命中該預(yù)設(shè)模板的方式可以有多種,例如,可以從該郵件內(nèi)容中從預(yù)設(shè)字段中提取關(guān)鍵字,得到第一關(guān)鍵字組,以及從預(yù)設(shè)模板的預(yù)設(shè)字段中提取關(guān)鍵字,得到第二關(guān)鍵字組,然后將第一關(guān)鍵字組與第二關(guān)鍵字組進(jìn)行匹配,若匹配,比如差異小于預(yù)設(shè)值,則確定該郵件內(nèi)容命中該預(yù)設(shè)模板;否則,若不匹配,比如差異不小于預(yù)設(shè)值,則確定該郵件內(nèi)容不命中該預(yù)設(shè)模板。又例如,還可以根據(jù)提取的位置信息來進(jìn)行匹配,即該模板確定單元303可以包括提取子單元和匹配子單元,如下:
[0106]該提取子單元,用于從該郵件內(nèi)容中提取位置信息,得到第一位置信息;從該預(yù)設(shè)模板中提取位置信息,得到第二位置信息;比如,可以從該郵件內(nèi)容中提取XPath信息,得到第一位置信息,以及從該預(yù)設(shè)模板中提取XPath信息,得到第二位置信息,等等。
[0107]該匹配子單元,用于確定該第一位置信息與第二位置信息是否匹配;若匹配,則確定該郵件內(nèi)容與該預(yù)設(shè)模板匹配(即確定該郵件內(nèi)容命中該預(yù)設(shè)模板),確定該預(yù)設(shè)模板為抽離模板;若不匹配,則確定該郵件內(nèi)容與該預(yù)設(shè)模板不匹配(即確定該郵件內(nèi)容不命中該預(yù)設(shè)模板),按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,根據(jù)分類結(jié)果生成模板,將生成的模板作為抽離模板。
[0108]其中,該預(yù)設(shè)策略可以根據(jù)實(shí)際應(yīng)用的需求而定,比如,可以采用樸素貝葉斯分類法、決策樹或相似分類法等來進(jìn)行分類,即:
[0109]該模板確定單元303,具體用于在確定該郵件內(nèi)容與該預(yù)設(shè)模板不匹配(即確定該郵件內(nèi)容不命中該預(yù)設(shè)模板)時(shí),采用樸素貝葉斯分類法、決策樹或相似分類法等構(gòu)建分類器,通過該分類器對(duì)郵件內(nèi)容進(jìn)行分類。
[0110]在通過分類器對(duì)郵件內(nèi)容進(jìn)行分類時(shí),可以利用該分類器將郵件內(nèi)容劃分為多個(gè)字段,然后對(duì)劃分后的多個(gè)字段進(jìn)行合成以生成模板,即:
[0111]該模板確定單元303,具體可以用于在確定該郵件內(nèi)容與該預(yù)設(shè)模板不匹配(即確定該郵件內(nèi)容不命中該預(yù)設(shè)模板)時(shí),采用樸素貝葉斯分類法構(gòu)建分類器,從郵件內(nèi)容中提取可擴(kuò)展標(biāo)記語言的路徑語言XPath信息,通過該分類器將提取到的XPath信息劃分為多個(gè)字段,對(duì)劃分后的多個(gè)字段進(jìn)行合成,以生成模板。
[0112](4)處理單元 304;
[0113]處理單元304,用于采用抽離模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離。
[0114]例如,處理單元304,具體可以用于根據(jù)抽離模板中多個(gè)劃分字段分別從郵件內(nèi)容中提取相應(yīng)的內(nèi)容,并將提取的內(nèi)容添加至目標(biāo)文本相應(yīng)的劃分字段下。
[0115]比如,以目標(biāo)文本為銀行電子賬單為例,則可以從郵件內(nèi)容中將命中抽離模板的用戶名稱、還款金額、還款時(shí)間、以及消費(fèi)明細(xì)等XPath信息對(duì)應(yīng)的內(nèi)容提取出來,分別對(duì)應(yīng)到銀行電子賬單的用戶名稱、還款金額、還款時(shí)間、以及消費(fèi)明細(xì)等信息上,等等。
[0116]可選的,在將信息抽離后,處理單元304還可以將抽離信息通過頁(yè)面或APP等形式發(fā)送給終端,以提供給用戶。比如,可以將目標(biāo)文本,比如銀行電子賬單或水費(fèi)通知書等發(fā)送給終端,并在終端上進(jìn)行顯示,等等。
[0117]可選的,為了提高模板的適用率,在根據(jù)分類結(jié)果生成模板之后,還可以對(duì)生成的模板進(jìn)行審核,
[0118]即如圖3b所示,該信息抽離裝置還可以包括審核單元305,如下:
[0119]該審核單元305,用于對(duì)生成的模板進(jìn)行審核;若審核通過,則觸發(fā)模板確定單元303執(zhí)行將生成的模板作為抽離模板的操作;若審核未通過,則對(duì)郵件內(nèi)容進(jìn)行調(diào)整后,觸發(fā)模板確定單元303執(zhí)行按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類的操作。
[0120]此外,在生成的模板審核通過時(shí),還可以將生成的模板添加至預(yù)設(shè)模板集合中,從而使得該預(yù)設(shè)模板集合中的模板可以不斷得到更新或補(bǔ)充;即如圖3b所示,該信息抽離裝置還可以包括還可以包括添加單元306,如下:
[0121]該添加單元306,可以用于將模板確定單元303生成的模板添加至預(yù)設(shè)模板集合中。
[0122]具體實(shí)施時(shí),以上各個(gè)單元可以作為獨(dú)立的實(shí)體來實(shí)現(xiàn),也可以進(jìn)行任意組合,作為同一或若干個(gè)實(shí)體來實(shí)現(xiàn),以上各個(gè)單元的具體實(shí)施可參見前面的方法實(shí)施例,在此不再贅述。
[0123]該電子郵件的信息抽離裝置具體可以集成在服務(wù)器,比如郵件服務(wù)器中。
[0124]由上可知,本實(shí)施例在接收到電子郵件后,可以由獲取單元302根據(jù)該電子郵件的發(fā)信地址獲取對(duì)應(yīng)的預(yù)設(shè)模板,并由模板確定單元303確定郵件內(nèi)容是否命中該預(yù)設(shè)模板,若是,則采用該預(yù)設(shè)模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離;否則,則按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,并根據(jù)分類結(jié)果生成模板,然后,由處理單元304采用生成的模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離;由于該方案在預(yù)設(shè)模板不適用時(shí),可以根據(jù)郵件內(nèi)容靈活地生成新的模板,并基于該新的模板進(jìn)行信息抽離,因此,即便郵件內(nèi)容格式發(fā)生變化,也不會(huì)有影響,大大減少識(shí)別錯(cuò)誤或匹配失效的情況的發(fā)生;總而言之,該方案相對(duì)于現(xiàn)有技術(shù)而言,可以提高其靈活性、以及信息抽離的可靠性和準(zhǔn)確性。
[0125]實(shí)施例四、
[0126]相應(yīng)的,本發(fā)明實(shí)施例還提供一種電子郵件的信息抽離系統(tǒng),簡(jiǎn)稱信息抽離系統(tǒng),可以包括本發(fā)明實(shí)施例所提供的任一種電子郵件的信息抽離裝置,具體可參見實(shí)施例三;其中,該電子郵件的信息抽離裝置具體可以集成在服務(wù)器,比如郵件服務(wù)器中,例如,可以如下:
[0127]郵件服務(wù)器,用于接收電子郵件,該電子郵件包括郵件內(nèi)容和發(fā)信地址;根據(jù)該發(fā)信地址獲取對(duì)應(yīng)的預(yù)設(shè)模板,并確定該郵件內(nèi)容是否命中該預(yù)設(shè)模板;若是,則確定該預(yù)設(shè)模板為抽離模板;若否,則按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,根據(jù)分類結(jié)果生成模板,將生成的模板作為抽離模板;采用抽離模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離。
[0128]可選的,在將信息抽離后,郵件服務(wù)器,還可以將抽離信息通過頁(yè)面或APP等形式發(fā)送給終端,以提供給用戶。
[0129]可選的,該郵件服務(wù)器,還可以用于對(duì)生成的模板進(jìn)行審核,若審核通過,則執(zhí)行將生成的模板作為抽離模板的操作;若審核未通過,則對(duì)郵件內(nèi)容進(jìn)行調(diào)整后,返回執(zhí)行按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類的操作。
[0130]此外,在生成的模板審核通過時(shí),郵件服務(wù)器還可以將生成的模板添加至預(yù)設(shè)模板集合中,從而使得該預(yù)設(shè)模板集合中的模板可以不斷得到更新或補(bǔ)充。
[0131 ]此外,該信息抽離系統(tǒng)還可以包括其他的設(shè)備,比如發(fā)信服務(wù)器和終端等,如下:
[0132]發(fā)信服務(wù)器,用于向郵件服務(wù)器發(fā)送電子郵件。
[0133]終端,用于接收郵件服務(wù)器發(fā)送的抽離信息。
[0134]以上各個(gè)設(shè)備的具體實(shí)施可參見前面的實(shí)施例,在此不再贅述。
[0135]由于該電子郵件的信息抽離系統(tǒng)可以包括本發(fā)明實(shí)施例所提供的任一種電子郵件的信息抽離裝置,因此,可以實(shí)現(xiàn)本發(fā)明實(shí)施例所提供的任一種電子郵件的信息抽離裝置所能實(shí)現(xiàn)的有益效果,詳見前面的實(shí)施例,在此不再贅述。
[0136]實(shí)施例五、
[0137]本發(fā)明實(shí)施例還提供一種服務(wù)器,如圖4所示,其示出了本發(fā)明實(shí)施例所涉及的服務(wù)器的結(jié)構(gòu)示意圖,具體來講:
[0138]該服務(wù)器可以包括一個(gè)或者一個(gè)以上處理核心的處理器401、一個(gè)或一個(gè)以上計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的存儲(chǔ)器402、射頻(Rad1 Frequency,RF)電路403、電源404、輸入單元405、以及顯示單元406等部件。本領(lǐng)域技術(shù)人員可以理解,圖4中示出的服務(wù)器結(jié)構(gòu)并不構(gòu)成對(duì)服務(wù)器的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。其中:
[0139]處理器401是該服務(wù)器的控制中心,利用各種接口和線路連接整個(gè)服務(wù)器的各個(gè)部分,通過運(yùn)行或執(zhí)行存儲(chǔ)在存儲(chǔ)器402內(nèi)的軟件程序和/或模塊,以及調(diào)用存儲(chǔ)在存儲(chǔ)器402內(nèi)的數(shù)據(jù),執(zhí)行服務(wù)器的各種功能和處理數(shù)據(jù),從而對(duì)服務(wù)器進(jìn)行整體監(jiān)控。可選的,處理器401可包括一個(gè)或多個(gè)處理核心;優(yōu)選的,處理器401可集成應(yīng)用處理器和調(diào)制解調(diào)處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,調(diào)制解調(diào)處理器主要處理無線通信??梢岳斫獾氖?,上述調(diào)制解調(diào)處理器也可以不集成到處理器401中。
[0140]存儲(chǔ)器402可用于存儲(chǔ)軟件程序以及模塊,處理器401通過運(yùn)行存儲(chǔ)在存儲(chǔ)器402的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理。存儲(chǔ)器402可主要包括存儲(chǔ)程序區(qū)和存儲(chǔ)數(shù)據(jù)區(qū),其中,存儲(chǔ)程序區(qū)可存儲(chǔ)操作系統(tǒng)、至少一個(gè)功能所需的應(yīng)用程序(比如聲音播放功能、圖像播放功能等)等;存儲(chǔ)數(shù)據(jù)區(qū)可存儲(chǔ)根據(jù)服務(wù)器的使用所創(chuàng)建的數(shù)據(jù)等。此外,存儲(chǔ)器402可以包括高速隨機(jī)存取存儲(chǔ)器,還可以包括非易失性存儲(chǔ)器,例如至少一個(gè)磁盤存儲(chǔ)器件、閃存器件、或其他易失性固態(tài)存儲(chǔ)器件。相應(yīng)地,存儲(chǔ)器402還可以包括存儲(chǔ)器控制器,以提供處理器401對(duì)存儲(chǔ)器402的訪問。
[0141]RF電路403可用于收發(fā)信息過程中,信號(hào)的接收和發(fā)送,特別地,將基站的下行信息接收后,交由一個(gè)或者一個(gè)以上處理器401處理;另外,將涉及上行的數(shù)據(jù)發(fā)送給基站。通常,RF電路403包括但不限于天線、至少一個(gè)放大器、調(diào)諧器、一個(gè)或多個(gè)振蕩器、用戶身份模塊(SIM)卡、收發(fā)信機(jī)、耦合器、低噪聲放大器(LNA,Low Noise Amplifier)、雙工器等。此夕卜,RF電路403還可以通過無線通信與網(wǎng)絡(luò)和其他設(shè)備通信。所述無線通信可以使用任一通信標(biāo)準(zhǔn)或協(xié)議,包括但不限于全球移動(dòng)通訊系統(tǒng)(GSM,Global System of Mobilecommunicat1n)、通用分組無線服務(wù)(GPRS,General Packet Rad1 Service)、碼分多址(CDMA,Code Divis1n Multiple Access)、寬帶碼分多址(WCDMA,Wideband CodeDivis1n Multiple Access)、長(zhǎng)期演進(jìn)(LTE,Long Term Evolut1n)、電子郵件、短消息服務(wù)(SMS,Short Messaging Service)等。
[0142]服務(wù)器還包括給各個(gè)部件供電的電源404(比如電池),優(yōu)選的,電源404可以通過電源管理系統(tǒng)與處理器401邏輯相連,從而通過電源管理系統(tǒng)實(shí)現(xiàn)管理充電、放電、以及功耗管理等功能。電源404還可以包括一個(gè)或一個(gè)以上的直流或交流電源、再充電系統(tǒng)、電源故障檢測(cè)電路、電源轉(zhuǎn)換器或者逆變器、電源狀態(tài)指示器等任意組件。
[0143]該服務(wù)器還可包括輸入單元405,該輸入單元405可用于接收輸入的數(shù)字或字符信息,以及產(chǎn)生與用戶設(shè)置以及功能控制有關(guān)的鍵盤、鼠標(biāo)、操作桿、光學(xué)或者軌跡球信號(hào)輸入。具體地,在一個(gè)具體的實(shí)施例中,輸入單元405可包括觸敏表面以及其他輸入設(shè)備。觸敏表面,也稱為觸摸顯示屏或者觸控板,可收集用戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸敏表面上或在觸敏表面附近的操作),并根據(jù)預(yù)先設(shè)定的程式驅(qū)動(dòng)相應(yīng)的連接裝置。可選的,觸敏表面可包括觸摸檢測(cè)裝置和觸摸控制器兩個(gè)部分。其中,觸摸檢測(cè)裝置檢測(cè)用戶的觸摸方位,并檢測(cè)觸摸操作帶來的信號(hào),將信號(hào)傳送給觸摸控制器;觸摸控制器從觸摸檢測(cè)裝置上接收觸摸信息,并將它轉(zhuǎn)換成觸點(diǎn)坐標(biāo),再送給處理器401,并能接收處理器401發(fā)來的命令并加以執(zhí)行。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類型實(shí)現(xiàn)觸敏表面。除了觸敏表面,輸入單元405還可以包括其他輸入設(shè)備。具體地,其他輸入設(shè)備可以包括但不限于物理鍵盤、功能鍵(比如音量控制按鍵、開關(guān)按鍵等)、軌跡球、鼠標(biāo)、操作桿等中的一種或多種。
[0144]該服務(wù)器還可包括顯示單元406,該顯示單元406可用于顯示由用戶輸入的信息或提供給用戶的信息以及服務(wù)器的各種圖形用戶接口,這些圖形用戶接口可以由圖形、文本、圖標(biāo)、視頻和其任意組合來構(gòu)成。顯示單元406可包括顯示面板,可選的,可以采用液晶顯示器(LCD,Liquid Crystal Display)、有機(jī)發(fā)光二極管(OLED,Organic Light-EmittingD1de)等形式來配置顯示面板。進(jìn)一步的,觸敏表面可覆蓋顯示面板,當(dāng)觸敏表面檢測(cè)到在其上或附近的觸摸操作后,傳送給處理器401以確定觸摸事件的類型,隨后處理器401根據(jù)觸摸事件的類型在顯示面板上提供相應(yīng)的視覺輸出。雖然在圖4中,觸敏表面與顯示面板是作為兩個(gè)獨(dú)立的部件來實(shí)現(xiàn)輸入和輸入功能,但是在某些實(shí)施例中,可以將觸敏表面與顯示面板集成而實(shí)現(xiàn)輸入和輸出功能。
[0145]盡管未示出,服務(wù)器還可以包括攝像頭、藍(lán)牙模塊等,在此不再贅述。具體在本實(shí)施例中,服務(wù)器中的處理器401會(huì)按照如下的指令,將一個(gè)或一個(gè)以上的應(yīng)用程序的進(jìn)程對(duì)應(yīng)的可執(zhí)行文件加載到存儲(chǔ)器402中,并由處理器401來運(yùn)行存儲(chǔ)在存儲(chǔ)器402中的應(yīng)用程序,從而實(shí)現(xiàn)各種功能,如下:
[0146]接收電子郵件,該電子郵件包括郵件內(nèi)容和發(fā)信地址;根據(jù)該發(fā)信地址獲取對(duì)應(yīng)的預(yù)設(shè)模板,并確定該郵件內(nèi)容是否命中該預(yù)設(shè)模板;若是,則確定該預(yù)設(shè)模板為抽離模板;若否,則按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,根據(jù)分類結(jié)果生成模板,將生成的模板作為抽離模板;采用抽離模板對(duì)該郵件內(nèi)容進(jìn)行信息抽離。
[0147]可選的,在將信息抽離后,還可以將抽離信息通過頁(yè)面或APP等形式發(fā)送給終端,以提供給用戶,即處理器401還可以用于執(zhí)行:
[0148]將抽離信息發(fā)送給終端。
[0149]可選的,為了提高模板的適用率,在根據(jù)分類結(jié)果生成模板之后,還可以對(duì)生成的模板進(jìn)行審核,即該處理器401還可以用于執(zhí)行:
[0150]對(duì)生成的模板進(jìn)行審核,若審核通過,則執(zhí)行將生成的模板作為抽離模板的操作;若審核未通過,則對(duì)郵件內(nèi)容進(jìn)行調(diào)整后,返回執(zhí)行按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類的操作。
[0151]此外,在生成的模板審核通過時(shí),還可以將生成的模板添加至預(yù)設(shè)模板集合中,從而使得該預(yù)設(shè)模板集合中的模板可以不斷得到更新或補(bǔ)充;即該處理器401還可以用于執(zhí)行:
[0152]將生成的模板添加至預(yù)設(shè)模板集合中。
[0153]以上各個(gè)操作的具體實(shí)施可參見前面的實(shí)施例,該服務(wù)器同樣可以實(shí)現(xiàn)本發(fā)明實(shí)施所提供的任一種信息抽離裝置所能實(shí)現(xiàn)的有益效果,詳見前面的實(shí)施例,在此不再贅述。
[0154]本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,該程序可以存儲(chǔ)于一計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,存儲(chǔ)介質(zhì)可以包括:只讀存儲(chǔ)器(R0M,Read Only Memory)、隨機(jī)存取記憶體(RAM,RandomAccess Memory)、磁盤或光盤等。
[0155]以上對(duì)本發(fā)明實(shí)施例所提供的一種電子郵件的信息抽離方法、裝置和系統(tǒng)進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
【主權(quán)項(xiàng)】
1.一種電子郵件的信息抽離方法,其特征在于,包括: 接收電子郵件,所述電子郵件包括郵件內(nèi)容和發(fā)信地址; 根據(jù)所述發(fā)信地址獲取對(duì)應(yīng)的預(yù)設(shè)模板,并確定所述郵件內(nèi)容是否與所述預(yù)設(shè)模板匹配; 若是,則確定所述預(yù)設(shè)模板為抽離模板; 若否,則按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,根據(jù)分類結(jié)果生成模板,將生成的模板作為抽離模板; 采用抽離模板對(duì)所述郵件內(nèi)容進(jìn)行信息抽離。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述郵件內(nèi)容是否與所述預(yù)設(shè)模板匹配,包括: 從所述郵件內(nèi)容中提取位置信息,得到第一位置信息; 從所述預(yù)設(shè)模板中提取位置信息,得到第二位置信息; 確定所述第一位置信息與第二位置信息是否匹配; 若匹配,則確定所述郵件內(nèi)容與所述預(yù)設(shè)模板匹配; 若不匹配,則確定所述郵件內(nèi)容與所述預(yù)設(shè)模板不匹配。3.根據(jù)權(quán)利要求2所述的方法,其特征在于, 所述從所述郵件內(nèi)容中提取位置信息,得到第一位置信息,包括:從所述郵件內(nèi)容中提取可擴(kuò)展標(biāo)記語言的路徑語言XPath信息,得到第一位置信息; 所述預(yù)設(shè)模板中提取位置信息,得到第二位置信息,包括:從所述預(yù)設(shè)模板中提取XPath信息,得到第二位置信息。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,包括: 采用樸素貝葉斯分類法、決策樹或相似分類法構(gòu)建分類器; 通過所述分類器對(duì)郵件內(nèi)容進(jìn)行分類。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述通過所述分類器對(duì)郵件內(nèi)容進(jìn)行分類,包括: 從郵件內(nèi)容中提取可擴(kuò)展標(biāo)記語言的路徑語言XPath信息; 通過所述分類器將提取到的XPath信息劃分為多個(gè)字段; 所述根據(jù)分類結(jié)果生成模板,包括:對(duì)劃分后的多個(gè)字段進(jìn)行合成,以生成模板。6.根據(jù)權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于,所述根據(jù)分類結(jié)果生成模板之后,還包括: 對(duì)生成的模板進(jìn)行審核; 若審核通過,則執(zhí)行將生成的模板作為抽離模板的步驟; 若審核未通過,則對(duì)郵件內(nèi)容進(jìn)行調(diào)整后,返回執(zhí)行按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類的步驟。7.根據(jù)權(quán)利要求6所述的方法,其特征在于,在生成的模板審核通過時(shí),還包括: 將生成的模板添加至預(yù)設(shè)模板集合中; 所述根據(jù)所述發(fā)信地址獲取對(duì)應(yīng)的預(yù)設(shè)模板,具體為:根據(jù)所述發(fā)信地址從預(yù)設(shè)模板集合中獲取對(duì)應(yīng)的預(yù)設(shè)模板。8.一種電子郵件的信息抽離裝置,其特征在于,包括: 接收單元,用于接收電子郵件,所述電子郵件包括郵件內(nèi)容和發(fā)信地址; 獲取單元,用于根據(jù)所述發(fā)信地址獲取對(duì)應(yīng)的預(yù)設(shè)模板; 模板確定單元,用于確定所述郵件內(nèi)容是否與所述預(yù)設(shè)模板匹配,若是,則確定所述預(yù)設(shè)模板為抽離模板;若否,則按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,根據(jù)分類結(jié)果生成模板,將生成的模板作為抽離模板; 處理單元,用于采用抽離模板對(duì)所述郵件內(nèi)容進(jìn)行信息抽離。9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述模板確定單元包括提取子單元和匹配子單元; 所述提取子單元,用于從所述郵件內(nèi)容中提取位置信息,得到第一位置信息;從所述預(yù)設(shè)模板中提取位置信息,得到第二位置信息; 所述匹配子單元,用于確定所述第一位置信息與第二位置信息是否匹配;若匹配,則確定所述郵件內(nèi)容與所述預(yù)設(shè)模板匹配,確定所述預(yù)設(shè)模板為抽離模板;若不匹配,則確定所述郵件內(nèi)容與所述預(yù)設(shè)模板不匹配,按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類,根據(jù)分類結(jié)果生成模板,將生成的模板作為抽離模板。10.根據(jù)權(quán)利要求9所述的裝置,其特征在于, 所述提取子單元,具體用于從所述郵件內(nèi)容中提取可擴(kuò)展標(biāo)記語言的路徑語言XPath信息,得到第一位置信息,以及從所述預(yù)設(shè)模板中提取XPath信息,得到第二位置信息。11.根據(jù)權(quán)利要求8所述的裝置,其特征在于, 所述模板確定單元,具體用于在確定所述郵件內(nèi)容與所述預(yù)設(shè)模板不匹配時(shí),采用樸素貝葉斯分類法、決策樹或相似分類法構(gòu)建分類器,通過所述分類器對(duì)郵件內(nèi)容進(jìn)行分類。12.根據(jù)權(quán)利要求11所述的裝置,其特征在于, 所述模板確定單元,具體用于在確定所述郵件內(nèi)容與所述預(yù)設(shè)模板不匹配時(shí),采用樸素貝葉斯分類法構(gòu)建分類器,從郵件內(nèi)容中提取可擴(kuò)展標(biāo)記語言的路徑語言XPath信息,通過所述分類器將提取到的XPath信息劃分為多個(gè)字段,對(duì)劃分后的多個(gè)字段進(jìn)行合成,以生成模板。13.根據(jù)權(quán)利要求8至12任一項(xiàng)所述的裝置,其特征在于,還包括審核單元; 所述審核單元,用于對(duì)生成的模板進(jìn)行審核;若審核通過,則觸發(fā)模板確定單元執(zhí)行將生成的模板作為抽離模板的操作;若審核未通過,則對(duì)郵件內(nèi)容進(jìn)行調(diào)整后,觸發(fā)模板確定單元執(zhí)行按照預(yù)設(shè)策略對(duì)郵件內(nèi)容進(jìn)行分類的操作。14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,還包括添加單元; 所述添加單元,用于將模板確定單元生成的模板添加至預(yù)設(shè)模板集合中; 所述獲取單元,具體用于根據(jù)所述發(fā)信地址從預(yù)設(shè)模板集合中獲取對(duì)應(yīng)的預(yù)設(shè)模板。15.—種電子郵件的信息抽離系統(tǒng),其特征在于,包括權(quán)利要求8至14任一項(xiàng)所述的電子郵件的信息抽離裝置。
【文檔編號(hào)】G06F17/30GK106056350SQ201610341717
【公開日】2016年10月26日
【申請(qǐng)日】2016年5月20日
【發(fā)明人】趙豐, 趙東, 劉俊, 樓宏微, 林華尚, 張丁
【申請(qǐng)人】騰訊科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1