專利名稱:一種移動終端基于語音識別處理音樂的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及移動終端,更具體的說,涉及一種移動終端基于語音識別處理音樂的方法及系統(tǒng)。
背景技術(shù):
現(xiàn)在智能手機等移動終端都具有音樂播放功能,用戶在播放音樂時,往往將移動終端切到后臺,或者使其處于待機狀態(tài),當用戶聽到自己喜歡的音樂想要進行收藏時,需要手動打開音樂播放界面,并進行添加操作。如果用戶正在開車或處理其他事務(wù)不方便操作,或者移動終端置于包中或其他不方便取出的位置,現(xiàn)有的收藏音樂的方法會給用戶帶來極大的不便。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題在于,針對現(xiàn)有技術(shù)中的缺陷,提供一種使用簡單方便的移動終端基于語音識別處理音樂的方法及系統(tǒng)。本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是提供一種移動終端基于語音識別處理音樂的方法,包括以下步驟SI、當音樂播放軟件播放一個音樂文件時,同時開始采集用戶語音;S2、當采集到的所述用戶語音超過預(yù)設(shè)時間后,判斷所述用戶語音與正在播放的所述音樂文件是否相似;S3、如果相似,將所述音樂文件按照預(yù)設(shè)方式進行處理。在本發(fā)明所述的移動終端基于語音識別處理音樂的方法中,所述步驟SI具體包括以下步驟當音樂播放軟件通過無線通訊網(wǎng)絡(luò)或本地音樂庫獲取并播放所述音樂文件時,檢測所述用戶語音,當檢測到所述用戶語音時開始持續(xù)采集所述用戶語音。在本發(fā)明所述的移動終端基于語音識別處理音樂的方法中,所述步驟S2還包括根據(jù)語音頻譜線性或者所述預(yù)設(shè)時間內(nèi)相同音節(jié)的個數(shù)判斷所述用戶語音與正在播放的所述音樂文件是否相似。在本發(fā)明所述的移動終端基于語音識別處理音樂的方法中,所述步驟S3具體包括如果相似,收藏所述音樂文件,否則檢測所述音樂文件的剩余時間是否少于所述預(yù)設(shè)時間,如果是則放棄收藏,否則重新采集用戶語音并返回步驟S2。在本發(fā)明所述的移動終端基于語音識別處理音樂的方法中,所述步驟S3具體包括如果相似,收藏所述音樂文件,并將所述音樂文件通過無線通訊網(wǎng)絡(luò)發(fā)送給網(wǎng)絡(luò)服務(wù)器。本發(fā)明還提供一種移動終端基于語音識別處理音樂的系統(tǒng),包括語音采集單元、語音比較單元和處理單元;所述語音采集單元用于當音樂播放軟件播放一個音樂文件時開始采集用戶語
曰;所述語音比較單元用于當采集到的所述用戶語音超過預(yù)設(shè)時間后,判斷所述用戶語音與正在播放的所述音樂文件是否相似;所述處理單元用于在所述用戶語音與所述音樂文件相似時,將所述音樂文件按照預(yù)設(shè)方式進行處理。在本發(fā)明所述的移動終端基于語音識別處理音樂的系統(tǒng)中,所述語音采集單元還用于當音樂播放軟件通過無線通訊網(wǎng)絡(luò)或本地音樂庫獲取并播放所述音樂文件時,檢測所述用戶語音,當檢測到所述用戶語音時開始持續(xù)采集所述用戶語音。 在本發(fā)明所述的移動終端基于語音識別處理音樂的系統(tǒng)中,所述語音比較單元還用于根據(jù)語音頻譜線性或者所述預(yù)設(shè)時間內(nèi)相同音節(jié)的個數(shù)判斷所述用戶語音與正在播放的所述音樂文件是否相似。在本發(fā)明所述的移動終端基于語音識別處理音樂的系統(tǒng)中,所述處理單元還用于在所述用戶語音與所述音樂文件相似時收藏所述音樂文件;移動終端基于語音識別處理音樂的系統(tǒng)還包括檢測單元,所述檢測單元用于在所述用戶語音與所述音樂文件不相似時檢測所述音樂文件的剩余時間是否少于所述預(yù)設(shè)時間并在多于所述預(yù)設(shè)時間時指示所述語音采集單元重新采集用戶語音。在本發(fā)明所述的移動終端基于語音識別處理音樂的系統(tǒng)中,移動終端基于語音識別處理音樂的系統(tǒng)還包括通訊單元;所述處理單元還用于在所述用戶語音與所述音樂文件相似時收藏所述音樂文件并指示所述通訊單元將所述音樂文件通過無線通訊網(wǎng)絡(luò)發(fā)送給網(wǎng)絡(luò)服務(wù)器。本發(fā)明的移動終端基于語音識別處理音樂的方法及系統(tǒng)具有以下有益效果本發(fā)明以檢測用戶是否跟唱為依據(jù)而來判斷播放的音樂是否為用戶喜歡的音樂,通常只有用戶碰到自己喜歡的音樂時,才會主動或下意識的進行跟唱,以欣賞音樂或者學(xué)習(xí)新的音樂。本發(fā)明中用戶不需對移動終端進行任何操作,移動終端會自動檢測用戶語音,如果與播放的音樂相似,則認為用戶正在跟唱,則移動終端視其為用戶喜愛的音樂并進行收藏,簡單而方便。
下面將結(jié)合附圖及實施例對本發(fā)明作進一步說明,附圖中圖I是本發(fā)明一種移動終端基于語音識別處理音樂的方法的流程圖;圖2是圖I的一個具體實施例的流程圖;圖3是圖I的另一個具體實施例的流程圖;圖4是本發(fā)明一種移動終端基于語音識別處理音樂的系統(tǒng)的原理框圖。
具體實施例方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細說明。應(yīng)當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。如圖I所示的是一種移動終端基于語音識別處理音樂的方法,該方法包括以下步驟SI、當音樂播放軟件播放一個音樂文件時,同時開始采集用戶語音;S2、當采集到的所述用戶語音超過預(yù)設(shè)時間后,判斷所述用戶語音與正在播放的所述音樂文件是否相似;S3、如果相似,將所述音樂文件按照預(yù)設(shè)方式進行處理。該方法實際上是以檢測用戶是否跟唱為依據(jù)而來判斷播放的音樂是否為用戶喜歡的音樂,通常只有用戶碰到自己喜歡的音樂時,才會主動或下意識的進行跟唱,以欣賞音樂或者學(xué)習(xí)新的音樂。本發(fā)明中用戶不需對移動終端進行任何操作,移動終端會自動檢測 用戶語音并將其喜愛的音樂文件進行處理,如收藏或保存在特定的目錄下,簡單而方便。本發(fā)明中采集的用戶語音實際上是用戶跟唱的聲音,由于用戶可能第一次聽該音樂,其音調(diào)不一定準確,在判斷時只需兩者相似即可,而不需完全相同,此外,通過比較、判斷,也是為了防止將聊天的聲音或附近的其他響聲誤認為是用戶語音,導(dǎo)致誤判。預(yù)設(shè)時間的設(shè)置,是為了確定用戶對該音樂的喜好程度,其長度可以根據(jù)實際情況進行設(shè)置,如10秒、20秒或30秒,如果跟唱的時間比預(yù)設(shè)時間短,則可以認為該音樂文件并非用戶喜愛的音樂,跟唱只是一時興起的自然行為。播放的音樂文件可以是通過播放軟件聯(lián)網(wǎng)獲取的網(wǎng)絡(luò)音樂也可以是預(yù)存在移動終端的本地音樂。如果音樂文件來自網(wǎng)絡(luò),音樂播放軟件通過無線通訊網(wǎng)絡(luò)獲取音樂文件并播放;通過播放軟件從網(wǎng)絡(luò)上獲取的網(wǎng)絡(luò)音樂一般來說是一個緩存文件,在一段時間后可能會被清除或其他緩存文件所替換。如果音樂文件來自本地音樂庫,音樂播放軟件讀取預(yù)先存儲在本地音樂庫的音樂即可。如圖2所示,步驟SI還可以包括檢測用戶語音,當檢測到用戶語音時開始持續(xù)采集。相應(yīng)的,采集到的用戶語音超過預(yù)設(shè)時間后,開始比較判斷工作。此外,該步驟的另一種實施方式也可以是在音樂開始播放時就開始持續(xù)采集用戶語音,當音樂播放完后,判斷用戶語音中與播放的音樂相似的片段其時間是否超過預(yù)設(shè)時間,如果超過預(yù)設(shè)時間,即可認為是用戶喜愛的音樂,并將其進行收藏。具體的,本發(fā)明中可以通過語音頻譜線性或者預(yù)設(shè)時間內(nèi)相同音節(jié)的個數(shù)判斷所述用戶語音與正在播放的所述音樂文件是否相似。音節(jié)是聽覺能感受到的最自然的語音單位,有一個或幾個音素按一定規(guī)律組合而成。漢語中一個漢字就是一個音節(jié),每個音節(jié)由聲母、韻母和聲調(diào)三個部分組成;英語中一個元音音素可構(gòu)成一個音節(jié),一個元音音素和一個或幾個輔音音素結(jié)合也可以構(gòu)成一個音節(jié),本發(fā)明在判斷前可以根據(jù)實際需求對音節(jié)的判定規(guī)則進行定義。此外,還可以是在預(yù)設(shè)時間內(nèi),如果相同音節(jié)達到一定數(shù)量則認為其為用戶喜愛的音樂,即可將其收藏。由于本發(fā)明中當采集到的用戶語音超過預(yù)設(shè)時間即可進行一次判斷,但采集到的用戶語音可能是聊天的聲音或者其他不相關(guān)的聲音導(dǎo)致不相似而使收藏失敗,考慮到用戶之后還可能會開始跟唱,所以需要重復(fù)判斷的步驟,如圖3所示,步驟S3具體包括如果相似,收藏該音樂文件,否則檢測音樂的剩余時間是否少于預(yù)設(shè)時間,如果是則放棄收藏,否則重新采集用戶語音并返回步驟S2。由于其為持續(xù)采集過程,當再次采集得到的用戶語音超過預(yù)設(shè)時間后,又會進行一次判斷。在這里,如果音樂文件來自網(wǎng)絡(luò),則應(yīng)該將其下載到指定收藏目錄,如果其為本地文件,則可以將該文件復(fù)制或剪切到特定的收藏目錄下。有些用戶喜歡將自己喜愛的音樂上傳到網(wǎng)絡(luò)上存儲或分享,如圖4所示,步驟S3還可以進一步包括如果相似,收藏該音樂文件,并通過無線通訊網(wǎng)絡(luò)將其發(fā)送給網(wǎng)絡(luò)服務(wù)器,否則放棄收藏即可。這里的網(wǎng)絡(luò)服務(wù)器可以是網(wǎng)盤,可以是QQ空間、博客等,也可以是優(yōu)酷、音悅臺等音視頻網(wǎng)站。如圖4所示的是一種移動終端基于語音識別處理音樂的系統(tǒng),該系統(tǒng)包括語音采集單元2、語音比較單元3和處理單元4。其中,語音采集單元2用于當音樂播放軟件播放一個音樂文件時開始采集用戶語音;
語音比較單元3當采集到的所述用戶語音超過預(yù)設(shè)時間后,判斷所述用戶語音與正在播放的所述音樂文件是否相似;處理單元4用于在所述用戶語音與所述音樂文件相似時,將所述音樂文件按照預(yù)設(shè)方式進行處理。該系統(tǒng)實際上是以檢測用戶是否跟唱為依據(jù)而來判斷播放的音樂文件是否為用戶喜歡的音樂,通常只有用戶碰到自己喜歡的音樂時,才會主動或下意識的進行跟口昌,以欣賞音樂或者學(xué)習(xí)新的音樂。本發(fā)明中用戶不需對移動終端進行任何操作,移動終端會自動檢測用戶語音并將其喜愛的音樂進行處理,如收藏等,簡單而方便。語音采集單元2應(yīng)該包括相關(guān)的采集硬件及麥克風(fēng)。為了防止播放的音樂與用戶語音混合,一種優(yōu)選的實施方式是用戶通過耳機聽音樂,而用戶語音通過麥克風(fēng)進行采集。本發(fā)明中語音采集單元2所采集的用戶語音實際上是用戶跟唱的聲音,由于用戶可能第一次聽該音樂,其音調(diào)不一定準確,語音比較單元3在判斷時只需兩者相似即可,而不需完全相同,此外,通過語音比較單元3的比較、判斷,也是為了防止將聊天的聲音或附近的其他響聲誤認為是用戶語音,導(dǎo)致誤判。預(yù)設(shè)時間的設(shè)置,是為了確定用戶對該音樂的喜好程度,其長度可以根據(jù)實際情況進行設(shè)置,如10秒、20秒或30秒,如果跟唱的時間比預(yù)設(shè)時間短,則可以認為該音樂并非用戶喜愛的音樂,跟唱只是一時興起的自然行為。播放的音樂文件可以是通過音樂播放軟件聯(lián)網(wǎng)獲取的網(wǎng)絡(luò)音樂也可以是預(yù)存在移動終端的本地音樂。移動終端基于語音識別處理音樂的系統(tǒng)還包括通訊單元5,通訊單元5用于通過無線通訊網(wǎng)絡(luò)獲取音樂并保持至網(wǎng)絡(luò)音樂緩存區(qū)403中,其中,通過播放軟件從網(wǎng)絡(luò)上獲取的音樂一般來說是一個緩存文件,在一段時間后可能會被清除或其他緩存文件所替換。音樂播放單元首先讀取存儲在本地音樂存儲區(qū)402或網(wǎng)絡(luò)音樂緩存區(qū)403中的音樂然后再將讀取的音樂進行播放。進一步的,語音采集單元2還可以首先檢測用戶語音,只有在檢測到用戶語音后才開始持續(xù)采集。當然,其開始采集的時間可以根據(jù)實際情況進行設(shè)置。具體的,語音比較單元3可以通過語音頻譜線性或者預(yù)設(shè)時間內(nèi)相同音節(jié)的個數(shù)判斷所述用戶語音與正在播放的所述音樂文件是否相似。音節(jié)是聽覺能感受到的最自然的語音單位,有一個或幾個音素按一定規(guī)律組合而成。漢語中一個漢字就是一個音節(jié),每個音節(jié)由聲母、韻母和聲調(diào)三個部分組成;英語中一個元音音素可構(gòu)成一個音節(jié),一個元音音素和一個或幾個輔音音素結(jié)合也可以構(gòu)成一個音節(jié),本發(fā)明在判斷前可以根據(jù)實際需求對音節(jié)的判定規(guī)則進行定義。此外,還可以是在預(yù)設(shè)時間內(nèi),如果相同音節(jié)達到一定數(shù)量則認為其為用戶喜愛的音樂,即可將其收藏。此外,由于本發(fā)明中當采集到的用戶語音超過預(yù)設(shè)時間即可進行一次判斷,但采集到的用戶語音可能是聊天的聲音或者其他不相關(guān)的聲音導(dǎo)致其與音樂不相似,這樣的情況就會使收藏失敗,但用戶之后還可能會開始跟唱,如果再次進行比較判斷還是有可能再次對音樂文件進行處理。但如果音樂剩余的時間少于預(yù)設(shè)時間,語音采集單元2即使將用戶語音全部采集,也不可能全部將音樂收藏成功,此時,直接放棄收藏也是一樣的。移動終端基于語音識別處理音樂的系統(tǒng)還可以設(shè)置檢測單元6,檢測單元6用于當用戶語音與音樂不相似時檢測音樂的剩余時間是否少于預(yù)設(shè)時間并在多于預(yù)設(shè)時間時指示語音采集單元2重新采集用戶語音。
當音樂的剩余時間多于預(yù)設(shè)時間時,檢測單元6指示語音采集單元2重新采集用戶語音,語音比較單元3將會在采集到的用戶語音再次超過預(yù)設(shè)時間后重新進行判斷,而如果剩余時間少于預(yù)設(shè)時間,則直接放棄收藏即可,因為該音樂將不可能收藏成功。此外,鑒于有些用戶喜歡將自己喜愛的音樂上傳到網(wǎng)絡(luò)上存儲或分享,移動終端基于語音識別處理音樂的系統(tǒng)還包括通訊單元;處理單元4在用戶語音與音樂文件相似時收藏所述音樂文件并指示所述通訊單元5將所述音樂文件通過無線通訊網(wǎng)絡(luò)發(fā)送給網(wǎng)絡(luò)服務(wù)器。這里的網(wǎng)絡(luò)服務(wù)器可以是網(wǎng)盤,可以是QQ空間、博客等,也可以是優(yōu)酷、音悅臺等音視頻網(wǎng)站。雖然本發(fā)明是通過具體實施例進行說明的,本領(lǐng)域技術(shù)人員應(yīng)當明白,在不脫離本發(fā)明范圍的情況下,還可以對本發(fā)明進行各種變換及等同替代。另外,針對特定情形或材料,可以對本發(fā)明做各種修改,而不脫離本發(fā)明的范圍。因此,本發(fā)明不局限于所公開的具體實施例,而應(yīng)當包括落入本發(fā)明權(quán)利要求范圍內(nèi)的全部實施方式。
權(quán)利要求
1.一種移動終端基于語音識別處理音樂的方法,其特征在于,包括以下步驟 51、當音樂播放軟件播放一個音樂文件時,同時開始采集用戶語音; 52、當采集到的所述用戶語音超過預(yù)設(shè)時間后,判斷所述用戶語音與正在播放的所述音樂文件是否相似; 53、如果相似,將所述音樂文件按照預(yù)設(shè)方式進行處理。
2.根據(jù)權(quán)利要求I所述的移動終端基于語音識別處理音樂的方法,其特征在于,所述步驟SI具體包括以下步驟 當音樂播放軟件通過無線通訊網(wǎng)絡(luò)或從本地音樂庫獲取并播放所述音樂文件時,檢測所述用戶語音,當檢測到所述用戶語音時開始持續(xù)采集所述用戶語音。
3.根據(jù)權(quán)利要求I所述的移動終端基于語音識別處理音樂的方法,其特征在于,所述步驟S2還包括 根據(jù)語音頻譜線性或者所述預(yù)設(shè)時間內(nèi)相同音節(jié)的個數(shù)判斷所述用戶語音與正在播放的所述音樂文件是否相似。
4.根據(jù)權(quán)利要求I所述的移動終端基于語音識別處理音樂的方法,其特征在于,所述步驟S3具體包括 如果相似,收藏所述音樂文件,否則檢測所述音樂文件的剩余時間是否少于所述預(yù)設(shè)時間,如果是則放棄收藏,否則重新采集用戶語音并返回步驟S2。
5.根據(jù)權(quán)利要求I所述的移動終端基于語音識別處理音樂的方法,其特征在于,所述步驟S3具體包括 如果相似,收藏所述音樂文件,并將所述音樂文件通過無線通訊網(wǎng)絡(luò)發(fā)送給網(wǎng)絡(luò)服務(wù)器。
6.一種移動終端基于語音識別處理音樂的系統(tǒng),其特征在于,包括語音采集單元(2)、語音比較單元(3)和處理單元(4); 所述語音采集單元(2)用于當音樂播放軟件播放一個音樂文件時開始采集用戶語音; 所述語音比較單元(3)用于當采集到的所述用戶語音超過預(yù)設(shè)時間后,判斷所述用戶語音與正在播放的所述音樂文件是否相似; 所述處理單元(4)用于在所述用戶語音與所述音樂文件相似時,將所述音樂文件按照預(yù)設(shè)方式進行處理。
7.根據(jù)權(quán)利要求6所述的移動終端基于語音識別處理音樂的系統(tǒng),其特征在于,所述語音采集單元(2 )還用于當音樂播放軟件通過無線通訊網(wǎng)絡(luò)或本地音樂庫獲取并播放所述音樂文件時,檢測所述用戶語音,當檢測到所述用戶語音時開始持續(xù)采集所述用戶語音。
8.根據(jù)權(quán)利要求6所述的移動終端基于語音識別處理音樂的系統(tǒng),其特征在于,所述語音比較單元(3)還用于根據(jù)語音頻譜線性或者所述預(yù)設(shè)時間內(nèi)相同音節(jié)的個數(shù)判斷所述用戶語音與正在播放的所述音樂文件是否相似。
9.根據(jù)權(quán)利要求6所述的移動終端基于語音識別處理音樂的系統(tǒng),其特征在于,所述處理單元(4)還用于在所述用戶語音與所述音樂文件相似時收藏所述音樂文件; 移動終端基于語音識別處理音樂的系統(tǒng)還包括檢測單元(6),所述檢測單元(6)用于在所述用戶語音與所述音樂文件不相似時檢測所述音樂文件的剩余時間是否少于所述預(yù)設(shè)時間并在多于所述預(yù)設(shè)時間時指示所述語音采集單元(2)重新采集用戶語音。
10.根據(jù)權(quán)利要求6所述的移動終端基于語音識別處理音樂的系統(tǒng),其特征在于,移動終端基于語音識別處理音樂的系統(tǒng)還包括通訊單元(5); 所述處理單元(4)還用于在所述用戶語音與所述音樂文件相似時收藏所述音樂文件并指示所述通訊單元(5)將所述音樂文件通過無線通訊網(wǎng)絡(luò)發(fā)送給網(wǎng)絡(luò)服務(wù)器。
全文摘要
本發(fā)明公開了一種移動終端基于語音識別處理音樂的方法,包括以下步驟S1、當音樂播放軟件播放一個音樂文件時,同時開始采集用戶語音;S2、當采集到的所述用戶語音超過預(yù)設(shè)時間后,判斷所述用戶語音與正在播放的所述音樂文件是否相似;S3、如果相似,將所述音樂文件按照預(yù)設(shè)方式進行處理。本發(fā)明還公開了一種用于實施該方法的移動終端基于語音識別處理音樂的系統(tǒng)。本發(fā)明的移動終端基于語音識別處理音樂的方法及系統(tǒng)使用簡單方便。
文檔編號G10L15/00GK102917119SQ20121035319
公開日2013年2月6日 申請日期2012年9月19日 優(yōu)先權(quán)日2012年9月19日
發(fā)明者郭海明 申請人:東莞宇龍通信科技有限公司, 宇龍計算機通信科技(深圳)有限公司