車載聲音收集裝置以及聲音收集方法與流程

文檔序號：11064124閱讀：1023來源：國知局

本公開涉及車室內的聲音收集裝置以及聲音收集方法。

背景技術：

專利文獻1公開了下述內容：一邊使麥克風陣列(microphone array)的指向特性連續(xù)變化、一邊檢測說話者方向，通過信號處理來按每個說話者方向對麥克風陣列所取得的聲音數(shù)據(jù)進行分離，對每個分離出的聲音數(shù)據(jù)進行聲音識別(段落[0027]、[0028])。由此，專利文獻1如圖10所示那樣，當在駕駛席、副駕席等分別搭乘有說話者1010、1020的情況下，一邊容易地使麥克風陣列1000的指向特性范圍1110、1120、1130變化、一邊取得聲音數(shù)據(jù)，據(jù)此能夠易于分別對每個說話者1010、1020、1030進行聲音識別(段落[0044]、圖8)。

現(xiàn)有技術文獻

專利文獻1：日本特開2003-114699號公報

技術實現(xiàn)要素：

發(fā)明所要解決的問題

然而，專利文獻1所公開的現(xiàn)有技術有進一步改善的余地。

本公開提供一種即使在多個說話者在車室內同時發(fā)聲的情況下，也能防止在想要收集的特定說話者的聲音中混入其他說話者的聲音的車載聲音收集裝置等。

用于解決問題的技術方案

本公開的一個技術方案的車載聲音收集裝置具備：第一麥克風，其在車室內設置于第一搭乘者就坐的第一座位位置附近；第二麥克風，其在所述車室內設置于第二搭乘者就坐的第二座位位置附近；混入音推定部，其基于所述第二麥克風所取得的第二信號，推定混入到所述第一麥克風的、所述第二搭乘者發(fā)出的聲音即混入音；以及去噪部，其從所述第一麥克風所取得的第一信號中去除所述混入音。

發(fā)明效果

根據(jù)本發(fā)明，即使在多個搭乘者在車室內同時發(fā)聲的情況下，也能夠僅提取想要收集的特定說話者的聲音，能夠提高特定說話者的聲音識別率。

附圖說明

圖1是表示本公開的實施方式1中的車載聲音收集裝置所適用的聲音收集系統(tǒng)的整體結構的一例的圖。

圖2是表示本公開的實施方式1中的車載聲音收集裝置的處理的一例的流程圖。

圖3是表示本公開的實施方式2中的車載聲音收集裝置所適用的聲音收集系統(tǒng)的整體結構的一例的圖。

圖4是表示本公開的實施方式2中的車載聲音收集裝置的變形例的圖。

圖5是表示本公開的實施方式3中的車載聲音收集裝置所適用的車載系統(tǒng)的整體結構的一例的圖。

圖6是表示本公開的實施方式3的車載聲音收集裝置的處理的一例的流程圖。

圖7是表示本公開的實施方式4的車載聲音收集裝置所適用的聲音收集系統(tǒng)的整體結構的一例的圖。

圖8是說明發(fā)聲判定部檢測發(fā)聲區(qū)間的處理的圖。

圖9是表示本公開的實施方式4的車載聲音收集裝置的處理的一例的流程圖。

圖10是說明現(xiàn)有技術的圖。

標號說明

P1、P2、P3、P4：搭乘者

S1’、S2’、S3’、S4’：混入音信號

S1、S2、S3、S4：信號

SO：信號

SW1、SW2：開關(switch)

Sig2：包絡線

ΔT1：發(fā)聲區(qū)間

2、21、22、23：混入音推定部

2a、21a、21b、21c、2α：自適應濾波器

3：去噪部

5：車輛

6：發(fā)聲判定部

11、12、13、14：麥克風

31、32：選擇器

50：車室

51、52、53、54：座位

100：車載聲音收集裝置

200：后處理裝置

具體實施方式

(得到本公開的一個技術方案的經過)

在車室內用聲音輸入設備收集搭乘者發(fā)出的聲音，從所收集的聲音中識別控制命令，并對設備進行控制的技術得到了實用化。一般使用麥克風作為聲音輸入設備。在該情況下，麥克風安裝于被稱為頭頂控制臺(overhead console)的、位于駕駛席和副駕席的中間的頂棚部分。因此，搭乘者能夠以免提的方式輸入聲音。在頭頂控制臺設置有麥克風的情況下，麥克風位于離說話者的嘴邊數(shù)十厘米的位置。因此，不僅是說話者的聲音，連車室內的噪聲也混入麥克風中的可能性變高。由此，存在麥克風所收集的聲音的音質劣化，聲音識別率降低這一問題。

為了解決該問題，作為麥克風，可考慮使用指向性麥克風。

然而，指向性麥克風的聲音收集范圍具有某種程度的指向角，另外，在被稱為旁瓣(side lobe)的、指向性方向以外的方向上也具有靈敏度。因此，指向性麥克風未必能僅收集所針對的說話者的聲音。再者，車室內空間狹小，在前面、側面以及后面配置有多個容易反射聲音的玻璃制的窗戶。再者，前面和/或側面的窗戶位于搭乘者附近。因此，說話者以外的搭乘者的聲音由窗戶玻璃反射，聲音會從各種方向到達指向性麥克風。其結果，在多個說話者同時發(fā)聲的情況下，即使使指向性麥克風的指向性朝向想要收集的特定說話者的方向，指向性麥克風也會收集到特定說話者以外的聲音。因此，在以對單一說話者的聲音識別為前提的現(xiàn)狀的聲音識別裝置中，以往的結構存在會使特定說話者的聲音識別率降低這一問題。

另外，上述的專利文獻1為，一邊變更麥克風陣列的指向性的方向，一邊確定說話者的方向。

然而，如上所述，在車室內，說話者的聲音遍布在各種方向，聲音從各種方向輸入到麥克風陣列。因此，在專利文獻1中，存在判定為在實際存在于車室內的說話者以外的方向上也存在說話者的可能性。因此，專利文獻1無法準確地提取車室內的特定說話者的聲音。

本公開解決這些問題，提供一種能夠準確地提取車室內的特定的說話者的聲音的車載聲音收集裝置等。

根據(jù)該構成，可基于第二麥克風所取得的第二信號，推定混入到第一麥克風的、第二搭乘者發(fā)出的聲音即混入音。而且，可從第一麥克風所取得的第一信號中去除混入音。

因此，即使在多個搭乘者在車室內同時發(fā)聲的情況下，也能夠僅提取想要收集的特定說話者的聲音，能夠提高特定說話者的聲音識別率。另外，在免提通話中，也能夠去除由其他搭乘者的發(fā)聲造成的干擾，獲得高的聲音識別率。

在上述技術方案中，也可以為，具備：第一開關，其配置于所述第一座位位置附近；以及第二開關，其配置于所述第二座位位置附近，(1)在所述第一開關被按下的情況下，所述混入音推定部基于所述第二信號，推定混入到所述第一麥克風的、所述第二搭乘者發(fā)出的聲音即第一混入音，所述去噪部從所述第一信號中去除所述第一混入音，(2)在所述第二開關被按下的情況下，所述混入音推定部基于所述第一信號，推定混入到所述第二麥克風的、所述第一搭乘者發(fā)出的聲音即第二混入音，所述去噪部從所述第二信號中去除所述第二混入音。

根據(jù)該構成，設置有第一開關以及第二開關，因此，能夠準確地決定第一搭乘者和第二搭乘者中的哪一個是特定說話者。

在上述技術方案中，也可以為，還具備發(fā)聲判定部，其判定所述第一信號以及所述第二信號中是否包括發(fā)聲區(qū)間，(1)在所述發(fā)聲判定部判定為所述第一信號中包括發(fā)聲區(qū)間的情況下，所述混入音推定部基于所述第二信號，推定混入到所述第一麥克風的、所述第二搭乘者發(fā)出的聲音即第一混入音，所述去噪部從所述第一信號中去除所述第一混入音，(2)在所述發(fā)聲判定部判定為所述第二信號中包括發(fā)聲區(qū)間的情況下，所述混入音推定部基于所述第一信號，推定混入到所述第二麥克風的、所述第一搭乘者發(fā)出的聲音即第二混入音，所述去噪部從所述第二信號中去除所述第二混入音。

根據(jù)該構成，在第一信號中包括發(fā)聲區(qū)間的情況下，提取第一搭乘者的聲音，在第二信號中包括發(fā)聲區(qū)間的情況下，提取第二搭乘者的聲音。因此，能夠自動地決定第一搭乘者以及第二搭乘者中的哪一個是特定說話者。

在上述技術方案中，也可以為，對所述第一信號以及所述第二信號預先設定有優(yōu)先級，(3)在所述發(fā)聲判定部判定為所述第一信號以及所述第二信號中均包括發(fā)聲區(qū)間的情況下，如果所述第一信號的優(yōu)先級比所述第二信號高，則所述混入音推定部推定所述第一混入音，所述去噪部從所述第一信號中去除所述第一混入音，(4)在所述發(fā)聲判定部判定為所述第一信號以及所述第二信號中均包括發(fā)聲區(qū)間的情況下，如果所述第二信號的優(yōu)先級比所述第一信號高，則所述混入音推定部推定所述第二混入音，所述去噪部從所述第二信號中去除所述第二混入音。

根據(jù)該構成，在第一信號以及第二信號中均包括發(fā)聲區(qū)間的情況下，如果第一信號的優(yōu)先級比第二信號高，則提取第一搭乘者的聲音，如果第二信號的優(yōu)先級比第一信號高，則提取第二搭乘者的聲音。因此，能夠防止在第一搭乘者以及第二搭乘者同時發(fā)聲時無法決定哪一個是特定說話者這一情況。

在上述技術方案中，也可以為，所述第一麥克風以及所述第二麥克風是單一指向性麥克風。

根據(jù)該構成，在使用了單一指向性麥克風的情況下，能夠準確地提取特定說話者的聲音。

在上述技術方案中，也可以為，所述第一麥克風以及所述第二麥克風是由多個麥克風單元構成的陣列式麥克風(array-microphone)。

根據(jù)該構成，在使用了陣列式麥克風的情況下，能夠準確地提取特定說話者的聲音。

在上述技術方案中，也可以為，所述混入音推定部使用自適應濾波器來推定所述混入音，所述自適應濾波器的濾波系數(shù)校正為使得來自所述去噪部的輸出信號與輸入信號不相關或者獨立。

根據(jù)該構成，使用自適應濾波器來推定混入音，因此，能夠準確地求出混入音。另外，由于使用了自適應濾波器，因此能夠隨著使用而使推定混入音的準確性提高。

在上述技術方案中，也可以為，所述發(fā)聲判定部針對所述第一信號以及所述第二信號分別計算包絡線，檢測所述計算出的包絡線的最低水平(level)，基于所述檢測到的最低水平來設定閾值，將所述第一信號以及所述第二信號的水平大于所述設定的閾值的區(qū)間判定為所述發(fā)聲區(qū)間。

根據(jù)該構成，根據(jù)包絡線的最低水平而設定了閾值，因此，相比于使閾值固定的情況，能夠設定與場面相應的適合的閾值。

(實施方式1)

圖1是表示本公開的實施方式1中的車載聲音收集裝置100所適用的聲音收集系統(tǒng)的整體結構的一例的圖。聲音收集系統(tǒng)具備車載聲音收集裝置100以及后處理裝置200。

車載聲音收集裝置100具備麥克風11、12、混入音推定部2以及去噪部3。麥克風11(第一麥克風的一例)在車室50內設置于搭乘者P1(第一搭乘者的一例)就坐的座位51(第一座位的一例)的位置附近，是主要用于對搭乘者P1的聲音進行收集的麥克風。麥克風12(第二麥克風的一例)在車室50內設置于搭乘者P2(第二搭乘者的一例)就坐的座位52(第二座位的一例)的位置附近，是主要用于對搭乘者P2的聲音進行收集的麥克風。

在圖1的例子中，麥克風11配置于搭乘者P1的上側、且車室50的頂棚部，麥克風12配置于搭乘者P2的上側、且車室50的頂棚部。具體而言，麥克風11安裝于設置在頂棚部的搭乘者P1的遮陽板(sun visor)，麥克風12安裝于設置在頂棚部的搭乘者P2的遮陽板即可。或者，也可以為，麥克風11設置于搭乘者P1的前方的儀表盤(dashboard)，麥克風12設置于搭乘者P2的前方的儀表盤?；蛘?，麥克風11、12分別可以設置于設置在座位51及座位52之間的中央控制臺(center console)，也可以設置于設置在中央控制臺上側的頂棚部的頭頂控制臺(overhead console)。總之，只要是能夠對搭乘者P1、P2的聲音進行收集的車室50內的位置，麥克風11、12可以配置于任意的位置。

作為麥克風11、12，可采用單一指向性麥克風或者陣列式麥克風。在采用單一指向性麥克風的情況下，麥克風11、12例如配置為使指向性分別朝向搭乘者P1、P2的頭部。陣列式麥克風是多個麥克風單元接近地排列從而排列成陣列狀的麥克風，是能夠通過信號處理使指向性朝向任意方向的麥克風。在采用陣列式麥克風的情況下，麥克風11、12事先檢測搭乘者P1、P2各自的方向，并決定指向性的方向以使其朝向檢測到的方向即可。該處理例如通過未圖示的處理器和/或CPU來執(zhí)行即可。

混入音推定部2基于麥克風12所取得的信號S2(第二信號的一例)，推定表示混入到麥克風11的、搭乘者P2發(fā)出的聲音即混入音的混入音信號S2’。

在此，混入音推定部2具備自適應濾波器2a，使用自適應濾波器2a來推定混入音信號S2’即可。具體而言，混入音推定部2使用預定的自適應算法，校正自適應濾波器2a的濾波系數(shù)，以使得從去噪部3輸出的信號SO(輸出信號的一例)與自適應濾波器2a的輸入不相關或者獨立。如后所述，信號SO是麥克風11所取得的信號S1(第一信號的一例)減去混入音信號S2’而得到的信號。因此，若校正自適應濾波器2a的濾波系數(shù)以使得信號SO與自適應濾波器2a的輸入不相關或者獨立，則從自適應濾波器2a輸出的信號就表示混入音信號S2’，所述混入音信號S2’表示包含于信號S1的、搭乘者P2發(fā)出的聲音混入到搭乘者P1發(fā)出的聲音而成的聲音即混入音。

此外，混入音推定部2既可以定期地執(zhí)行濾波系數(shù)的校正處理，也可以在每當麥克風12取得一定水平以上的信號時執(zhí)行。在此，作為預定的自適應算法，能夠采用LMS(The least-mean-square，最小均方)算法和/或ICA(Independent Component Analysis，獨立成分分析)算法。作為自適應濾波器，可以采用LMS濾波器。

去噪部3從信號S1中減去混入音信號S2’，生成信號SO。在此，混入音信號S2’表示包含于信號S1的搭乘者P2發(fā)出的聲音即混入音。因此，即使在搭乘者P1、搭乘者P2同時發(fā)聲的情況下，信號SO也表示作為特定說話者的搭乘者P1發(fā)出的聲音。

在圖1中，混入音推定部2以及去噪部3既可以由DSP(數(shù)字信號處理器)等處理器構成，也可以通過CPU執(zhí)行存儲于ROM的控制程序來實現(xiàn)。這在后述的實施方式中也是相同的。

后處理裝置200例如由聲音識別裝置構成，使用信號SO來進行聲音識別。在此，聲音識別裝置使用公知的聲音識別方法來進行聲音識別即可。在圖1的例子中，信號SO表示搭乘者P1發(fā)出的聲音，因此，聲音識別裝置識別搭乘者P1發(fā)出的聲音。

在此，作為被識別的聲音，相當于用于控制各種設備的控制命令。作為控制命令，例如可以采用用于操作車輛5所具備的設備的控制命令。作為車輛5所具備的設備，例如可以采用空調設備、導航裝置、定速巡航(cruise control)裝置、電視機以及照明等。例如，若聲音識別裝置識別到調整空調設備的溫度的控制命令，則空調設備的溫度會被設定為識別出的控制命令所表示的溫度。

此外，作為后處理裝置200，也可以采用聲音識別裝置以外的例如免提裝置。免提裝置是搭乘者用于通過聲音來操作手機的裝置。例如，免提裝置使用藍牙(Bluetooth)(注冊商標)等通信方式將信號SO發(fā)送到手機。

車輛5例如由4輪汽車構成，具備車室50。在圖1的例子中，采用了5人座的乘用車作為車輛5，但這是一個例子，也可以采用兩人座或者7人座等的乘用車作為車輛5。另外，作為車輛5，也可以采用乘用車以外的大巴、卡車。

車室50具備座位51～54。座位51是配置于方向盤55的后方的駕駛席，由作為駕駛員的搭乘者P1就坐。

座位52是在俯視圖中配置于座位51的左側的副駕席，由搭乘者P2就坐。座位53、54是后部座位，分別設置于座位51、52的后方。

圖2是表示本公開的實施方式1中的車載聲音收集裝置100的處理的一例的流程圖。此外，圖2所示的流程圖既可以每隔一定的時間間隔而執(zhí)行，也可以在麥克風11、12收集到一定水平以上的聲音的情況下而執(zhí)行。這在后述的圖6、圖9的流程圖中也是相同的。首先，麥克風11、12分別取得信號S1、S2(S301)。

接下來，混入音推定部2通過使用自適應濾波器2a對信號S2進行濾波，推定表示包含于信號S1的搭乘者P2發(fā)出的聲音即混入音的混入音信號S2’(S302)。

接下來，去噪部3通過從信號S1中減去混入音信號S2’，生成信號SO。

這樣，根據(jù)本實施方式，即使在多個搭乘者在車室內同時發(fā)聲的情況下，也能夠僅提取想要收集的特定說話者的聲音，能夠提高特定說話者的聲音識別率。

此外，在上述說明中，說明了搭乘者P1為特定說話者，但也可以是搭乘者P2為特定說話者。在該情況下，在麥克風11以及去噪部3之間連接混入音推定部2，將麥克風12與去噪部3連接即可。

(實施方式2)

實施方式2的特征在于，除了前部座位以外，對后部座位也設置有麥克風。此外，在本實施方式中，對與實施方式1相同的構成要素，附加相同標號，并省略說明。圖3是表示本公開的實施方式2中的車載聲音收集裝置100所適用的聲音收集系統(tǒng)的整體結構的一例的圖。

在圖3中，與圖1的不同點在于：對后部座位即座位53、54分別設置有麥克風13、14；設置有與麥克風12、13、14各自對應的3個混入音推定部21、22、23。

在圖3的例子中，將搭乘者P1作為特定說話者，但這是一例，也可以將搭乘者P2、P3、P4中的某一個作為特定說話者。

麥克風13例如配置于座位53的上側的頂棚部，主要對搭乘者P3的聲音進行收集。麥克風14例如配置于座位54的上側的頂棚部，主要對搭乘者P4的聲音進行收集。與實施方式1同樣地，麥克風13、14既可以采用單一指向性麥克風，也可以采用陣列式麥克風。麥克風13、14的指向性分別朝向搭乘者P3、P4的方向。

以下，設麥克風13取得的信號為信號S4，設麥克風14取得的信號為信號S3。

混入音推定部21、22、23分別具備自適應濾波器21a、21b、21c。混入音推定部21使用信號S2和信號SO，推定表示混入麥克風11的、搭乘者P2發(fā)出的聲音即混入音的混入音信號S2’。在此，與實施方式1同樣地，混入音推定部21使用預定的自適應算法來校正自適應濾波器21a的濾波系數(shù)以使得信號SO與自適應濾波器21a的輸入不相關或者獨立，通過使用該自適應濾波器21a，對信號S2進行濾波，從而推定混入音信號S2’。混入音信號S2’是使用信號S2而推定出的信號，因此，主要表示混入信號S1中的搭乘者P2的聲音。

混入音推定部22、23也與混入音推定部21同樣地，分別使用信號S3、S4，來推定混入音信號S3’、S4’。在此，混入音信號S3’、S4’分別是使用信號S3、S4而推定出的信號，因此，主要表示混入信號S1中的搭乘者P3、P4的聲音。

去噪部3通過從信號S1中減去混入音信號S2’、S3’、S4’，生成信號SO。由此，能獲得將特定說話者即搭乘者P1發(fā)出的聲音以外的信號作為噪聲從信號S1中去除后得到的信號，以作為信號SO。

這樣，在實施方式2中，在對作為后部座位的座位53、54分別設置有麥克風13、14的情況下，也能夠僅提取特定說話者的聲音。

此外，在圖3中，在設特定說話者為搭乘者P1以外的搭乘者P2、P3、P4中的某一個搭乘者的情況下，對與這一個搭乘者以外的搭乘者對應的3個麥克風分別連接混入音推定部21、22、23即可。

圖4是表示本公開的實施方式2中的車載聲音收集裝置100的變形例的圖。在圖3中，麥克風11～14分別設置于俯視圖中的對應座位的左右方向的中央。相對于此，在圖4中，麥克風11～14分別在俯視圖中隔著從車室50的左右方向的正中經過的中心線而在左右方向上鄰接地配置。在采用圖4的技術方案的情況下，麥克風11、12設置于設置在車室50的頂棚部的前部座位用的頭頂控制臺即可。另外，麥克風13、14設置于設置在車室50的頂棚部的后部座位用的頭頂控制臺即可。此外，不論在采用圖3、圖4中的哪一個方式的情況下，麥克風11～14的指向性分別設定為朝向對應的搭乘者P1～P4的頭部即可。

(實施方式3)

實施方式3的車載聲音收集裝置100的特征在于，具備用于指定特定說話者的開關。圖5是表示本公開的實施方式3中的車載聲音收集裝置100所適用的車載系統(tǒng)的整體結構的一例的圖。此外，在本實施方式中，對與實施方式1相同的構成要素，附加相同標號，并省略說明。

在圖5中，與圖1的不同點在于：設置有開關SW1、SW2以及選擇器31、32。開關SW1、SW2例如由按鈕式的開關構成，分別配置于座位51、52的附近。在此，開關SW1、SW2例如配置于車室50內的頂棚部。在圖5的例子中，開關SW1、SW2以在俯視圖中隔著從車室50的左右方向的正中經過的中心線而在左右方向上鄰接的方式配置于頭頂控制臺。但是，開關SW1、SW2的配置位置并不限定于此，只要是搭乘者P1、P2能夠操作的位置，則分別可以配置于任意的位置。例如，也可以在儀表盤、中央控制臺和/或座位51、52的座部的背面?zhèn)?，配置開關SW1、SW2。

開關SW1、SW2分別相對于頂棚面凹陷自如地構成，例如，在從頂棚面凹陷的狀態(tài)下變?yōu)榻油?ON)，在與頂棚面位于同一面上的狀態(tài)下變?yōu)閿嚅_(OFF)。另外，開關SW1、SW2例如構成為排他性地接通以使得不會同時變?yōu)榻油?。開關SW1在將搭乘者P1作為特定說話者的情況下被接通，開關SW2在將搭乘者P2作為特定說話者的情況下被接通。以下，設為開關SW1、SW2不會同時被接通。

選擇器31在開關SW1接通且開關SW2斷開的情況下，選擇信號S1并輸出至去噪部3。另外，選擇器31在開關SW1斷開且開關SW2接通的情況下，選擇信號S2并輸出至去噪部3。

選擇器32在開關SW1接通且開關SW2斷開的情況下，選擇信號S2并輸出至混入音推定部2。另外，選擇器32在開關SW1斷開且開關SW2接通的情況下，選擇信號S1并輸出至混入音推定部2。

此外，選擇器31、32既可以由DSP構成，也可以通過CPU執(zhí)行存儲于ROM的控制程序來實現(xiàn)。這在實施方式4中也是相同的。

混入音推定部2在開關SW1接通且開關SW2斷開的情況下，被輸入信號S2，使用自適應濾波器2α來推定混入音信號S2’(第一混入音信號的一例)。另一方面，混入音推定部2在開關SW1斷開且開關SW2接通的情況下，被輸入信號S1，使用自適應濾波器2α來推定混入音信號S1’(第二混入音信號的一例)。

在此，與實施方式1同樣地，在由選擇器32選擇了信號S2的情況下，自適應濾波器2α是下述濾波器：使用預定的自適應算法，校正了其濾波系數(shù)，以使得信號SO與自適應濾波器2α的輸入不相關或者獨立。因此，混入音信號S2’表示包含于信號S1的、搭乘者P2發(fā)出的聲音即混入音。

另外，與實施方式1同樣地，在由選擇器32選擇了信號S1的情況下，自適應濾波器2α是下述濾波器：使用預定的自適應算法，校正了其濾波系數(shù)，以使得信號SO與自適應濾波器2α的輸入不相關或者獨立。因此，混入音信號S1’表示包含于信號S2的、搭乘者P1發(fā)出的聲音即混入音。

圖6是表示本公開的實施方式3的車載聲音收集裝置100的處理的一例的流程圖。首先，麥克風11、12分別取得信號S1、S2(S601)。

接下來，如果開關SW1接通(S602中的判斷結果為“是”)，則選擇器31選擇信號S1并輸出至去噪部3，選擇器32選擇信號S2并輸出至混入音推定部2(S603)。

接下來，混入音推定部2使用自適應濾波器2α對信號S2進行濾波，推定混入音信號S2’，并輸出至去噪部3(S604)。

接下來，去噪部3從信號S1中減去混入音信號S2’，生成信號SO(S605)。

在開關SW1斷開且開關SW2接通的情況下(S602中的判斷結果為“否”且S606中的判斷結果為“是”)，選擇器31選擇信號S2并輸出至去噪部3，選擇器32選擇信號S1并輸出至混入音推定部2(S607)。

接下來，混入音推定部2使用自適應濾波器2α對信號S1進行濾波，推定混入音信號S1’，并輸出至去噪部3(S608)。

接下來，去噪部3從信號S2中減去混入音信號S1’，生成信號SO(S609)。

在開關SW1斷開且開關SW2斷開的情況下(S602中的判斷結果為“否”且S606中的判斷結果為“否”)，處理結束。

這樣，在本實施方式中，設置有開關SW1、SW2，因此，能夠準確地決定搭乘者P1、P2中的哪一個是特定說話者。

此外，在圖6的流程圖中，在開關SW1斷開且開關SW2斷開的情況下(S602中的判斷結果為“否”且S606中的判斷結果為“否”)，結束了處理，但本公開并不限定于此。例如，在開關SW1斷開且開關SW2斷開的情況下，選擇器31、32分別可以將搭乘者P1判定為特定說話者，并選擇信號S1、S2，也可以將搭乘者P2判定為特定說話者，并選擇信號S2、S1?；蛘撸绻绾笫龅膶嵤┓绞?所示的那樣對信號S1、S2設定有優(yōu)先級，則選擇器31、32也可以將與信號S1、S2中優(yōu)先級高的一方對應的搭乘者判定為特定說話者。或者，也可以將與信號S1、S2中水平高的一方的信號對應的搭乘者判定為特定說話者。此外，優(yōu)先級是事先所設定的，例如預先存儲于存儲裝置。另外，優(yōu)先級也可以為能夠根據(jù)搭乘者的操作而事后變更。

另外，在圖5的例子中，設置了2個麥克風11、12，但本公開并不限定于此，也可以如圖3所示那樣設置麥克風13、14。

(實施方式4)

實施方式4的車載聲音收集裝置100的特征在于，將在發(fā)聲的搭乘者決定為特定說話者。圖7是表示本公開的實施方式4的車載聲音收集裝置100所適用的聲音收集系統(tǒng)的整體結構的一例的圖。此外，在本實施方式中，對與實施方式1相同的構成要素，附加相同標號，并省略說明。

在圖7中，與圖1的不同點在于：設置有發(fā)聲判定部6以及選擇器31、32。發(fā)聲判定部6判定信號S1、S2中是否包括發(fā)聲區(qū)間。圖8是說明發(fā)聲判定部6檢測發(fā)聲區(qū)間的處理的圖。在圖8中，縱軸表示麥克風11、12所取得的信號(以下記載為“聲音信號Sig1”)的水平，橫軸表示時間。

聲音信號Sig1具有振幅高頻變動的波形。發(fā)聲判定部6針對聲音信號Sig1設定處理區(qū)間ΔT。此外，以沿時間軸挪動一定的時間間隔的方式設定處理區(qū)間ΔT。接下來，發(fā)聲判定部6在處理區(qū)間ΔT內求出聲音信號Sig1的包絡線Sig2。在圖8中，包絡線Sig2設定于聲音信號Sig1的上側，但這是一例，也可以設定于下側。

接下來，發(fā)聲判定部6檢測包絡線Sig2的最低水平A1。接下來，發(fā)聲判定部6將使最低水平A1倍增預定倍而得到的值設定為閾值Th。在此，對最低水平A1乘以比1大的數(shù)(例如2、3這樣的數(shù))。

接下來，發(fā)聲判定部6將聲音信號Sig1的水平在閾值Th以上的區(qū)間判定為發(fā)聲區(qū)間ΔT1。

此外，發(fā)聲判定部6既可以由DSP構成，也可以通過CPU執(zhí)行存儲于ROM的控制程序來實現(xiàn)。

重新參照圖7。在發(fā)聲判定部6判定為信號S1中包括發(fā)聲區(qū)間的情況下，選擇器31選擇信號S1并輸出至去噪部3，選擇器32選擇信號S2并輸出至混入音推定部2。

另外，在發(fā)聲判定部6判定為信號S2中包括發(fā)聲區(qū)間的情況下，選擇器31選擇信號S2并輸出至去噪部3，選擇器32選擇信號S1并輸出至混入音推定部2。

再者，在發(fā)聲判定部6判定為信號S1、S2這兩者中包括發(fā)聲區(qū)間的情況下，如果信號S1的優(yōu)先級比信號S2高，則選擇器31選擇信號S1并輸出至去噪部3，選擇器32選擇信號S2并輸出至混入音推定部2。

再者，在發(fā)聲判定部6判定為在信號S1、S2這兩者中包括發(fā)聲區(qū)間的情況下，如果信號S2的優(yōu)先級比信號S1高，則選擇器31選擇信號S2并輸出至去噪部3，選擇器32選擇信號S1并輸出至混入音推定部2。

與實施方式3同樣地，混入音推定部2具備自適應濾波器2α。混入音推定部2被輸入由選擇器32選擇的信號S2，使用自適應濾波器2α來推定混入音信號S2’(第一混入音信號的一例)。另外，混入音推定部2被輸入由選擇器32選擇的信號S1，使用自適應濾波器2α來推定混入音信號S1’(第二混入音信號的一例)。

圖9是表示本公開的實施方式4的車載聲音收集裝置100的處理的一例的流程圖。首先，麥克風11、12分別取得信號S1、S2(S901)。接下來，發(fā)聲判定部6分別從信號S1、S2中檢測發(fā)聲區(qū)間(S902)。

在僅信號S1中包括發(fā)聲區(qū)間的情況下(S903中的判斷結果為“是”且S904中的判斷結果為“否”)，選擇器31選擇信號S1并輸出至去噪部3，選擇器32選擇信號S2，并輸出至混入音推定部2(S906)。

接下來，混入音推定部2使用自適應濾波器2α對信號S2進行濾波，推定混入音信號S2’，并輸出至去噪部3(S907)。

接下來，去噪部3從信號S1中減去混入音信號S2’，生成信號SO(S908)。

另一方面，在僅信號S2中包括發(fā)聲區(qū)間的情況下(S903中的判斷結果為“否”且S910中的判斷結果為“是”)，選擇器31選擇信號S2并輸出至去噪部3，選擇器32選擇信號S1并輸出至混入音推定部2(S911)。

接下來，混入音推定部2使用自適應濾波器2α對信號S1進行濾波，推定混入音信號S1’，并輸出至去噪部3(S912)。

接下來，去噪部3從信號S2中減去混入音信號S1’，生成信號SO(S913)。

在信號S1以及信號S2中包括發(fā)聲區(qū)間的情況下(S903中的判斷結果為“是”且S904中的判斷結果為“是”)，如果信號S1的優(yōu)先級比信號S2高(S905中的判斷結果為“是”)，則執(zhí)行上述的S906、S907、S908的處理。

另一方面，如果信號S2的優(yōu)先級比信號S1高(S905中判斷結果為“否”)，則執(zhí)行上述的S911、S912、S913的處理。

在信號S1以及信號S2中均未包括發(fā)聲區(qū)間的情況下(S903中的判斷結果為“否”且S910中的判斷結果為“否”)，處理結束。

這樣，根據(jù)本實施方式，在信號S1中包括發(fā)聲區(qū)間的情況下，提取搭乘者P1的聲音，在信號S2中包括發(fā)聲區(qū)間的情況下，提取搭乘者P2的聲音。因此，能夠自動地決定搭乘者P1、P2中的哪一個是特定說話者。

另外，在信號S1、S2中均包括發(fā)聲區(qū)間的情況下，根據(jù)信號S1、S2的優(yōu)先級，提取搭乘者P1、P2中的某一方的聲音。因此，能夠防止在搭乘者P1、P2同時發(fā)聲時無法決定哪一個是特定說話者這一情況。

此外，在本實施方式中，在信號S1、S2中均包括發(fā)聲區(qū)間的情況下，根據(jù)信號S1、S2的優(yōu)先級來決定成為去噪對象的信號，但本公開并不限定于此。例如，也可以將信號S1、S2中水平高的一方的信號決定為成為去噪對象的信號。在該情況下，發(fā)聲判定部6計算發(fā)聲區(qū)間內的信號的平均水平，將平均水平高的一方的信號決定為成為去噪對象的信號即可。而且，在發(fā)聲判定部6判定為信號S1的水平比信號S2高的情況下，選擇器31、32、混入音推定部2以及去噪部3進行與上述的信號S1的優(yōu)先級比信號S2高的情況下的處理相同的處理即可。另一方面，在發(fā)聲判定部6判定為信號S2的水平比信號S1高的情況下，選擇器31、32、混入音推定部2以及去噪部3進行與上述的信號S2的優(yōu)先級比信號S1高的情況下的處理相同的處理即可。

另外，在圖7的例子中，設置了2個麥克風11、12，但本公開并不限定于此，也可以如圖3所示那樣設置麥克風13、14。

另外，在實施方式1～4中，說明了將麥克風以及開關設置于座位的附近的情況，但也可以設置于座位。在該情況下，麥克風以及開關例如設置于座位的頭枕(headrest)等即可。另外，后部座位的麥克風例如也可以配置于前部座位的后部座位側的面。即，在本公開中“座位位置附近”是指一種包括座位的概念。

產業(yè)上的可利用性

關于本公開的車載聲音收集裝置，即使在多個搭乘者在車室內同時發(fā)聲的情況下，也能夠僅提取想要收集的特定說話者的聲音，因此，對在車室內進行聲音識別的技術是有用的。

完整全部詳細技術資料下載

當前第1頁1 2 3