2023百人會|劉俊峰：以人工智能達到高品質(zhì)的汽車聽享空間

作者：森林 2023-04-02 17:05:48 來源：新能源汽車網(wǎng)

　　2023年3月31日- 4月2日，2023中國電動汽車百人會論壇在北京釣魚臺國賓館舉行。本次論壇將圍繞“推進中國汽車產(chǎn)業(yè)現(xiàn)代化”主題，邀請各路代表，圍繞全球汽車產(chǎn)業(yè)發(fā)展形勢、新能源汽車高質(zhì)量發(fā)展路徑、中國智能網(wǎng)聯(lián)汽車發(fā)展戰(zhàn)略等多個話題展開討論。

　　在3月31日進行的第三屆雙智論壇上，科大訊飛股份有限公司副總裁、智能汽車事業(yè)部總經(jīng)理劉俊峰發(fā)表了主題為“以人工智能達到高品質(zhì)的汽車聽享空間”的演講，以下是內(nèi)容摘要：

　　科大訊飛股份有限公司副總裁、智能汽車事業(yè)部總經(jīng)理劉俊峰

　　尊敬的時秘書長，各位新到朋友，在這個時候如果再喋喋不休，會被扔雞蛋的。今天我演講的題目是“以人工智能達到高品質(zhì)的汽車聽享空間”，因為你們講智能駕駛講得太多了，我們必須把圍繞人的體驗這一環(huán)再拓展一步，再暢想一下，爭取不枉費下面那么好的大武器。

　　首先科大訊飛在2018-2022年我們拿了非常多的全球的頂尖賽事的人工智能比賽的冠軍。我們一直秉承“技術(shù)創(chuàng)新引領(lǐng)場景革命”。所以，不斷地來探索圍繞著在交互、體驗、新場景這樣一些鏈條里面的這種新產(chǎn)品和新服務(wù)。智能汽車事業(yè)部我們也是圍繞著智能交互、座艙、駕駛、服務(wù)來展開我們所有對于行業(yè)的發(fā)展的路徑。

　　今天重點講一下汽車的聲音鏈。也是在上個禮拜的時候，我們參加中國音響電子協(xié)會的年會，我們第一次拿到了一個叫創(chuàng)新領(lǐng)軍企業(yè)的這樣一個大獎，因為汽車的整個聲音鏈是當前的這個情況下比較亂的，大家在坐車的時候?qū)τ谶@一點雖然提到，很關(guān)注，很重要，但是現(xiàn)實情況是非常亂的。聲音對于每個人的體驗都是很關(guān)鍵，因為我們除了吃之外，對于眼睛和耳朵，為它們花的錢著實不少，尤其是耳朵。我們有開會的耳機，有聽音樂的耳機，然后游泳的時候還要買一個防水的耳機，家里面的電視，這個音響要求好了，有的時候還會買幾十萬的音箱伺候它。所以，在這樣一個鏈路上，就會把人的耳朵養(yǎng)壞，養(yǎng)壞之后它就變得不好伺候了。所以，在車上有很多人因為聲音的體驗不好，所有大家已經(jīng)不拿汽車這個場景來聽歌了，你們周邊肯定會有一些比較挑的人，他們會覺得在車上聽歌不如在家里面聽好，不如拿耳機聽好，所以就花了很多的錢去改了那套音響。但是，這樣一個改法也不一定真的達到一個好效果和對的體驗。已經(jīng)在后改的這個市場，這些用戶有10%左右是來改音響。

　　我們圍繞智能汽車向前發(fā)展的路徑上，其實也要思考一下，如果智能汽車從駕駛層面，從它的算力層面，從它的連接層面都已經(jīng)到了一個還不錯的情況，在車內(nèi)的聲音體驗應(yīng)該是什么樣子?我想可能有這么幾點是不可忽視的。

　　其一，他還是要聽得好，聽得舒服。

　　第二，圍繞車內(nèi)多場景和多交互的需要，他應(yīng)該在每一個場景的投放下都會恰如其分的好好表現(xiàn)。

　　第三，他應(yīng)該還是有一套跟OTA，跟FOTA、SOTA一起的一套聲級鏈條，就是它的聲音不應(yīng)該越聽越差，而應(yīng)該圍繞這樣一個車和你的喜好越聽越好。

　　展開只為他聽音樂，聽個聲音，獲取信息這樣的一個鏈條之外，還有非常多的場景值得探索，比方說，導航場景，在擔任駕車的時候那個導航和多人在艙內(nèi)的那個導航，那個聲音其實應(yīng)該一樣的。因為導航音只需要A座那個駕駛位聽到就好了，它為什么以干擾到后面的排座呢?如果車內(nèi)多幾個人，我們要想聊天，背景的音樂聲可以小一點嗎?如果是自動駕駛，API這個場景下，我們要讓這個車自己到庫里去，他用到周邊的行人，可以跟周邊的行人say hello嗎?其實這些都是圍繞聲音的場景展開，有非常多要去解決的體驗點的問題。

　　我們從去年，經(jīng)過三年多的研發(fā)、研究，我們從2021年11月18號廣州車展發(fā)布了科大訊飛的智能汽車音頻管理系統(tǒng)，我們就是希望來去用我們的專長來重新構(gòu)建汽車的聲音鏈條。這里面其實講起來一個原則很簡單，就是把車變成自己說，自己聽，自閉環(huán)。從解決前端聽的語音交互的問題，到后面解決說，說出來的聲音品質(zhì)，音響品質(zhì)更好的問題。所以，這樣一個鏈條我們希望在每個車上，都可以讓這樣的車像人一樣能聽會說。

　　這里面首先要業(yè)績非常多核心原來音頻的公放的調(diào)音的相關(guān)的算法，這些算法是個機理，沒有這些機理做保證，上面所有的想法基本上都是空談，just so so。再有一定是圍繞著我們構(gòu)想的所有用車的體驗的場景，把這個鏈條拉開，從交互上到聽感的獲音上，以及到我們跟內(nèi)容結(jié)合一些新的服務(wù)上。比方說，如果我們想要做一個K歌房，在汽車上，很多電車高功率，我們想做一個K歌房，這個時候拿起麥克風想唱幾句，突然發(fā)現(xiàn)那個聲音不對，就是它那個場景沒有考慮到KTV這個場景需要一個大空間，30平米，甚至100平米那樣一個大空間才可以唱得舒服。如果更多的被頂棚，被NVH這樣一些噪音干擾，你盡管加入了一個KTV的APP，或者已經(jīng)有手持麥克了，但是仍然唱起來覺得不舒服。這個其實就是圍繞著在調(diào)音，在聲學表現(xiàn)這個鏈條里我們要做的事情，還有類似的會議室、電話、電影院，我們?nèi)绻玫揭粋€7.1.4的片源，你想在一個車里面聽一個好的演唱會和一個大片，這個時候如果沒有基礎(chǔ)設(shè)施的保證，它是沒有那個感覺的。所以，這些都是要去處理的，從交互到聲音的整個鏈條。

　　剛才已經(jīng)舉了簡單的例子，我們再舉一個打電話的場景，其實這些后面都是一些小場景。電話來了主座先接，但是他是找后面的我們家兒子的，那這個電話我怎么給他移過去，他其實只要跟交互把聲音這樣一個鏈條拉開，就有非常多的處理上說，我接電話，把它拖拽到后排，我這塊不用響了，我聽的還是導航的聲音，后排打電話也沒干擾到我導航的聲音。這樣的一個聲音的切分就會讓車內(nèi)的場景有非常多的可能性。前排在導航，旁邊在電話，后面在聽音樂，最后一排可能孩子們在玩游戲。通過聲音的區(qū)分，我們就把車內(nèi)整個交互的場景變得多維了，變成更多維了。

　　再舉個例子，車內(nèi)開起來高速的時候聲音其實是非常吵的，輪噪、風噪影響到我們說話必須要吼。如果到多模態(tài)到聲學鏈條的解決，我們可以讓最后一排兩個人輕聲說話，那人的體驗就會更好一點。再結(jié)合DMS/OMS常用的那些攝像頭，我們把調(diào)音這個事情可以更進一步，更智能化一步。有的時候會找著那個“皇帝位”，每一個車的設(shè)置都會考慮不同的駕駛者的身高，他要去調(diào)面向耳朵的那個聲音朝向到底是怎么樣去定位。但是，我們有攝像頭，我們把多模態(tài)的交互和攝像頭通過對于駕駛者的判斷，這個位置是可以能夠靈活自己來變化的。這樣一種方式就可以真正因為駕駛者而不同，這個聲學的整個聚焦點就可以隨車移動，隨人而變化。

　　再打開，如果車內(nèi)后排有人睡覺了，在這個過程之中，我們是不是要讓后排那個聲音小一點，但是我還要導航，我也要聽幾首歌，這個時候就是音區(qū)加上多模態(tài)的感知形成了一些差異。

　　為了把這個事情做和，也為了規(guī)避掉所有“卡脖子”的那些限制，我們自己其實重新又構(gòu)建了很多算法，比方說，環(huán)繞的算法，比方說虛擬現(xiàn)場的算法，這樣都保證鏈路上面我們自己可以完全可控。

　　再有一些跟導航的結(jié)合，我們也跟很多導航廠商，包括我們基于BL開發(fā)上面的導航軟件，要去考慮到跟聲學相關(guān)的這樣一些場景該怎么表現(xiàn)，你提“前方請右拐”的時候，那個聲音是不是要靠右一點?“前方請調(diào)頭”的時候，那個聲音是不是要一直隨著那個轉(zhuǎn)向，要結(jié)束掉整個轉(zhuǎn)的那個過程，包括我們在做很多在L2++，L3以后，車在路上跑，旁邊有一些你需要規(guī)避的像消防車、急救車，以及包括可能很多危險車輛，在這個過程之中過來了，你要不要從他那方響起來相應(yīng)的聲音，這個時候其實都是要去討論，跟生態(tài)內(nèi)容，跟應(yīng)用如何來去做深度的結(jié)合的。我們也跟很多的生態(tài)合作伙伴去來討論怎么樣基于他們想要的聲音表現(xiàn)去構(gòu)建整個汽車的聲音鏈。這個東西其實還是比較傳統(tǒng)的，首先它是一個公放的樣子，但是我們把全球現(xiàn)在最新的ADSP用到了極致。當然，現(xiàn)在也有很多因為涉及到中美之間的芯片競爭，我們還要積極走國產(chǎn)化路線。現(xiàn)在我們新的國產(chǎn)化的平臺從國產(chǎn)芯片的替代的比例已經(jīng)接近了75%。這個鏈條說到底還是汽車的工程的鏈條里面的一部分。所以，沒有汽車的完整，工程鏈條的支撐，其實在這個事情上只能說是差強人意，只有算法是不可能的，它要完整的經(jīng)過整個汽車的工程驗證，然后軟硬件的協(xié)同。

　　在過往的三年里面，我們做的這樣一個事情也確確實實是讓很多的車企，包括很多的業(yè)內(nèi)的同仁感覺到比較詫異，說我們本來做語音交互，現(xiàn)在怎么打開做這個事情?但是，好像做對了。因為從中國很多汽車的品牌寄予的那個期望上，他們總覺得在那個喇叭上，那幾個英文字母很貴，會讓他們的車賣得很貴，這個還是個品牌自信的問題，或者我們沒有其他的東西可以說的問題。當我們把這個事情拉開之后，我認為它是座艙里面智能化非常重要的一環(huán)，而且它是可以通過智能化來去讓更多現(xiàn)在新的年輕的用戶實實在在感受到那些差異，而真正出現(xiàn)新的價值的。所以，這場仗我覺得我非常有信心再把它打下去。因為基于整個座艙的體驗鏈條，聲音的重要性大家都能夠意識到，它不是因為幾個字母而帶來的，它是真正用體驗價值來去產(chǎn)生的這種溢價的。

　　所以，我們在下半年也會再發(fā)一個拳頭級的產(chǎn)品，把整車公放的功率提升到2800瓦，通道數(shù)到24個，我們可以推動喇叭，甚至可以到30多個，接近40個，這樣的一種基礎(chǔ)硬件的布置會讓整個車從內(nèi)到外有非常多跟聲音相關(guān)的體驗就應(yīng)運而生了。我們非常愿意把這個事情跟大家一起討論。

　　這20年我們從語音交互，到多模態(tài)交互，到智能座艙，到智能服務(wù)，現(xiàn)在到公放，到駕駛，我們也是跟很多車企形成了非常好的合作關(guān)系。我們希望下一次面對著整個汽車智能化新的浪潮的來臨的時候，我們從聲音的這個鏈條配合這個新生代，我們一起攜手共創(chuàng)聲音的新生態(tài)，謝謝大家!

試駕、服務(wù)、優(yōu)惠購

網(wǎng)友評論

国产成人精品白浆久久69,大学生小嫩模无套内谢50p,粗大黑人巨精大战欧美成人,插插射啊爱视频日a级,国产97色在线 | 免费

2023百人會|劉俊峰：以人工智能達到高品質(zhì)的汽車聽享空間