国产成人精品白浆久久69,大学生小嫩模无套内谢50p,粗大黑人巨精大战欧美成人,插插射啊爱视频日a级,国产97色在线 | 免费

新能源汽車網(wǎng)歡迎您!

2023百人會|劉俊峰:以人工智能達到高品質(zhì)的汽車聽享空間

作者:森林 2023-04-02 17:05:48 來源:新能源汽車網(wǎng)

  2023年3月31日- 4月2日,2023中國電動汽車百人會論壇在北京釣魚臺國賓館舉行。本次論壇將圍繞“推進中國汽車產(chǎn)業(yè)現(xiàn)代化”主題,邀請各路代表,圍繞全球汽車產(chǎn)業(yè)發(fā)展形勢、新能源汽車高質(zhì)量發(fā)展路徑、中國智能網(wǎng)聯(lián)汽車發(fā)展戰(zhàn)略等多個話題展開討論。

  在3月31日進行的第三屆雙智論壇上,科大訊飛股份有限公司副總裁、智能汽車事業(yè)部總經(jīng)理 劉俊峰發(fā)表了主題為“以人工智能達到高品質(zhì)的汽車聽享空間”的演講,以下是內(nèi)容摘要:

劉俊峰

  科大訊飛股份有限公司副總裁、智能汽車事業(yè)部總經(jīng)理 劉俊峰

  尊敬的時秘書長,各位新到朋友,在這個時候如果再喋喋不休,會被扔雞蛋的。今天我演講的題目是“以人工智能達到高品質(zhì)的汽車聽享空間”,因為你們講智能駕駛講得太多了,我們必須把圍繞人的體驗這一環(huán)再拓展一步,再暢想一下,爭取不枉費下面那么好的大武器。

  首先科大訊飛在2018-2022年我們拿了非常多的全球的頂尖賽事的人工智能比賽的冠軍。我們一直秉承“技術(shù)創(chuàng)新引領(lǐng)場景革命”。所以,不斷地來探索圍繞著在交互、體驗、新場景這樣一些鏈條里面的這種新產(chǎn)品和新服務(wù)。智能汽車事業(yè)部我們也是圍繞著智能交互、座艙、駕駛、服務(wù)來展開我們所有對于行業(yè)的發(fā)展的路徑。

  今天重點講一下汽車的聲音鏈。也是在上個禮拜的時候,我們參加中國音響電子協(xié)會的年會,我們第一次拿到了一個叫創(chuàng)新領(lǐng)軍企業(yè)的這樣一個大獎,因為汽車的整個聲音鏈是當前的這個情況下比較亂的,大家在坐車的時候?qū)τ谶@一點雖然提到,很關(guān)注,很重要,但是現(xiàn)實情況是非常亂的。聲音對于每個人的體驗都是很關(guān)鍵,因為我們除了吃之外,對于眼睛和耳朵,為它們花的錢著實不少,尤其是耳朵。我們有開會的耳機,有聽音樂的耳機,然后游泳的時候還要買一個防水的耳機,家里面的電視,這個音響要求好了,有的時候還會買幾十萬的音箱伺候它。所以,在這樣一個鏈路上,就會把人的耳朵養(yǎng)壞,養(yǎng)壞之后它就變得不好伺候了。所以,在車上有很多人因為聲音的體驗不好,所有大家已經(jīng)不拿汽車這個場景來聽歌了,你們周邊肯定會有一些比較挑的人,他們會覺得在車上聽歌不如在家里面聽好,不如拿耳機聽好,所以就花了很多的錢去改了那套音響。但是,這樣一個改法也不一定真的達到一個好效果和對的體驗。已經(jīng)在后改的這個市場,這些用戶有10%左右是來改音響。

  我們圍繞智能汽車向前發(fā)展的路徑上,其實也要思考一下,如果智能汽車從駕駛層面,從它的算力層面,從它的連接層面都已經(jīng)到了一個還不錯的情況,在車內(nèi)的聲音體驗應(yīng)該是什么樣子?我想可能有這么幾點是不可忽視的。

  其一,他還是要聽得好,聽得舒服。

  第二,圍繞車內(nèi)多場景和多交互的需要,他應(yīng)該在每一個場景的投放下都會恰如其分的好好表現(xiàn)。

  第三,他應(yīng)該還是有一套跟OTA,跟FOTA、SOTA一起的一套聲級鏈條,就是它的聲音不應(yīng)該越聽越差,而應(yīng)該圍繞這樣一個車和你的喜好越聽越好。

  展開只為他聽音樂,聽個聲音,獲取信息這樣的一個鏈條之外,還有非常多的場景值得探索,比方說,導航場景,在擔任駕車的時候那個導航和多人在艙內(nèi)的那個導航,那個聲音其實應(yīng)該一樣的。因為導航音只需要A座那個駕駛位聽到就好了,它為什么以干擾到后面的排座呢?如果車內(nèi)多幾個人,我們要想聊天,背景的音樂聲可以小一點嗎?如果是自動駕駛,API這個場景下,我們要讓這個車自己到庫里去,他用到周邊的行人,可以跟周邊的行人say hello嗎?其實這些都是圍繞聲音的場景展開,有非常多要去解決的體驗點的問題。

  我們從去年,經(jīng)過三年多的研發(fā)、研究,我們從2021年11月18號廣州車展發(fā)布了科大訊飛的智能汽車音頻管理系統(tǒng),我們就是希望來去用我們的專長來重新構(gòu)建汽車的聲音鏈條。這里面其實講起來一個原則很簡單,就是把車變成自己說,自己聽,自閉環(huán)。從解決前端聽的語音交互的問題,到后面解決說,說出來的聲音品質(zhì),音響品質(zhì)更好的問題。所以,這樣一個鏈條我們希望在每個車上,都可以讓這樣的車像人一樣能聽會說。

  這里面首先要業(yè)績非常多核心原來音頻的公放的調(diào)音的相關(guān)的算法,這些算法是個機理,沒有這些機理做保證,上面所有的想法基本上都是空談,just so so。再有一定是圍繞著我們構(gòu)想的所有用車的體驗的場景,把這個鏈條拉開,從交互上到聽感的獲音上,以及到我們跟內(nèi)容結(jié)合一些新的服務(wù)上。比方說,如果我們想要做一個K歌房,在汽車上,很多電車高功率,我們想做一個K歌房,這個時候拿起麥克風想唱幾句,突然發(fā)現(xiàn)那個聲音不對,就是它那個場景沒有考慮到KTV這個場景需要一個大空間,30平米,甚至100平米那樣一個大空間才可以唱得舒服。如果更多的被頂棚,被NVH這樣一些噪音干擾,你盡管加入了一個KTV的APP,或者已經(jīng)有手持麥克了,但是仍然唱起來覺得不舒服。這個其實就是圍繞著在調(diào)音,在聲學表現(xiàn)這個鏈條里我們要做的事情,還有類似的會議室、電話、電影院,我們?nèi)绻玫揭粋€7.1.4的片源,你想在一個車里面聽一個好的演唱會和一個大片,這個時候如果沒有基礎(chǔ)設(shè)施的保證,它是沒有那個感覺的。所以,這些都是要去處理的,從交互到聲音的整個鏈條。

  剛才已經(jīng)舉了簡單的例子,我們再舉一個打電話的場景,其實這些后面都是一些小場景。電話來了主座先接,但是他是找后面的我們家兒子的,那這個電話我怎么給他移過去,他其實只要跟交互把聲音這樣一個鏈條拉開,就有非常多的處理上說,我接電話,把它拖拽到后排,我這塊不用響了,我聽的還是導航的聲音,后排打電話也沒干擾到我導航的聲音。這樣的一個聲音的切分就會讓車內(nèi)的場景有非常多的可能性。前排在導航,旁邊在電話,后面在聽音樂,最后一排可能孩子們在玩游戲。通過聲音的區(qū)分,我們就把車內(nèi)整個交互的場景變得多維了,變成更多維了。

  再舉個例子,車內(nèi)開起來高速的時候聲音其實是非常吵的,輪噪、風噪影響到我們說話必須要吼。如果到多模態(tài)到聲學鏈條的解決,我們可以讓最后一排兩個人輕聲說話,那人的體驗就會更好一點。再結(jié)合DMS/OMS常用的那些攝像頭,我們把調(diào)音這個事情可以更進一步,更智能化一步。有的時候會找著那個“皇帝位”,每一個車的設(shè)置都會考慮不同的駕駛者的身高,他要去調(diào)面向耳朵的那個聲音朝向到底是怎么樣去定位。但是,我們有攝像頭,我們把多模態(tài)的交互和攝像頭通過對于駕駛者的判斷,這個位置是可以能夠靈活自己來變化的。這樣一種方式就可以真正因為駕駛者而不同,這個聲學的整個聚焦點就可以隨車移動,隨人而變化。

  再打開,如果車內(nèi)后排有人睡覺了,在這個過程之中,我們是不是要讓后排那個聲音小一點,但是我還要導航,我也要聽幾首歌,這個時候就是音區(qū)加上多模態(tài)的感知形成了一些差異。

  為了把這個事情做和,也為了規(guī)避掉所有“卡脖子”的那些限制,我們自己其實重新又構(gòu)建了很多算法,比方說,環(huán)繞的算法,比方說虛擬現(xiàn)場的算法,這樣都保證鏈路上面我們自己可以完全可控。

  再有一些跟導航的結(jié)合,我們也跟很多導航廠商,包括我們基于BL開發(fā)上面的導航軟件,要去考慮到跟聲學相關(guān)的這樣一些場景該怎么表現(xiàn),你提“前方請右拐”的時候,那個聲音是不是要靠右一點?“前方請調(diào)頭”的時候,那個聲音是不是要一直隨著那個轉(zhuǎn)向,要結(jié)束掉整個轉(zhuǎn)的那個過程,包括我們在做很多在L2++,L3以后,車在路上跑,旁邊有一些你需要規(guī)避的像消防車、急救車,以及包括可能很多危險車輛,在這個過程之中過來了,你要不要從他那方響起來相應(yīng)的聲音,這個時候其實都是要去討論,跟生態(tài)內(nèi)容,跟應(yīng)用如何來去做深度的結(jié)合的。我們也跟很多的生態(tài)合作伙伴去來討論怎么樣基于他們想要的聲音表現(xiàn)去構(gòu)建整個汽車的聲音鏈。這個東西其實還是比較傳統(tǒng)的,首先它是一個公放的樣子,但是我們把全球現(xiàn)在最新的ADSP用到了極致。當然,現(xiàn)在也有很多因為涉及到中美之間的芯片競爭,我們還要積極走國產(chǎn)化路線。現(xiàn)在我們新的國產(chǎn)化的平臺從國產(chǎn)芯片的替代的比例已經(jīng)接近了75%。這個鏈條說到底還是汽車的工程的鏈條里面的一部分。所以,沒有汽車的完整,工程鏈條的支撐,其實在這個事情上只能說是差強人意,只有算法是不可能的,它要完整的經(jīng)過整個汽車的工程驗證,然后軟硬件的協(xié)同。

  在過往的三年里面,我們做的這樣一個事情也確確實實是讓很多的車企,包括很多的業(yè)內(nèi)的同仁感覺到比較詫異,說我們本來做語音交互,現(xiàn)在怎么打開做這個事情?但是,好像做對了。因為從中國很多汽車的品牌寄予的那個期望上,他們總覺得在那個喇叭上,那幾個英文字母很貴,會讓他們的車賣得很貴,這個還是個品牌自信的問題,或者我們沒有其他的東西可以說的問題。當我們把這個事情拉開之后,我認為它是座艙里面智能化非常重要的一環(huán),而且它是可以通過智能化來去讓更多現(xiàn)在新的年輕的用戶實實在在感受到那些差異,而真正出現(xiàn)新的價值的。所以,這場仗我覺得我非常有信心再把它打下去。因為基于整個座艙的體驗鏈條,聲音的重要性大家都能夠意識到,它不是因為幾個字母而帶來的,它是真正用體驗價值來去產(chǎn)生的這種溢價的。

  所以,我們在下半年也會再發(fā)一個拳頭級的產(chǎn)品,把整車公放的功率提升到2800瓦,通道數(shù)到24個,我們可以推動喇叭,甚至可以到30多個,接近40個,這樣的一種基礎(chǔ)硬件的布置會讓整個車從內(nèi)到外有非常多跟聲音相關(guān)的體驗就應(yīng)運而生了。我們非常愿意把這個事情跟大家一起討論。

  這20年我們從語音交互,到多模態(tài)交互,到智能座艙,到智能服務(wù),現(xiàn)在到公放,到駕駛,我們也是跟很多車企形成了非常好的合作關(guān)系。我們希望下一次面對著整個汽車智能化新的浪潮的來臨的時候,我們從聲音的這個鏈條配合這個新生代,我們一起攜手共創(chuàng)聲音的新生態(tài),謝謝大家!

0
試駕、服務(wù)、優(yōu)惠購
網(wǎng)友評論
推薦閱讀