国产欧美日韩精品a在线观看-国产欧美日韩精品一区二区三区-国产欧美日韩精品综合-国产欧美中文字幕-一区二区三区精品国产-一区二区三区精品国产欧美

ACS880-07C
關(guān)注中國自動化產(chǎn)業(yè)發(fā)展的先行者!
CAIAC 2025
2024
工業(yè)智能邊緣計算2024年會
2023年工業(yè)安全大會
OICT公益講堂
當(dāng)前位置:首頁 >> 資訊 >> 行業(yè)資訊

資訊頻道

深耕智能語音前沿技術(shù)
  • 點擊數(shù):768     發(fā)布時間:2023-05-17 21:31:31
  • 分享到:
“智能語音音頻技術(shù)應(yīng)用十分廣泛,可以賦能許多場景。”北科瑞聲董事長劉軼說,公司通過與高速交通、智慧醫(yī)療、數(shù)字政務(wù)等行業(yè)深度融合,創(chuàng)新研發(fā)了一系列智能產(chǎn)品,并與多個國產(chǎn)主流平臺完成兼容性互認(rèn)證,實現(xiàn)智能語音系統(tǒng)全鏈自主可控運行,持續(xù)推動智能語音技術(shù)應(yīng)用研發(fā)及產(chǎn)業(yè)化。2022年,北科瑞聲營業(yè)收入突破億元,同比增速超過56%。

走進深圳市北科瑞聲科技股份有限公司(以下簡稱“北科瑞聲”)的人工智能展廳,一件件智能語音產(chǎn)品引人注目。

“智能語音音頻技術(shù)應(yīng)用十分廣泛,可以賦能許多場景。”北科瑞聲董事長劉軼說,公司通過與高速交通、智慧醫(yī)療、數(shù)字政務(wù)等行業(yè)深度融合,創(chuàng)新研發(fā)了一系列智能產(chǎn)品,并與多個國產(chǎn)主流平臺完成兼容性互認(rèn)證,實現(xiàn)智能語音系統(tǒng)全鏈自主可控運行,持續(xù)推動智能語音技術(shù)應(yīng)用研發(fā)及產(chǎn)業(yè)化。2022年,北科瑞聲營業(yè)收入突破億元,同比增速超過56%。

專注技術(shù)研發(fā)

2003年,劉軼從香港科技大學(xué)博士畢業(yè)留校任教,從事嵌入式智能語音識別技術(shù)研究。“自己研發(fā)的東西能夠?qū)崿F(xiàn)應(yīng)用,產(chǎn)生經(jīng)濟效益、服務(wù)社會,這是每一個工科人的夢想。”帶著這樣的夢想,2008年,他與兩位合伙人來到深圳,創(chuàng)立北科瑞聲。

實現(xiàn)夢想的路上,需要不斷探索和創(chuàng)新。嵌入式智能語音識別技術(shù)通過將聲音轉(zhuǎn)換成文本和命令,能夠?qū)崿F(xiàn)語音輸入、語音控制,可應(yīng)用于多種應(yīng)用系統(tǒng)、移動設(shè)備,大大改善人機交互方式。但是,要把這個技術(shù)落地實現(xiàn)產(chǎn)品化,并不是件容易的事。

“那時,人們對語音識別還沒什么概念,相關(guān)技術(shù)也不夠成熟,鮮有成功的商業(yè)化案例。風(fēng)口沒到的時候,我們需要沉下心來,做好基礎(chǔ)性工作,錘煉好自己的本領(lǐng)。”劉軼說。

瞄準(zhǔn)語音音頻交互核心技術(shù),北科瑞聲組織研發(fā)團隊開展持續(xù)攻關(guān),不斷突破技術(shù)瓶頸。“在人工智能和機器學(xué)習(xí)技術(shù)領(lǐng)域,有一大一小兩個難題。大難題是指超大規(guī)模預(yù)訓(xùn)練模型,小難題是指芯片級神經(jīng)網(wǎng)絡(luò)模型。”北科瑞聲總經(jīng)理王昕介紹,針對兩個難題,公司研發(fā)了音頻信息感知、語音識別、人機交互系統(tǒng)等全鏈多模態(tài)人工智能技術(shù),并將這些技術(shù)封裝在自研芯片上,打造存算一體芯片級小型神經(jīng)網(wǎng)絡(luò)模型語音芯片,推出“云+端+芯”全鏈條、自主可控智能語音產(chǎn)品,實現(xiàn)從人工智能語音技術(shù)創(chuàng)新到產(chǎn)業(yè)應(yīng)用的生態(tài)閉環(huán)。

“云+端+芯”即云、設(shè)備終端和芯片,三者鏈條打通之后,能夠?qū)崿F(xiàn)對數(shù)據(jù)的存儲、處理、整理、分析和傳輸。“攻克這個技術(shù)并非易事,我們面臨許多挑戰(zhàn)。”王昕說,語音交互具有時變性。在溝通過程中,設(shè)備每一分鐘都要通過提取語音特征、參數(shù),與后臺的模型進行大量比對計算,快速反饋語音內(nèi)容。這不僅需要一個速度非常快的計算單元,還需要中央處理器的算力足夠快、存儲器容量足夠大。與此同時,還要實現(xiàn)低功耗,降低應(yīng)用成本。

為了破解這一系列難題,北科瑞聲不斷提升數(shù)據(jù)、算法和算力能力,積累了超10萬小時語音音頻數(shù)據(jù)、TB級語言數(shù)據(jù)及語音音頻行業(yè)標(biāo)桿級數(shù)據(jù)資源;研發(fā)出行業(yè)領(lǐng)先的中文復(fù)雜場景語音音頻交互技術(shù),普通話語音識別準(zhǔn)確度達99%,限定領(lǐng)域的意圖識別準(zhǔn)確度達到95%。

語音交互技術(shù)好不好,不僅要看測試的識別準(zhǔn)確率,還要看其在實際場景下的語義理解能力。“即便如今普通話普及程度越來越高,但由于每個人的經(jīng)歷或生活環(huán)境不同,產(chǎn)生了很多‘不標(biāo)準(zhǔn)’的普通話發(fā)音。這個‘不標(biāo)準(zhǔn)’千變?nèi)f化,識別起來十分困難。而基于中文復(fù)雜場景的語音音頻交互技術(shù),可以做到在無需事先指定口音類型的情況下,處理國內(nèi)50多個地方的帶口音普通話。”劉軼說。

面對互聯(lián)網(wǎng)時代層出不窮且逐漸融入人們生活的網(wǎng)絡(luò)新詞,中文復(fù)雜場景語音音頻交互技術(shù)還能通過自進化能力,在30秒內(nèi)對這些新詞進行全面學(xué)習(xí)、掌握,以快速跟上互聯(lián)網(wǎng)信息迭代速度。而原先的傳統(tǒng)技術(shù)若想識別新詞,一般需要數(shù)天甚至數(shù)周的技術(shù)訓(xùn)練。

經(jīng)過持續(xù)研發(fā)創(chuàng)新,北科瑞聲攻克了多項人工智能核心技術(shù),實現(xiàn)了端云架構(gòu)以及端到端一體化產(chǎn)品應(yīng)用。目前,北科瑞聲擁有知識產(chǎn)權(quán)200多件,其中發(fā)明專利100多件,參與了智能語音識別和交互國家標(biāo)準(zhǔn)制定,獲得我國智能科學(xué)技術(shù)最高獎“吳文俊人工智能科學(xué)技術(shù)獎”、中國專利優(yōu)秀獎以及多項廣東省科學(xué)技術(shù)獎等獎項,發(fā)展成為人工智能音頻領(lǐng)軍企業(yè)。

拓展應(yīng)用場景

創(chuàng)新不能閉門造車,還需要根據(jù)市場需求將科研成果落地轉(zhuǎn)化。“通用產(chǎn)品僅僅將語音轉(zhuǎn)化為文字,無法滿足醫(yī)療、交通、政務(wù)等細分領(lǐng)域的需求。比如一些專業(yè)術(shù)語,如果我們的智能語音系統(tǒng)沒有與行業(yè)進行深度融合或者定制化處理,就達不到好的效果。”劉軼告訴記者,人工智能要想真正為市場所用,一定要與具體的行業(yè)應(yīng)用結(jié)合起來,做深、做精,為行業(yè)發(fā)展賦能。

在探尋技術(shù)落地及差異化競爭路徑的過程中,北科瑞聲將目光首先聚焦于車載應(yīng)用領(lǐng)域。

“支持語音交互是車載導(dǎo)航智能發(fā)展的必然趨勢,出于對安全駕駛的考慮,人們不能一邊開車一邊操作導(dǎo)航。我們嘗試將智能語音識別技術(shù)嵌入汽車車機,通過車機總線進行總控,可執(zhí)行高達幾萬條的語音命令。”北科瑞聲總裁辦公室副總監(jiān)王詩雨說,“車主只需說出路線需求,車機就能規(guī)劃合適的路線,實現(xiàn)無手化操作。”

車載應(yīng)用成功落地讓北科瑞聲在智能語音應(yīng)用領(lǐng)域摸索出一些經(jīng)驗,隨后開始在數(shù)字政務(wù)、智慧醫(yī)療和高速交通等領(lǐng)域發(fā)力。

在數(shù)字政務(wù)智能語音解決方案中,北科瑞聲基于其智能語音核心能力開發(fā)出一套主要用于政企會議場景的智能語音會議系統(tǒng)。“會議記錄是政企日常工作中的重要部分,但傳統(tǒng)記錄方式效率較低。”劉軼說,智能語音會議系統(tǒng)提供基于私有云的語音轉(zhuǎn)文字、實時轉(zhuǎn)寫上屏顯示、離線語音轉(zhuǎn)寫、紀(jì)要成稿、會議記錄留存查詢等功能,避免了傳統(tǒng)人工整理記錄會議內(nèi)容存在的時間長、易遺漏、準(zhǔn)確率低等問題,從而提升會議交互體驗與辦公效率。目前,北科瑞聲智能語音會議系統(tǒng)已在深圳許多政企單位實現(xiàn)應(yīng)用。

“數(shù)據(jù)不只是一種資源,更是一種能力,是企業(yè)的核心競爭力。”劉軼說,在高速交通領(lǐng)域,北科瑞聲通過運用云計算、大數(shù)據(jù)分析能力,提升人工智能認(rèn)知能力,實現(xiàn)大交通領(lǐng)域用戶數(shù)據(jù)安全可靠。

ETC卡剛剛推行時,由于需求量不高,高速客服中心的線上客服配置并不多。隨著ETC熱潮的到來,2019年,粵通卡車主大幅上漲,給客服工作帶來了巨大壓力。基于數(shù)據(jù)、算法、算力三大要素技術(shù)積累,北科瑞聲結(jié)合高速交通業(yè)務(wù)場景及高速視頻云系統(tǒng),打造出覆蓋互聯(lián)網(wǎng)渠道、電話通道及高速場景線下服務(wù)窗口的人工智能高速交通綜合信息服務(wù)平臺——全終端高速交通平臺。

這一平臺以智能外呼機器人替代人工客服,通過與粵高速客服中心電話線路集成,實現(xiàn)從流程設(shè)置、外呼呼叫到數(shù)據(jù)處理與匯總的全流程自動化處理。智能外呼機器人集成語音識別、自然語言理解、信息檢索、語音合成等智能技術(shù),聽得懂、能理解、會說話,人機交互流暢自然,機器人單條電話線單日可完成外呼電話上千次,外呼數(shù)據(jù)同步轉(zhuǎn)寫生成保存。

“與傳統(tǒng)人工外呼相比,智能外呼機器人具備自動撥打、多輪對話、自動生產(chǎn)外呼數(shù)據(jù)等優(yōu)勢,還可不間斷工作,有效提升了工作智能化、數(shù)字化水平。”王昕說,深圳具有良好的創(chuàng)新土壤,為企業(yè)積累場景應(yīng)用經(jīng)驗、促進技術(shù)迭代提供了舞臺。立足這個資源優(yōu)勢,北科瑞聲在不斷拓展應(yīng)用場景的同時,將繼續(xù)破解技術(shù)瓶頸,持續(xù)迭代產(chǎn)品,用人工智能技術(shù)賦能更多行業(yè)發(fā)展。

來源:《經(jīng)濟日報》

熱點新聞

推薦產(chǎn)品

x
  • 在線反饋
1.我有以下需求:



2.詳細的需求:
姓名:
單位:
電話:
郵件:
主站蜘蛛池模板: 亚州免费 | 91探花福利精品国产自产在线 | 国产欧美日本亚洲精品五区 | 久久精品国产精品亚洲综合 | 精品自拍视频在线观看 | 一级毛片播放 | 色综合a怡红院怡红院首页 色综合精品久久久久久久 色综合九九 | 亚洲小视频在线播放 | 看一级特黄a大一片 | 最新国产中文字幕 | 99久久精品自在自看国产 | 91免费国产高清观看 | 色偷偷亚洲男人天堂 | 一级做a毛片免费视频 | 欧美一级毛片免费网站 | 欧美一区中文字幕 | 亚洲精品色综合色在线观看 | 久久久久久国产精品免费 | 动漫精品一区二区 | 久草免费资源站 | 日韩精品视频美在线精品视频 | 中文字幕水野优香在线网在线 | 欧美精品日本一级特黄 | 亚洲综合网址 | 亚洲 午夜在线一区 | 特级av毛片免费观看 | 亚洲成 人a影院青久在线观看 | 中文字幕久久亚洲一区 | 国产一线视频在线观看高清 | 亚洲一区在线视频观看 | 免费观看一级一片 | a在线观看欧美在线观看 | 奇米色88欧美一区二区 | 99精品久久久久久久免费看蜜月 | 亚洲视频天堂 | 精品国产_亚洲人成在线高清 | 色在线看 | 色网站在线 | 欧美亚洲免费 | 欧美高清在线 | 久久久成人啪啪免费网站 |