百度大腦在北京舉行語音能力引擎論壇。百度語音首席架構(gòu)師賈磊正式提出基于復(fù)數(shù)CNN網(wǎng)絡(luò)的語音增強(qiáng)和語音識(shí)別一體化端到端建模技術(shù),該方法拋棄了數(shù)字信號(hào)處理學(xué)科和語音識(shí)別學(xué)科的各種先驗(yàn)假設(shè),消除學(xué)科間壁壘,直接端到端進(jìn)行一體化建模。相較于傳統(tǒng)基于數(shù)字信號(hào)處理的麥克陣列算法,錯(cuò)誤率降低超過30%。
據(jù)悉,這項(xiàng)技術(shù)無需任何數(shù)字信號(hào)處理和語音識(shí)別學(xué)科的先驗(yàn)假設(shè),復(fù)數(shù)CNN網(wǎng)絡(luò)內(nèi)存占用少于200K,可以內(nèi)置到百度鴻鵠芯片內(nèi)部。利用進(jìn)場(chǎng)數(shù)據(jù)和純粹依靠仿真數(shù)據(jù),就可以獲得足量的遠(yuǎn)場(chǎng)訓(xùn)練數(shù)據(jù),整個(gè)過程是icing原始多麥克信號(hào)到識(shí)別文字的一個(gè)端到端訓(xùn)練,整個(gè)優(yōu)化過程只有字錯(cuò)誤率兩集一個(gè)優(yōu)化準(zhǔn)則。
百度從2012年起就開始把深度學(xué)習(xí)用于中文語音搜索,成為全世界最早把深度學(xué)習(xí)技術(shù)落地工業(yè)化產(chǎn)品的企業(yè)之一。百度大腦目前已開放了云、端、芯包含語音識(shí)別、語音合成等全棧語音引擎能力,并廣泛應(yīng)用于金融、政務(wù)、文娛等多種行業(yè)和場(chǎng)景。
百度AI技術(shù)生態(tài)部總經(jīng)理喻友平表示,百度大腦語音能力引擎的應(yīng)用規(guī)模已達(dá)到業(yè)界第一,同時(shí)一直在積極拓展語音能力引擎生態(tài)鏈的建設(shè)。
隨著人們生活水平的提高及對(duì)家居環(huán)境要求的提升,智能家居產(chǎn)品正逐漸從奢侈品轉(zhuǎn)變?yōu)槿粘I钪械?..
工業(yè)和信息化部、交通運(yùn)輸部、住房和城鄉(xiāng)建設(shè)部、公安部、自然資源部聯(lián)合發(fā)布了智能網(wǎng)聯(lián)汽車“車...
《互聯(lián)網(wǎng)周刊》、德本咨詢、eNet16聯(lián)合發(fā)布了“2025中國(guó)人工智能500強(qiáng)榜單”。榜單...
胡潤(rùn)研究院發(fā)布了2024胡潤(rùn)中國(guó)人工智能50強(qiáng)企業(yè)排行榜,榜單以企業(yè)價(jià)值進(jìn)行排名,上榜門檻...
陳宗年,中國(guó)電子科技集團(tuán)有限公司中電??导瘓F(tuán)有限公司董事長(zhǎng)、黨委書記。在他的帶領(lǐng)下, 海康...
2024福布斯中國(guó)科創(chuàng)人物評(píng)選結(jié)果重磅發(fā)布,本次榜單主要聚焦深耕于人工智能、高端制造等科創(chuàng)...