豆包發(fā)布語音識別模型2.0,支持多模態(tài)視覺識別和13種海外語種識別
2025-12-05 15:59   
來源: 云財經(jīng)   
影響力評估指數(shù):23.48  
云財經(jīng)訊,12月5日,火山引擎正式發(fā)布豆包語音識別模型2.0(Doubao-Seed-ASR-2.0),依托Seed混合專家大語言模型架構(gòu)構(gòu)建。據(jù)官方介紹,2.0版本模型推理能力提升,可以通過深度理解上下文完成精準識別,上下文整體關(guān)鍵詞召回率提升20%。支持多模態(tài)視覺識別,在聽得懂的同時看得懂,可以通過單圖和多圖等視覺信息輸入提升文字識別精準度。支持日語、韓語、德語、法語等13種海外語種的識別。并且重點針對專有名詞、人名、地名、品牌名稱及易混淆多音字等復(fù)雜場景進行了升級。(每經(jīng))
云財經(jīng)智能匹配相關(guān)概念
| 新聞標題 | 時間 | 消息來源 | 新聞熱度 |
|---|---|---|---|
| 編造傳播“2026年春運綠皮車嚴重超員、人滿為患”謠言,多人被行政處罰 | 今天 13:04 | 云財經(jīng) |
|
| 宇樹機器人“以武會春”:刷新多個全球第一,空翻最大高度超3米 | 今天 00:01 | 云財經(jīng) |
|
| 黑龍江:建設(shè)“人工智能+”政務(wù)服務(wù)新場景 | 02-15 19:32 | 云財經(jīng) |
|
| 陳茂波:春節(jié)假期訪港內(nèi)地旅客預(yù)計達143萬人次 | 02-15 14:12 | 云財經(jīng) |
|
| 歐洲官員批評美國務(wù)卿演講:沒有任何令人安心的內(nèi)容 | 02-15 00:13 | 云財經(jīng) |
|
| 俄美烏新一輪談判下周日內(nèi)瓦舉行 | 02-13 19:43 | 云財經(jīng) |
|