豆包發(fā)布語音識別模型2.0,支持多模態(tài)視覺識別和13種海外語種識別
2025-12-05 15:59   
來源: 云財經   
影響力評估指數:23.48  
云財經訊,12月5日,火山引擎正式發(fā)布豆包語音識別模型2.0(Doubao-Seed-ASR-2.0),依托Seed混合專家大語言模型架構構建。據官方介紹,2.0版本模型推理能力提升,可以通過深度理解上下文完成精準識別,上下文整體關鍵詞召回率提升20%。支持多模態(tài)視覺識別,在聽得懂的同時看得懂,可以通過單圖和多圖等視覺信息輸入提升文字識別精準度。支持日語、韓語、德語、法語等13種海外語種的識別。并且重點針對專有名詞、人名、地名、品牌名稱及易混淆多音字等復雜場景進行了升級。(每經)
云財經智能匹配相關概念
| 新聞標題 | 時間 | 消息來源 | 新聞熱度 |
|---|---|---|---|
| 墨西哥格雷羅州再次發(fā)生5.0級地震 | 今天 00:15 | 云財經 |
|
| 金風科技大漲超14%,藍箭航天科創(chuàng)板IPO申請獲受理 | 01-02 11:13 | 云財經 |
|
| 也門政府宣布對亞丁國際機場實施管制措施 | 01-02 05:24 | 云財經 |
|
| 瑞士央行第三季度克制貨幣干預 | 12-31 23:56 | 云財經 |
|
| 時代新材:掛牌轉讓弘輝科技股權底價調整至1.23億元 | 12-31 19:35 | 云財經 |
|
| 12月31日滬深兩市漲停分析 | 12-31 15:43 | 云財經 |
|