根據國家統計局的數據顯示,截至2023年,我國殘疾人人口達8591.4萬。隨著科技助殘政策的進一步推行,以及前沿科技的迅猛發展,利好殘障人士的高科技產品也不斷問世。腦機接口技術、智能假肢、智能AR眼鏡、外骨骼機器人……,這些前沿產品正逐漸重塑著殘障人士的生活,為他們逐步打造出一個“有愛無礙”的世界。在今年的科技助殘平行論壇上,科大訊飛的智能語音交互技術也入選了科技助殘創新案例,為助殘事業注入了更新鮮的活力。那么科大訊飛智能語音交互技術具體是什么?一起跟著福祉君來看看吧!
此外,在今年的9月12日-14日,2025中國國際福祉博覽會暨中國國際康復博覽會(CR EXPO)將在北京國家會議中心舉行,科大訊飛愛博智能也將在本屆福祉博覽會上展示最新人工智能輔具產品,歡迎提前掃碼登記,體驗更多前沿科技產品!
科大訊飛智能語音交互技術,主要是基于科大訊飛全自研國產語音大模型,集成語音轉寫、合成等關鍵技術,可廣泛應用于聽障群體的無障礙溝通與交流。
語音能力作為科大訊飛的領先優勢,去年年初科大訊飛便在星火大模型V3.5的更新中,首次對外發布了星火語音大模型,對于37種主流語種的語音識別效果已超過OpenAI Whisper V3。在后續的星火大模型V4.0發布會上。除了之前已有的37個主流語種,還新增了37種方言,這代表著使用者可以多語種和方言隨意切換。
同時,在今年1月,在訊飛星火大模型升級發布會現場,現場發布了目前全國產算力平臺上唯一的深度推理模型——訊飛星火X1。該模型的中文和數學能力都在國內處于領先地位。此外,首個具備端到端語音到語音同傳能力的大模型——星火語音同傳大模型也在現場同期發布,據悉,該模型最快語音同傳時延小于5秒。
除了上述提到的星火語音大模型,科大訊飛的語音識別與合成技術也是其智能語音交互技術的重要支撐。
根據相關資料顯示,訊飛語音識別技術可將短音頻(≤60秒)精準識別成文字,同時能支持多語種的自動判別,其中包括語音轉寫等功能,可滿足使用者不同時長音頻的轉文字需求,識別率較高。以科大訊飛推出的智能語音識別與轉寫軟件“訊飛聽見”為例,其能將語音內容實時轉為文字,同時支持多語言自動識別,可廣泛應用在會議、教學、面對面交流等場景,眾多聽障人士也能利用該軟件進行語音識別與轉寫,從而實現與健聽人士的無障礙溝通。
同時,訊飛語音合成技術(TTS)也是智能語音交互技術的重要基石。今年6月,科大訊飛宣布其語音合成技術實現了關鍵性的突破,“一句話聲音復刻”與“超擬人語音合成”兩項能力取得重大升級。此前,訊飛星火APP上線了“一句話聲音復刻”功能,并在業界和客戶中取得了較好的評價,在今年升級完成后, AI可在僅一句語音錄音的基礎上,復刻用戶完整音色、語氣與情緒起伏,效果更逼近真人。
基于訊飛自研的星火語音大模型的迭代升級以及最新構建的三階段層次化語音建模框架,訊飛語音合成技術在音色恢復方面,不僅通過融合幀級音色編碼與聲紋語義一致性損失函數,進一步提升了合成音頻的相似度與自然度,同時結合DPO強化學習策略,強化了所合成語音的流暢性。目前,蔚來汽車已在新車型中應用了訊飛“超擬人情感語音系統”。
為了能在復雜環境下也能實現語音識別與轉寫,同時達到無障礙溝通的目的,訊飛抗干擾技術也已達到國際領先地位,可成功完成在極復雜場景的語音轉寫。訊飛推出的麥克風陣列技術和降噪算法以及噪音魯棒性技術都能顯著進行抗干擾,從而實現多重疊復雜環境下的語音轉寫。
在今年的2025中關村論壇年會科技助殘平行論壇上,科大訊飛的智能語音交互技術已入選2025科技助殘創新案例。同時,科大訊飛也與中國殘聯簽署了合作協議,將共建通用人工智能助殘聯合實驗室。目前,以“訊飛聽見”APP為例,2019年,科大訊飛聯合中國聾人協會、中國殘疾人藝術團發起“聽見AI的聲音”關愛聽障人士公益行動,使用“訊飛聽見”APP,將實時語音轉化成文字,從而幫助聽障人士更好地與他人交流。截至目前,“聽見AI的聲音”公益行動已累計為聽障人士提供超2億分鐘的免費轉寫服務。
此外,科大訊飛子公司訊飛愛博智能推出的無障礙AI交流屏也是科技助殘的有力產品。該產品集成多語種識別翻譯、星火大模型和多模態降噪技術,具備多語種識別翻譯、手寫輸入等功能,能幫助聽障人士實現面對面的與人交流。
目前,科大訊飛的智能語音交互技術也已應用在公共服務領域,例如政府部門、機場、商業中心等??拼笥嶏w的智能語音客服系統在接入政務熱線后,可實現7×24小時在線值守,能夠迅速反饋并解決民眾咨詢的問題,實現迅速響應。
不僅如此??拼笥嶏w的無障礙AI交流屏也已在北京首都國際機場、大興機場、成都春熙路商圈IFS、曼谷高端購物中心Siam Paragon和ICONSIAM等投入使用,可為不用國籍的旅客提供更為方便的服務。
此外,科大訊飛的智能語音交互技術也在特殊教育領域有較大應用前景。此前,科大訊飛為全國80多所特殊教育學校提供了技術和產品,為特殊教育學校師生的課堂效率等提供了較大助力。
智能語音交互技術等更多助殘科技,正幫助許多殘疾人和老年人改善生活。目前程天、大艾、強腦、科大訊飛愛博智能等科技品牌企業,已確認參加2025中國國際福祉博覽會。作為助殘科技成果展示推廣與落地轉化的重要平臺,中國國際福祉博覽會將于2025年9月12-14日在北京國家會議中心舉行。本屆展會將特設“創研匯”科技助殘專區及品牌展示區,為企業、高校及科研院所提供科技創新產品的首發平臺,并推動科技成果轉化及落地應用。
目前,組委會正在征集科技助殘創新成果、技術應用、產品和服務案例展示及發布,我們誠摯邀請人工智能、腦機接口、信息無障礙、智能假肢與康復機器人、感知輔助技術、VR/AR、仿生、神經調控等領域助殘創新相關領域的高校、科研院所、企業、服務機構及相關單位報名參與,共同推動科技助殘及殘疾人事業的發展,讓科技的溫度惠及更多有需要的人群。歡迎感興趣的朋友掃碼報名參與此次征集活動→征集通知 | 2025中國國際福祉博覽會科技助殘創新成果展示交流活動
資料來源:中國殘聯公眾號、中國殘聯公眾號、機器之心公眾號、科大訊飛集團公眾號、科大訊飛官網、信息化教學創新公眾號、訊飛產業加速中心公眾號、藍鯨新聞等