4月20日,科大訊飛深度推理大模型——訊飛星火X1迎來全新升級(jí)。作為當(dāng)前業(yè)界唯一基于全國產(chǎn)算力訓(xùn)練的深度推理大模型,升級(jí)后的星火X1在數(shù)學(xué)、代碼、邏輯推理、文本生成、語言理解、知識(shí)問答等通用任務(wù)上效果顯著提升,在模型參數(shù)比業(yè)界同類模型小一個(gè)數(shù)量級(jí)的情況下,整體效果對標(biāo)OpenAI o1和DeepSeek R1,再次證明了基于國產(chǎn)算力訓(xùn)練的全棧自主可控大模型具備登頂業(yè)界最高水平的實(shí)力和持續(xù)創(chuàng)新的潛力。
星火X1除了在常見通用任務(wù)取得顯著進(jìn)步之外,由于融入了更多場景復(fù)雜類型數(shù)據(jù),模型的泛化性也取得了進(jìn)步,多個(gè)行業(yè)任務(wù)上展現(xiàn)出了業(yè)界領(lǐng)先的能力。在重點(diǎn)行業(yè)如教育、醫(yī)療、司法等進(jìn)一步擴(kuò)大了領(lǐng)先優(yōu)勢。
面向企業(yè)和廣大開發(fā)者,訊飛星火X1首發(fā)“快思考、慢思考統(tǒng)一模型”,全新升級(jí)模型定制優(yōu)化工具鏈,進(jìn)一步降低大模型私有化部署和定制門檻;同時(shí),訊飛星火X1 API已上線訊飛開放平臺(tái)開放服務(wù),作為首個(gè)支持全國產(chǎn)算力微調(diào)的推理大模型,訊飛星辰MaaS平臺(tái)同步上線了星火X1微調(diào)服務(wù)。
訊飛星火X1全面升級(jí),通用能力比肩國際頂尖模型水平
升級(jí)后的星火X1在多個(gè)任務(wù)上效果繼續(xù)突破,展現(xiàn)出優(yōu)異的性能。根據(jù)最新測試集評(píng)測結(jié)果,星火X1在通用任務(wù)效果評(píng)測中全面對標(biāo)OpenAI o1和DeepSeek R1,在數(shù)學(xué)、知識(shí)問答等方面表現(xiàn)突出。
※測試集合來源:自建測試集主要來自真實(shí)的大模型請求任務(wù)數(shù)據(jù),來源分布包括訊飛星火APP、星火大模型API、業(yè)界主流任務(wù)數(shù)據(jù)等;公開測試集主要以數(shù)學(xué)、答題、推理、代碼等外部典型測試集為主。
數(shù)學(xué)答題和復(fù)雜的數(shù)理邏輯推理方面,星火X1能夠準(zhǔn)確識(shí)別出復(fù)雜的數(shù)學(xué)公式,不僅給出完整的解題思路,輸出結(jié)果也嚴(yán)謹(jǐn)清晰;在邏輯推理時(shí)全方位思考,思考可能出現(xiàn)的每一種假設(shè),表現(xiàn)出更強(qiáng)的嚴(yán)謹(jǐn)性和準(zhǔn)確性。代碼能力上,星火X1不僅提高了代碼生成的準(zhǔn)確率,對生成代碼邏輯理解也進(jìn)一步提升,能夠應(yīng)對更復(fù)雜的編程需求,思考問題的多種可能性,幫助開發(fā)者快速實(shí)現(xiàn)功能。在語言理解方面,模型輸出內(nèi)容、格式更加符合用戶指令要求,能夠給到更加準(zhǔn)確且深度思考的結(jié)果,生成內(nèi)容更加連貫、準(zhǔn)確。
此外,星火X1的長思維鏈能力支持圖像輸入,可以對輸入的圖像進(jìn)行關(guān)聯(lián)思考,對于圖像中的多種復(fù)雜元素,探究可能的含義和目的,進(jìn)行更深層次的信息整合和推理。
多個(gè)行業(yè)任務(wù)業(yè)界領(lǐng)先,訊飛星火X1部署更簡便,定制門檻更低
本次星火X1升級(jí)不僅提升了通用能力,也同步增強(qiáng)了面向行業(yè)的解決方案能力,助力產(chǎn)業(yè)智能化轉(zhuǎn)型。由于融入了更多場景復(fù)雜類型數(shù)據(jù),模型的泛化性也取得了進(jìn)步,多個(gè)行業(yè)任務(wù)上展現(xiàn)出了業(yè)界領(lǐng)先的能力。在重點(diǎn)行業(yè),如教育、醫(yī)療、司法等進(jìn)一步擴(kuò)大了領(lǐng)先優(yōu)勢。以司法行業(yè)為例,對于行業(yè)專業(yè)需求,例如根據(jù)材料總結(jié)案件事實(shí)以及判決理由,升級(jí)后的星火X1能夠精準(zhǔn)把握用戶指令,詳細(xì)分析爭議點(diǎn),快速定位關(guān)鍵信息,并輸出準(zhǔn)確內(nèi)容,為行業(yè)用戶提供專業(yè)、可靠的智能支持。
※測試集合來源:真實(shí)場景測試集。
值得一提的是,全新升級(jí)的訊飛星火X1在行業(yè)實(shí)際應(yīng)用中具有顯著優(yōu)勢。
在技術(shù)創(chuàng)新和模型部署方面,星火X1首發(fā)“快思考、慢思考統(tǒng)一模型”,由一個(gè)模型同時(shí)支持兩種思考模式,提升了模型處理不同復(fù)雜度任務(wù)的能力,滿血版星火X1僅需4張卡(華為910B)即可部署,簡化了私有化部署流程。
同時(shí),星火X1還全新升級(jí)了模型定制優(yōu)化工具鏈,支持SFT(監(jiān)督微調(diào))、強(qiáng)化學(xué)習(xí)兩種模型定制優(yōu)化方案,只需16張卡(華為910B)即可完成行業(yè)定制優(yōu)化,有效降低了企業(yè)AI的定制門檻,使各行業(yè)能更便捷地落地AI應(yīng)用價(jià)值。
三大核心技術(shù)突破,國產(chǎn)AI邁向自主可控新階段
訊飛星火X1的全新升級(jí)背后,是一系列獨(dú)特的技術(shù)創(chuàng)新與理念突破。
首先,提出基于問題難度的大規(guī)模多階段強(qiáng)化學(xué)習(xí)方法,在復(fù)雜推理、數(shù)學(xué)、代碼、語言理解等場景全面提升模型效果及泛化性;同時(shí)提出強(qiáng)化學(xué)習(xí)動(dòng)態(tài)更新算法,基于樣本采樣長度動(dòng)態(tài)調(diào)整強(qiáng)化學(xué)習(xí)更新速度,進(jìn)一步提升深度思考強(qiáng)化學(xué)習(xí)效率及效果。
其次,統(tǒng)一模型下的快慢思考混合訓(xùn)練方法,充分發(fā)揮快慢思考數(shù)據(jù)相互促進(jìn)作用,實(shí)現(xiàn)基于系統(tǒng)指令控制模型是否深度思考,支撐下游更高效便捷地部署使用;
第三,實(shí)現(xiàn)多項(xiàng)工程技術(shù)創(chuàng)新,顯存動(dòng)態(tài)卸載技術(shù)大幅提升長文本推理并發(fā)、訓(xùn)推共卡協(xié)同實(shí)現(xiàn)高效訓(xùn)推資源轉(zhuǎn)換、推理引擎冬眠機(jī)制實(shí)現(xiàn)快速拉起和恢復(fù),實(shí)現(xiàn)國產(chǎn)算力平臺(tái)上高效和穩(wěn)定的強(qiáng)化學(xué)習(xí)訓(xùn)練全流程。
在中美科技競爭日趨激烈的背景下,星火X1選擇的全國產(chǎn)化技術(shù)路徑更具深遠(yuǎn)意義。最近,科大訊飛與華為昇騰聯(lián)合團(tuán)隊(duì)在前期工作基礎(chǔ)上再獲突破,升級(jí)MoE模型的PD分離+大規(guī)模專家并行系統(tǒng)方案,實(shí)現(xiàn)了集群推理性能翻番,包括PD分離部署提升20%+性能、MTP多token預(yù)測技術(shù)提升30%+整體性能、專家負(fù)載均衡算法優(yōu)化使集群吞吐提升30%+,以及異步雙發(fā)射技術(shù)降低服務(wù)請求調(diào)度耗時(shí)提升10%系統(tǒng)性能。堅(jiān)定自主可控算法創(chuàng)新和系統(tǒng)工程創(chuàng)新,使得基于國產(chǎn)算力的星火大模型能夠快速迭代進(jìn)步,在實(shí)際應(yīng)用場景取得顯著效能優(yōu)勢,在當(dāng)前國際形勢下也更具戰(zhàn)略韌性。
此次訊飛星火X1的全面升級(jí),不僅展示了中國人工智能技術(shù)在國產(chǎn)算力平臺(tái)上的創(chuàng)新突破,也為各行各業(yè)數(shù)字化轉(zhuǎn)型提供了新的可能。作為基于國產(chǎn)算力訓(xùn)練的大模型代表作,星火X1的表現(xiàn)證明,在技術(shù)自主可控的道路上,中國AI已具備與國際頂尖模型同臺(tái)競技的實(shí)力。
責(zé)任編輯:莊婷婷
- 最新科技數(shù)碼 頻道推薦
- 進(jìn)入圖片頻道最新圖文
- 進(jìn)入視頻頻道最新視頻
- 一周熱點(diǎn)新聞


已有0人發(fā)表了評(píng)論