2024年下半年是大模型發(fā)展由虛向?qū)嵉闹匾A段,在大模型賦能實體經(jīng)濟的過程中,對算力產(chǎn)生了爆發(fā)式需求。中國科學院院士陳潤生在2024中國算力專家研討會上表示:“大模型是新質(zhì)生產(chǎn)力的代表,大模型和超級計算的融合發(fā)展十分重要”。日前,國產(chǎn)大模型正致力于給世界提供“第二選擇”。10月24日,在2024科大訊飛全球1024開發(fā)者節(jié)開幕式上,科大訊飛、華為、合肥市大數(shù)據(jù)資產(chǎn)運營有限公司三方聯(lián)合打造的國產(chǎn)超大規(guī)模智算平臺“飛星二號”正式啟動,標志著國產(chǎn)化大模型智算集群的再次躍遷,更大規(guī)模訓練推理同步啟動并加速訊飛星火大模型的迭代歷程。
去年10月24日,首個國產(chǎn)萬卡算力集群“飛星一號”平臺上線,星火大模型持續(xù)引領(lǐng)全國產(chǎn)算力平臺發(fā)展,劉慶峰表示,最近一年以來攻克了很多大模型集群訓練的“疑難雜癥”,解決了500多次基礎軟硬件問題,模型訓練適配優(yōu)化平臺耗時從90天縮減到15天,新增30多項框架和平臺特性,優(yōu)化了150多個基礎、通信和融合算子。
據(jù)了解,“飛星二號”將帶來新模型新算法的持續(xù)適配和智算集群規(guī)模的再次躍遷,持續(xù)探索無人區(qū)、引領(lǐng)國產(chǎn)大模型底座的發(fā)展、給世界提供第二種選擇。正如科大訊飛董事長劉慶峰在會上所言:“只有在真正自主可控的平臺上,才有真正的中國人工智能大未來。”
訊飛星火正在全國產(chǎn)算力平臺基礎上持續(xù)引領(lǐng)國產(chǎn)大模型的迭代。在10月24日科大訊飛全球開發(fā)者節(jié)上,訊飛星火4.0 Turbo正式發(fā)布,七大核心能力全面超過GPT-4 Turbo,數(shù)學和代碼能力超越GPT-4o,這些結(jié)論均根據(jù)真實數(shù)據(jù)背靠背的測試得出。
目前在大模型領(lǐng)域,由艾倫人工智能研究所、OpenAI等國內(nèi)外權(quán)威單位發(fā)布的涵蓋理解和推理、綜合考試、數(shù)學和科學、代碼等不同任務類型的14項主流測試集,是用來比對大模型核心能力水平的重要工具。訊飛星火4.0-Turbo在14項中9項測試集中實現(xiàn)超對美國三大主流模型(GPT-4o、Claude 3.5 Sonnet、Gemini 1.5pro)的超越,效率相對提升50%。
值得一提的是,在硬碰硬”的數(shù)學能力和代碼能力中,根據(jù)實用數(shù)學任務構(gòu)建測試集CAppliedMath-1.0,訊飛星火4.0 Turbo在計算、財務、金融、度量等多個維度的任務中均超過GPT-4o水平,已完成超長思維鏈、樹搜索和自我反思評價等算法驗證,預計今年底可實現(xiàn)類OpenAI o1的高難度數(shù)學能力顯著提升。根據(jù)代碼生成HumanEval測試集上的效果對比,訊飛星火4.0 Turbo在Python、Java、JavaScript等任務上和GPT-4o差距微弱,在C++能力上超過GPT-4o。在真實應用場景中,基于認知智能全國重點實驗室構(gòu)建的iFLYCode-Eval-2.0代碼實用場景測試集,訊飛星火4.0 Turbo在代碼生成、代碼檢錯、單元測試等任務上都超過了GPT-4o。
此次訊飛星火4.0 Turbo的發(fā)布,表明訊飛星火在不斷夯實七大核心能力優(yōu)勢,更在決定大模型“聰明程度”的數(shù)學和代碼能力上持續(xù)進步,具備了更強的可用性與行業(yè)適配性。
人工智能應用日益進入到場景化的深水區(qū),面向未來,科大訊飛董事長劉慶峰還給出了人工智能產(chǎn)業(yè)發(fā)展的關(guān)鍵是五個關(guān)鍵詞:頂天立地、自主可控、通專結(jié)合、端云聯(lián)動、軟硬一體。。相信基于全國產(chǎn)算力的大模型自主技術(shù)創(chuàng)新,以“飛星二號”啟動為標志,科大訊飛將持續(xù)探索“無人區(qū)”,給予世界第二選擇的同時,將技術(shù)飛躍與算力躍遷落實到千行百業(yè),共建AI自主可控、共享共建的繁榮生態(tài)。