交匯點訊 近日,記者從安徽省量子計算工程研究中心獲悉,本源量子、合肥綜合性國家科學中心人工智能研究院等機構聯合攻關,在中國第三代自主超導量子計算機“本源悟空”真機上,全球首次運行十億參數ai大模型微調任務。實驗結果顯示,在參數量減少76%的前提下,訓練效果反而提升8.4%。這一成果不僅驗證了量子計算助力實現大模型輕量化的可行性,更為破解大模型“算力焦慮”開辟了新路徑。
微調是指在通用大模型(如 deepseek、qwen)的基礎上,通過進一步訓練特定領域數據,使其適應醫(yī)療診斷、金融風控等專業(yè)場景。傳統(tǒng)低秩微調面臨性能瓶頸、泛化能力有限等問題,量子計算憑借其疊加態(tài)和糾纏態(tài)特性可同時探索海量參數組合,可提升大模型微調的效率。
“就好比給經典模型裝上了‘量子引擎’,讓兩者協同發(fā)力。”本源量子副總裁竇猛漢表示,團隊創(chuàng)新設計了“量子加權張量混合參數微調”,通過量子計算特性實現智能“微調”——將模型權重轉化為量子神經網絡與張量網絡混合架構,前者通過量子門操作提取高維非線性特征,張量網絡則壓縮參數規(guī)模。
在“本源悟空”的量子芯片上,單批次數據可生成數百個量子任務并行處理。實驗數據顯示,優(yōu)化后的模型在心理咨詢對話數據集(cpsycountd)上訓練損失降低15%,數學推理任務(r1-distill-sft)的嚴格準確率從68%提升至82%。合肥綜合性國家科學中心人工智能研究院副研究員陳昭昀補充:“這是量子計算首次‘真機實戰(zhàn)’大模型任務,證明現有硬件已能初步支撐大模型微調。”
據介紹,“本源悟空”是目前我國先進的可編程、已交付超導量子計算機,已為全球139個國家超2300萬人次提供量子算力云服務,完成35萬個量子運算任務,涵蓋流體動力學、金融、生物醫(yī)藥等多個行業(yè)領域,成功完成全球最大規(guī)模的量子計算流體動力學仿真,并接入金融量子云實驗平臺用于探索金融領域更高效的問題解決方案。
新華日報·交匯點記者 張宣
上觀號作者:交匯點
全部評論 (0)