不久前,上海重磅發布人工智能“模塑申城”實施方案,聚焦“5+6”領域和行業,大力推進大模型垂類應用。記者最新獲悉,該方案進展喜人,醫療、制造兩個重點行業已率先破題,構建起助推垂類應用落地的功能性平臺。教育行業的功能性平臺也即將發布。
速度之外,功能性平臺本身亦引發關注。它們的定位,在于大模型垂類應用“中試訓練場”,旨在大幅降低大模型使用門檻。舉目全國,這一范式,上海獨有。
落地不易
在東方醫院,被喂了6000本醫學教材的AI“醫生伴侶”,已在輔助醫生進行診斷;在振華重工基地,大量并行交付海外的港機項目,正由多任務智能體協助統籌進度。
大模型在不容出錯的醫療和工業領域,正表現出卓越執行力。但殊不知,它們“出道”前卻頗多曲折。
“模型訓練一般需要1至2個月,但此前,資源匹配及各項準備工作的耗時,可能是真正訓練的數倍。”一家大模型垂類應用服務商向記者詳述工業用戶為降本增效而苦煉大模型的“漫漫長路”——
制造業一旦決定問計于大模型,往往自建團隊,第一步是尋找算力。基于現實考慮,企業多半會選擇中外芯片“混搭”,這就牽出新的問題,即要在多元異構的算力下絲滑地完成大模型訓練,這絕非易事,需要專業公司幫助進行混合訓練、推理加速和算力調度。另一方面,模型廠商各有強項,有些擅長視頻、圖形和語音處理,有些在長文本記憶、推理運算上有優勢。為此,應用方又需要挨個試驗評估,才能找到最適配,其中“交學費”在所難免。
通常而言,企業跑到這一階段,基本無力再跑。少數不甘心的企業,會接續財力和資源,向外尋找專業人員,具體工作包括:開發工具鏈與中間件、外掛知識庫、對模型進行反復精調和預訓練等。與此同時,企業還需要為獲取高質量語料而奔走……以上諸多環節,每個環節略有偏差,最終訓練出的智能體便可能“失之千里”。
因此,制造業潛心投入6至12個月,結果大模型垂類應用始終難以交付的情況非常多見。
按需“中試”
不難想象,大量垂類應用需求方都走過類似“彎路”。在上海市人工智能行業協會秘書長鐘俊浩看來,產業界大可不必“重復造輪子”。
那么,有沒有可能搭建一個平臺,將前輩“踩坑”“交學費”后泣血實踐出的成熟方案和諸多工具,進行集中歸納展示,讓應用方按需取用,看到捷徑的可能?
事實上,早在“模塑申城”實施方案正式發布前,一個致力于減少大模型試驗成本、幫助企業高效實現產品化的“中試訓練場”,就已經由政府部門牽頭推進起來。
今年1月4日亮相的上海新型工業化MaaS(模型即服務)平臺便是成果之一。該平臺的發起單位包括了上海市經信委、上海市委網信辦、上海聯通、上海市先導產業促進中心、上海市人工智能行業協會、上海市互聯網業聯合會、西門子(中國)有限公司、上海庫帕思科技有限公司、上海稀宇極智科技有限公司、上海無問芯穹智能科技有限公司、上海羚數智能科技有限公司等。
從陣容可見,平臺集結了運營商、算力、行業語料、基礎模型及應用服務商等,涵蓋大模型垂類應用所需各類基礎能力。
記者發現,去年11月成立的上海醫療領域公共服務大MaaS平臺、今年1月3日成立的天工人工智能工業平臺,都遵循這一邏輯。
今年1月3日,上海成立天工人工智能工業平臺。(供圖)
關鍵在于,這些平臺足夠垂,足夠專業。如新型工業化MaaS平臺,已天然剔除了與工業領域大模型不相關的“輪子”。平臺上陳列的圖形生成式工具,均偏重于工程圖紙分類識別及生成,而非針對電商、游戲等2C端的圖形生成。平臺上五大場景,即研發設計、生產制造、裝備運維、運營服務、供應鏈管理等,無不是為工業場景度身定做。
“中試訓練場”為垂類應用度身定做。
“這些平臺如同成衣店,已陳列了大中小號各款服裝,應用方可入店試衣,并按需購買。再不用像過去那樣,把各款衣服先一路買下來,回家逐件試是否合身,白白浪費錢。”鐘俊浩說。
據透露,醫療、工業行業之外,第三類“中試訓練場”有望在教育行業誕生。
系統打法
“中試訓練場”,只是上海“模塑申城”系統性打法中的一環。
上海垂類應用加速度的背后,有著上海算力基礎設施、基礎模型、語料、資本、人才等要素的全面布局與支撐。
大模型訓練遵循“尺度定律”,即訓練計算量、訓練數據規模、模型參數量,與模型效能之間存在正向關聯。簡言之,就是“大力出奇跡”。為此早在2023年,上海就超前提出了10萬卡以上超大規模智算算力投入。而此次人工智能“模塑申城”實施方案中,又提出到2025年,全市智算規模力爭突破100EFLOPS(每秒能進行100億億次浮點運算的計算能力)。這相當于30萬張英偉達A100芯片的算力,規模超過目前北京和深圳算力規模的總和。
超大規模算力,致力于訓出上海自己的基礎模型。記者獲悉,經數年苦煉,上海“1+3”基礎模型格局基本形成,包括了上海人工智能實驗室書生·浦語大模型,以及商湯、Minimax、階躍星辰模型。
語料方面,上海成立了全國首家人工智能語料公司“庫帕思”。
由此,算力、基模、語料,已然齊備。有此底氣,去年8月起,上海開始強力推進大模型垂類應用,敲定“5+6”領域及行業,“5”指智能終端、科學智能、在線新經濟、自動駕駛、具身智能5個關鍵領域;“6”指金融、制造、教育、醫療、文旅、城市治理6個重點行業。上海市人工智能行業協會也隨之轉變角色,從過去致力于生態搭建,轉向專注于產業平臺建設。
此外,圍繞產業對接,上海相繼成立225億元人工智能母基金、600億元人工智能國家大基金,及100億元人工智能生態基金,逐漸形成近千億級的基金規模。
“所有努力,都在于以全要素支撐保障,來解決人工智能‘叫好不叫座、發光不發熱’問題。”鐘俊浩說。
殊不知,“中試訓練場”的目標,其實已寫入“模塑申城”方案中,即到今年底,上海要形成50個具顯著成效的行業開放語料庫示范應用成果。種種跡象表明,而今上海,儼然將整座城市變成了一座人工智能大廠。
原標題:《修煉大模型原來走了那么多彎路!上海搭建“中試訓練場”,范式全國獨有……》
本文作者:解放日報 李曄
全部評論 (0)