轉(zhuǎn)載自:解放日?qǐng)?bào)
年初,上海重磅發(fā)布人工智能“模塑申城”實(shí)施方案,聚焦“5+6”領(lǐng)域和行業(yè),大力推進(jìn)大模型垂類應(yīng)用。該方案進(jìn)展順利,醫(yī)療、制造兩個(gè)重點(diǎn)行業(yè)已率先破題,構(gòu)建起助推垂類應(yīng)用落地的功能性平臺(tái)。教育行業(yè)的功能性平臺(tái)也即將發(fā)布。
速度之外,功能性平臺(tái)本身亦引發(fā)關(guān)注。它們的定位,在于大模型垂類應(yīng)用“中試訓(xùn)練場”,旨在大幅降低大模型使用門檻。
落地不易
在東方醫(yī)院,被喂了6000本醫(yī)學(xué)教材的ai“醫(yī)生伴侶”,已在輔助醫(yī)生進(jìn)行診斷;在振華重工基地,大量并行交付海外的港機(jī)項(xiàng)目,正由多任務(wù)智能體協(xié)助統(tǒng)籌進(jìn)度。
大模型在不容出錯(cuò)的醫(yī)療和工業(yè)領(lǐng)域,正表現(xiàn)出卓越執(zhí)行力。但殊不知,它們“出道”前卻頗多曲折。
“模型訓(xùn)練一般需要1至2個(gè)月,但此前,資源匹配及各項(xiàng)準(zhǔn)備工作的耗時(shí),可能是真正訓(xùn)練的數(shù)倍。”一家大模型垂類應(yīng)用服務(wù)商詳述工業(yè)用戶為降本增效而苦練大模型的“漫漫長路”——
制造業(yè)一旦決定問計(jì)于大模型,往往自建團(tuán)隊(duì),第一步是尋找算力。基于現(xiàn)實(shí)考慮,企業(yè)多半會(huì)選擇中外芯片“混搭”,這就牽出新的問題,即要在多元異構(gòu)的算力下絲滑地完成大模型訓(xùn)練,這絕非易事,需要專業(yè)公司幫助進(jìn)行混合訓(xùn)練、推理加速和算力調(diào)度。另一方面,模型廠商各有強(qiáng)項(xiàng),有些擅長視頻、圖形和語音處理,有些在長文本記憶、推理運(yùn)算上有優(yōu)勢。為此,應(yīng)用方又需要挨個(gè)試驗(yàn)評(píng)估,才能找到最適配的,其中“交學(xué)費(fèi)”在所難免。
通常而言,企業(yè)跑到這一階段,基本無力再跑。少數(shù)不甘心的企業(yè),會(huì)接續(xù)財(cái)力和資源,向外尋找專業(yè)人員,具體工作包括:開發(fā)工具鏈與中間件、外掛知識(shí)庫、對(duì)模型進(jìn)行反復(fù)精調(diào)和預(yù)訓(xùn)練等。與此同時(shí),企業(yè)還需要為獲取高質(zhì)量語料而奔走……以上諸多環(huán)節(jié),每個(gè)環(huán)節(jié)略有偏差,最終訓(xùn)練出的智能體便可能“失之千里”。
因此,制造業(yè)潛心投入6至12個(gè)月,結(jié)果大模型垂類應(yīng)用始終難以交付的情況非常多見。
按需“中試”
不難想象,大量垂類應(yīng)用需求方都走過類似“彎路”。在上海市人工智能行業(yè)協(xié)會(huì)秘書長鐘俊浩看來,產(chǎn)業(yè)界大可不必“重復(fù)造輪子”。
那么,有沒有可能搭建一個(gè)平臺(tái),將前輩“踩坑”“交學(xué)費(fèi)”后泣血實(shí)踐出的成熟方案和諸多工具,進(jìn)行集中歸納展示,讓應(yīng)用方按需取用,看到捷徑的可能?
事實(shí)上,早在“模塑申城”實(shí)施方案正式發(fā)布前,一個(gè)致力于減少大模型試驗(yàn)成本、幫助企業(yè)高效實(shí)現(xiàn)產(chǎn)品化的“中試訓(xùn)練場”,就已經(jīng)由政府部門牽頭推進(jìn)起來。
今年1月4日亮相的上海新型工業(yè)化maas(模型即服務(wù))平臺(tái)便是成果之一。該平臺(tái)的發(fā)起單位包括上海市經(jīng)信委、上海市委網(wǎng)信辦、上海聯(lián)通、上海市先導(dǎo)產(chǎn)業(yè)促進(jìn)中心、上海市人工智能行業(yè)協(xié)會(huì)、上海市互聯(lián)網(wǎng)業(yè)聯(lián)合會(huì)、西門子(中國)有限公司、上海庫帕思科技有限公司、上海稀宇極智科技有限公司、上海無問芯穹智能科技有限公司、上海羚數(shù)智能科技有限公司等。
從陣容可見,平臺(tái)集結(jié)了運(yùn)營商、算力、行業(yè)語料、基礎(chǔ)模型及應(yīng)用服務(wù)商等,涵蓋大模型垂類應(yīng)用所需各類基礎(chǔ)能力。
去年11月成立的上海醫(yī)療領(lǐng)域公共服務(wù)大maas平臺(tái)、今年1月3日成立的天工人工智能工業(yè)平臺(tái),都遵循這一邏輯。
關(guān)鍵在于,這些平臺(tái)足夠垂直、足夠?qū)I(yè)。如新型工業(yè)化maas平臺(tái),已天然剔除了與工業(yè)領(lǐng)域大模型不相關(guān)的“輪子”。平臺(tái)上陳列的圖形生成式工具,均偏重于工程圖紙分類識(shí)別及生成,而非針對(duì)電商、游戲等2c端的圖形生成。平臺(tái)上五大場景,即研發(fā)設(shè)計(jì)、生產(chǎn)制造、裝備運(yùn)維、運(yùn)營服務(wù)、供應(yīng)鏈管理等,無不是為工業(yè)場景定做。
“這些平臺(tái)如同成衣店,已陳列了大中小號(hào)各款服裝,應(yīng)用方可入店試衣,并按需購買。不用再像過去那樣,把各款衣服先一路買下來,回家逐件試是否合身,白白浪費(fèi)錢。”鐘俊浩說。
據(jù)透露,除醫(yī)療、工業(yè)行業(yè)之外,第三類“中試訓(xùn)練場”有望在教育行業(yè)誕生。
系統(tǒng)打法
“中試訓(xùn)練場”,只是上海“模塑申城”系統(tǒng)性打法中的一環(huán)。
上海垂類應(yīng)用加速度的背后,有著上海算力基礎(chǔ)設(shè)施、基礎(chǔ)模型、語料、資本、人才等要素的全面布局與支撐。
大模型訓(xùn)練遵循“尺度定律”,即訓(xùn)練計(jì)算量、訓(xùn)練數(shù)據(jù)規(guī)模、模型參數(shù)量,與模型效能之間存在正向關(guān)聯(lián)。簡言之,就是“大力出奇跡”。為此早在2023年,上海就超前提出了10萬卡以上超大規(guī)模智算算力投入。而此次人工智能“模塑申城”實(shí)施方案中,又提出到2025年,全市智算規(guī)模力爭突破100eflops(每秒能進(jìn)行100億億次浮點(diǎn)運(yùn)算的計(jì)算能力)。這相當(dāng)于30萬張英偉達(dá)a100芯片的算力,規(guī)模超過目前北京和深圳算力規(guī)模的總和。
超大規(guī)模算力,致力于訓(xùn)練出上海自己的基礎(chǔ)模型。經(jīng)數(shù)年苦練,上海“1+3”基礎(chǔ)模型格局基本形成,包括上海人工智能實(shí)驗(yàn)室書生·浦語大模型,以及商湯、minimax、階躍星辰模型。
語料方面,上海成立了全國首家人工智能語料公司“庫帕思”。
由此,算力、基模、語料,已然齊備。有此底氣,去年8月起,上海開始強(qiáng)力推進(jìn)大模型垂類應(yīng)用,敲定“5+6”領(lǐng)域及行業(yè),“5”指智能終端、科學(xué)智能、在線新經(jīng)濟(jì)、自動(dòng)駕駛、具身智能5個(gè)關(guān)鍵領(lǐng)域;“6”指金融、制造、教育、醫(yī)療、文旅、城市治理6個(gè)重點(diǎn)行業(yè)。上海市人工智能行業(yè)協(xié)會(huì)也隨之轉(zhuǎn)變角色,從過去致力于生態(tài)搭建,轉(zhuǎn)向?qū)W⒂诋a(chǎn)業(yè)平臺(tái)建設(shè)。
此外,圍繞產(chǎn)業(yè)對(duì)接,上海相繼成立225億元人工智能母基金、600億元人工智能國家大基金,以及100億元人工智能生態(tài)基金,逐漸形成近千億元級(jí)的基金規(guī)模。
“所有努力,都在于以全要素支撐保障,來解決人工智能‘叫好不叫座、發(fā)光不發(fā)熱’問題。”鐘俊浩說。
殊不知,“中試訓(xùn)練場”的目標(biāo)已寫入“模塑申城”方案中,即到今年底,上海要建成50個(gè)具有顯著成效的行業(yè)開放語料庫示范應(yīng)用成果。種種跡象表明,而今,上海儼然將整座城市變成了一座人工智能大廠。
歡迎轉(zhuǎn)發(fā),但請(qǐng)注明出處“上海經(jīng)信委”
覺得不錯(cuò)請(qǐng)點(diǎn)贊!
上觀號(hào)作者:上海經(jīng)信委
全部評(píng)論 (0)