IT之家 4 月 10 日消息,在今日舉行的華為云生態大會 2025 上,華為常務董事、華為云計算 CEO 張平安公布了 AI 基礎設施架構進展,推出 CloudMatrix 384 超節點,并宣布已在蕪湖數據中心規模上線。
據介紹,華為云 CloudMatrix 384 超節點可實現從服務器級到矩陣級的資源供給模式轉變,具備“高密”“高速”“高效”的特點,通過架構創新,在算力、互聯帶寬、內存帶寬等方面實現領先。
華為云還表示,對昇騰 AI 云服務進行持續優化,目前其已全面適配包含 DeepSeek 在內的 160 多個第三方大模型,為大模型訓推提供可靠保障,支撐行業應用快速落地。此外,華為云盤古大模型已在 30 多個行業、400 多個場景中落地,在城市治理、智慧金融、醫療健康、氣象預測等領域廣泛應用。
IT之家注意到,硅基流動今日也宣布聯合華為云基于 CloudMatrix 384 超節點昇騰云服務和高性能推理框架 SiliconLLM ,用大規模專家并行最佳實踐正式上線 DeepSeek-R1。
硅基流動介紹稱,該服務在保證單用戶 20 TPS 水平前提下,單卡 Decode 吞吐突破 1920 Tokens / s,可比肩 H100 部署性能。同時,經過主流測試集驗證及大規模線上盲測,在昇騰算力部署 DeepSeek-R1 的模型精度與 DeepSeek 官方保持一致。
全部評論 (0)