小米集團正加速對AI大模型大力投入,近期著手搭建自己的GPU「萬卡集群」,且表明小米AI硬體布局方面最核心的是手機而不是眼鏡,而小米大模型團隊在成立時已有6,500張GPU資源。
萬卡集群是指由一萬張及以上的加速卡(如GPU、TPU或其他專用AI加速晶片)組成的高性能計算系統,主要用於加速人工智慧模型的訓練和推理過程。
界面新聞報導,一名知情人士表示,該計畫已經施行數月之久,小米集團董事長雷軍在其中扮演重要的領導角色。「在AI硬體這件事情上,最核心的是手機而不是眼鏡,小米在這個領域不『all in』是不可能的。」
小米對AI大模型的重視度提升,先前已有信號。第一財經此前報導,DeepSeek開源大模型DeepSeek-V2的關鍵開發者之一羅福莉,將加入小米,或任職於小米AI實驗室,領導小米大模型團隊。
先前DeepSeek-V2在模型架構上的重要創新在於對MLA的採用,這項技術在降低大模型使用成本上發揮了關鍵作用,而羅福莉是這項工作的核心人物之一。
小米於2023年4月組建AI實驗室大模型團隊,任命欒劍擔任大模型團隊負責人,向小米技術委員會副主席、AI實驗室主任王斌匯報。
同一時間,雷軍發文談論對大模型和生成式人工智慧(AIGC)的看法時表示,小米在AI領域已耕耘多年,有AI實驗室、小愛同學、自動駕駛等團隊。「對於大模型,我們當然會全力以赴,堅決擁抱。我們正在研發一些有趣的技術和產品,等我們打磨好了,再給大家展示。」
隨後,在小米2023周年演講上,雷軍再度談及公司大模型業務進展。他稱團隊成立之後,小米大模型技術的主力突破方向為輕量化、本地部署。作為最新成果,小米已初步跑通手機端側大模型(13億參數級別),在部分場景效果接近雲端60億參數級別的大模型,將同步推送升級大模型版本的小愛同學。
此外,小米於2024年5月宣布,小米大語言模型MiLM通過大模型備案。小米表示,小米大模型將逐步應用於小米汽車、手機、智慧家居等產品中,透過端雲結合,實現場景內和場景間多設備的協同,為「人車家全生態」戰略賦能。
沒有留言:
張貼留言