南韓LG集團旗下的人工智慧研發部門LG AI Research近日發表了名為Exaone Deep的開源AI推理模型,這款模型在推理能力上挑戰全球領先地位。該公司於週二宣布,其AI推理模型在科學理解和數學邏輯方面的表現已超越全球競爭對手,包括美國OpenAI的GPT系列模型、Google DeepMind的Gemini以及中國的DeepSeek。
這款韓國自主研發的AI模型以LG的大型語言模型Exaone 3.5為基礎,在複雜問題解決方面展現出卓越性能,特別是在長文本理解和指令跟隨準確性方面表現突出。目前全球僅有少數擁有基礎模型的公司,如OpenAI、Google、DeepSeek和阿里巴巴,已成功開發出AI推理模型。
機器學習是透過訓練數據和算法在監督下使AI模仿人類學習方式的過程,而AI推理則是應用AI模型從機器學習中獲得的知識,對從未見過的信息進行決策、預測或得出結論的能力。LG表示,他們對Exaone Deep寄予厚望,認為這是韓國首個能夠與全球科技巨頭正面競爭的AI推理模型。透過這一新型AI推理模型,韓國科技巨頭正為代理式AI(Agentic AI)時代做準備,在該時代中,AI能獨立形成假設、驗證假設並在無需人類指令的情況下自主作出決策。
性能實力展現
Exaone Deep的三個模型版本—擁有320億參數的Exaone Deep 32B、78億參數的Exaone Deep 7.8B以及24億參數的Exaone Deep 2.4B—都在數學推理方面勝過主要競爭對手。Exaone Deep 32B僅用其競爭對手DeepSeek R1(擁有6710億參數)5%的規模就展現出同等性能。在韓國大學入學考試(CSAT)數學測試中獲得94.5分的高分,在2024年美國邀請數學考試(AIME)中獲得90.0分。在2025年AIME考試中,它的表現與DeepSeek-R1模型不相上下。
Exaone Deep 7.8B和2.4B模型在輕量級模型和設備端模型類別的所有主要基準測試中均名列前茅。三個模型在評估博士級物理、化學和生物問題解決能力的測試中也表現出色。特別是Exaone Deep 7.8B和2.4B模型在輕量級和設備端領域取得了最高性能,超過了其全球同行,如OpenAI的o1-mini。
Exaone Deep在編碼和問題解決方面也證明了其實力,強調了其在軟體開發、自動化和其他需要高計算精度的技術領域的應用潛力。在通用語言理解方面,它在韓國模型中獲得了最高的大規模多任務語言理解(MMLU)評分。Exaone Deep的評估結果已發布在全球開源AI平台Hugging Face上。
爭奪下一代AI推理主導權
Exaone Deep的發布標誌著LG對AI驅動創新的深化承諾,隨著全球對高性能、領域專業化模型的競爭加劇,這一領域的發展日益重要。特別是在中國DeepSeek在推理能力方面崛起後,具有成本效益的模型正受到廣泛關注。
LG AI Research在縮小參數規模的同時,使用高質量數據集訓練Exaone Deep。該公司表示,它利用LG子公司的領域特定數據,並只選擇公共數據來提高推理準確性。
LG將在美國加州聖荷西舉行的輝達公司開發者AI大會GTC 2025(3月17日至21日)上展示其三款新AI推理模型—Exaone Deep 32B、Exaone Deep 7.8B和Exaone Deep 2.4B。去年夏天,LG集團控股公司LG Corp旗下的研究所LG AI Research揭曉了Exaone 3.0,這是2023年7月展示的前代產品的改進版。該集團於2021年12月推出了Exaone的第一個版本。
隨著全球AI領域的競爭日益激烈,LG此次推出的Exaone Deep系列模型不僅標誌著韓國在AI技術上的重大突破,也為東亞地區在全球AI格局中爭取更多話語權奠定了基礎。面對美國和中國科技巨頭的主導,LG的這一步驟展現了韓國企業在高端技術領域的雄心與實力。
專家分析指出,LG選擇在推理能力上發力,而非單純追求參數規模,反映了AI發展的新趨勢—在有限資源下實現高效能計算。這與台灣半導體產業的發展理念不謀而合,強調效能優化而非單純的規模擴張。
對台灣科技產業來說,LG的成功案例提供了寶貴借鑒:結合本土優勢與產業鏈整合能力,有可能在特定AI領域實現突破。隨著全球對AI推理需求增長,台灣企業可以發揮在硬體製造和系統整合方面的優勢,與韓國等鄰近國家形成互補而非單純競爭的關係。
業界觀察人士認為,未來兩年將是亞洲企業在全球AI領域爭取話語權的關鍵期,LG此次展示的技術成果無疑增強了亞洲在這場全球競爭中的位置。台灣企業若能把握AI推理與運算的發展方向,結合本土半導體製造優勢,有望在這場全球AI變革中找到自己的定位。