阿里巴巴發布AI模型 聲稱超越DeepSeek

spot_img
spot_img
spot_img

Date:

 

中國科技公司阿里巴巴星期三(1月29日)發布通義千問「Qwen 2.5」人工智慧(AI)模型新版本,聲稱該模型已超越備受矚目的DeepSeek-V3。

中國Deep Seek 在人工智慧領域掀起風暴

阿里雲發表其全新的通義千問Qwen 2.5-Max超大規模混合專家(MoE)模型的時間正值農曆新年第一天,中國人正在放假與家人團聚。這意味著中國AI新創公司深度求索(DeepSeek)過去三週的崛起,不僅給海外競爭對手、也給國內競爭者帶來了強大壓力。

阿里雲在微信公眾號上發布公告說:「Qwen 2.5-Max…幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。」也就是超越OpenAI、深度求索和Meta最先進的開源AI模型。

根據介紹,Qwen 2.5-Max使用超過20兆token(AI模型處理的資料單位)的預訓練資料及精心設計的後訓練方案進行訓練。

阿里雲說,通義團隊分別對Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本效能進行了評估測試。在指令模型測試方面,Qwen2.5-Max在多個基準測試中比美美國的Claude-3.5-Sonnet模型,幾乎全面超越了另外三個美國模型GPT-4o、DeepSeek-V3及Llama-3.1-405B 。

阿里雲表示,在基座模型測試方面,通義團隊將Qwen2.5-Max與目前DeepSeek V3、Llama-3.1-405B、Qwen2.5-72B進行了對比,而Qwen2.5-Max在所有11項基準測試中全部超越了對比模型。

微信公眾號「簡約財經」的貼文指出,Qwen 2.5-Max 在發展過程中仍面臨著許多挑戰和風險,其中包括在技術挑戰方面,訓練優化過程中的計算資源消耗和時間成本問題,以及模型在複雜任務和多模態融合方面的表現提升需求,都需要進一步的研究和創新來解決。

公告文章說,在倫理與安全風險方面,Qwen 2.5-Max也面臨資料隱私保護、模型偏見避免以及內容真實性和AI 濫用防範等需要高度重視的問題。

深度求索1月10日發布了其DeepSeek-V3模型驅動的AI助手,隨後在1月20日推出R1模型。這一系列AI模型的新發布震撼了矽谷,並導致科技股重挫。深度求索據稱低廉的開發和使用成本,促使投資者開始質疑美國領先AI公司的巨額支出計劃。

深度求索的成功也引發中國內部競爭對手競相升級本身的AI模型,TikTok母公司字節跳動推出其旗艦AI模型的更新,聲稱該模型在AIME(旨在衡量AI模型對複雜指令的理解和回應能力的一項基準測試)中的表現優於微軟支援的OpenAI的o1模型。

DeepSeek-V3模型的前身DeepSeek-V2在去年5月發布後,引發了中國AI模型的價格戰。

DeepSeek-V2採用開源和空前低廉的價格(每百萬個tokens僅需1元人民幣),導致阿里雲宣布對一系列模型的降價幅度最高達97%。

其他中國科技公司紛紛跟進,包括百度(2023年3月發布中國首個類同於ChatGPT的產品)以及中國市值最高的互聯網公司騰訊。

深度求索的神秘創始人梁文鋒在去年7月接受中國媒體《暗湧》(Waves)的罕見採訪中表示,該公司「不在乎」價格戰,其主要目標是實現AGI(通用人工智慧)。

相較於阿里巴巴等中國大型科技公司擁有數十萬名員工,深度求索的運作方式像是研究實驗室,其團隊主要由來自中國頂尖大學的年輕畢業生和博士生組成。

梁文鋒在去年7月的訪談中表示,他認為中國大型科技公司可能不太適合未來的AI產業,並將這些企業的高成本和自上而下的架構,與深度求索採用的精簡營運和寬鬆管理的風格,進行比較。

他說:「大型基礎模型需要持續創新,科技巨頭的能力是有限的。」

本文僅代表作者立場,不代表本平台立場

分享文章

Facebook Comments 文章留言

國際新聞中心
國際新聞中心
銳傳媒國際新聞中心
spot_img

你可能還感興趣的新聞

推薦閱讀