科技AI 世代【蘇明允專欄】DeepSe...

【蘇明允專欄】DeepSeek 震驚世界,中國怎麼辦到的?

Date:

DeepSeek-R1 大型語言模型可以執行一些任務,其級別可與聊天機器人 ChatGPT 的開發商 OpenAI 製作的模型相媲美。Gemma Conroy & Smriti Mallapaty發表在最新一期權威期刊《自然》(Nature)的<中國如何創建 AI 模型 DeepSeek 並震驚世界>( How China created AI model DeepSeek and shocked the world)指出,政府政策、慷慨的資金和人工智慧畢業生的管道幫助中國公司創建了先進的大型語言模型課程。(Government policies, generous funding and a pipeline of AI graduates have helped Chinese firms create advanced LLMs.)
中國科技初創公司 DeepSeek 發佈了兩款大型語言模型 (LLM),其性能可與美國科技巨頭開發的主流工具相媲美,但構建的成本和計算能力卻很低。科學家們湧向 DeepSeek:他們如何使用這款轟動一時的 AI 模型
1 月 20 日,這家總部位於杭州的公司發佈了 DeepSeek-R1,這是一個部分開源的“推理”模型,可以以類似於 o1 的標準解決一些科學問題,o1 是 OpenAI 最先進的 LLM,該公司總部位於加利福尼亞州三藩市,去年年底推出了該模型。本周早些時候,DeepSeek 推出了另一個名為 Janus-Pro-7B 的模型,它可以從文本提示中生成圖像,就像 OpenAI 的 DALL-E 3 和倫敦 Stability AI 製造的 Stable Diffusion 一樣。
北京中國科學院計算技術研究所(Institute of Computing Technology of the China Academy of Computing Technology)研究人工智慧晶元的計算機科學家陈雲霽(Yunji Chen)說,鑒於中國對開發大型語言模型的公司進行了巨大的風險資本投資,而且有很多人在科學、技術、工程或數學領域(包括人工智慧)擁有博士學位,像DeepSeek這樣的公司在中國出現是不可避免的。“如果沒有 DeepSeek,就會有其他一些中國的 LLM 可以做偉大的事情。”
事實上,有。1月29日,科技巨頭阿裡巴巴發佈了迄今為止最先進的LLM Qwen2.5-Max,該公司表示,該版本的性能優於DeepSeek的 V3,後者是該公司在12月發佈的另一款LLM。上周,Moonshot AI 和位元組跳動發佈了新的推理模型 Kimi 1.5 和 1.5-pro,兩家公司聲稱在一些基準測試中可以勝過 o1。
2017年,中國政府宣佈打算到 2030 年成為 AI 領域的世界領導者。它要求該行業在 2025 年之前完成重大的人工智慧突破,“使技術和應用達到世界領先水準”。
開發“AI 人才”管道成為當務之急。根據華盛頓特區喬治城大學安全與新興技術中心 (CSET) 的一份報告,到 2022 年,中國教育部已批准 440 所大學提供人工智慧專業的本科學位。根據伊利諾伊州芝加哥智庫 MacroPolo 的數據,那一年,中國提供了近一半的全球領先人工智慧研究人員,而美國僅佔 18%。
澳大利亞悉尼科技大學(University of Technology Sydney)專注於中國創新的科學政策研究員張瑪麗娜(Marina Zhang)說,DeepSeek可能受益於政府對人工智慧教育和人才培養的投資,其中包括大量獎學金、研究資助以及學術界和工業界之間的合作。她還說,例如,由北京科技公司百度牽頭的深度學習技術與應用國家工程實驗室等國家支持的計劃已經培訓了數千名人工智慧專家。
很難找到 DeepSeek 員工的確切數位,但公司創始人梁文峰告訴中國媒體,該公司已經從中國頂尖大學招聘畢業生和博士生。張說,公司領導團隊的一些成員年齡不到 35 歲,他們從小就見證了中國作為科技超級大國的崛起。“他們深受創新自力更生的動力的激勵。”
39 歲的文峰本人也是一名年輕的企業家,畢業於杭州的一流學府浙江大學計算機科學專業。大約十年前,他與他人共同創立了對沖基金 High-Flyer,並於 2023 年成立了 DeepSeek。
在 CSET 研究中國 AI 人才的 Jacob Feldgoise 表示,促進 AI 模型開發生態系統的國家政策將在吸引資金和人才方面説明 DeepSeek 等公司。
但是,儘管大學里的人工智慧課程有所增加,但 Feldgoise 表示,目前尚不清楚有多少學生畢業時獲得了專門的人工智慧學位,以及他們是否被傳授了公司所需的技能。他說,近年來,中國的人工智慧公司抱怨說,「這些課程的畢業生沒有達到他們希望的品質」,這導致一些公司與大學合作。

本文僅代表作者立場,不代表本平台立場

分享文章

Facebook Comments 文章留言

特別報導
特別報導
銳傳媒資料中心

專欄

推薦閱讀