文化台灣民俗【蔡先靖專欄】為什麼日本正...

【蔡先靖專欄】為什麼日本正在構建自己的 ChatGPT 版本?

Date:

文 / 蔡先靖

一些日本研究人員認為,接受外語訓練的人工智能系統無法掌握日本語言和文化的複雜性。蒂姆·霍尼亞克Tim Hornyak發表在最新一期《自然》(Nature)的<為什麼日本正在構建自己的 ChatGPT 版本>( Why Japan is building its own version of ChatGPT) 說,日本正在構建自己版本的 ChatGPT,這是由美國公司 OpenAI 製造的人工智能 (AI) 聊天機器人,在不到一年前推出後引起了全球轟動引起的。

人工智能系統無法掌握日本語言和文化的複雜性

日本政府和 NEC、富士通和軟銀等大型科技公司正在投入數億美元創建人工智能系統,這些系統基於相同的底層技術,即大語言模型 (LLM),但使用的是日語,而不是英文版本的翻譯。日本東北大學自然語言研究人員 Keisuke Sakaguchi 表示:「目前的公立法學專家,例如 GPT,在英語方面表現出色,但由於字母系統的差異、有限的數據和其他因素,日語方面往往表現不佳。」加工。法學專家通常使用來自公開來源的大量數據來學習自然語音和散文的模式。他們被訓練根據一段文本中先前的單詞來預測下一個單詞。ChatGPT 之前的模型 GPT-3 訓練的絕大多數文本都是英語。ChatGPT 進行類似人類對話的怪異能力讓研究人員既高興又擔心。一些人認為它是一種潛在的節省勞動力的工具;其他人則擔心它可能被用來偽造科學論文或數據。在日本,人們擔心接受其他語言數據集訓練的人工智能系統無法掌握日本語言和文化的複雜性。日語的句子結構與英語完全不同。因此,ChatGPT 必須將日語查詢翻譯成英語,找到答案,然後將響應翻譯回日語。

英語只有 26 個字母,而書面日語由兩組 48 個基本字符組成,加上 2,136 個常用漢字或漢字。大多數漢字都有兩種或兩種以上的發音,還有大約 50,000 個很少使用的漢字。考慮到這種複雜性,ChatGPT 在該語言上遇到困難也就不足為奇了。

ChatGPT必須準確反映文化習俗和語言

在日語中,ChatGPT「有時會生成大多數人以前從未見過的極其罕見的字符,並導致奇怪的未知單詞」,Sakaguchi 說。為了使法學專家有用,甚至具有商業可行性,它需要準確反映文化習俗和語言。例如,如果 ChatGPT 被提示用日語寫一封求職電子郵件,它可能會省略標準的禮貌用語,並且看起來像是明顯的英語翻譯。

為了衡量法學專家對日本文化的敏感程度,一組研究人員推出了Rakuda,這是一個排名,旨在衡量法學專家回答有關日本主題的開放式問題的能力。Rakuda 聯合創始人 Sam Passaglia 和他的同事要求 ChatGPT 比較標準提示答案的流動性和文化適宜性。他們使用該工具對結果進行排名是基於 6 月份發布的預印本,該預印本顯示 GPT-4 在 87% 的情況下與人類審閱者的結果一致。最好的開源日本 LLM 在 Rakuda 上排名第四,而排名第一的 GPT-4 或許並不令人意外,因為它也是比賽的評委。

「當然,日本的法學專家正在變得更好,但它們遠遠落後於 GPT-4,」東京大學研究日語語言模型的物理學家帕薩利亞說。但他表示,原則上沒有理由認為日本的 LLM 未來不能等於或超越 GPT-4。「這在技術上並不是無法克服的,而只是資源問題。」

創建一個適應科學需求的日本人工智能

創建日語法學專家的一項重大工作是使用日本超級計算機 Fugaku(世界上最快的計算機之一),主要對其進行日語輸入訓練。在東京工業大學、東北大學、富士通和政府資助的 RIKEN 研究中心集團的支持下,由此產生的法學專家學位預計將於明年發布。與 GPT-4 和其他專有模型不同,它將與其他開源法學專家一起向所有用戶提供其代碼。據參與該項目的坂口介紹,團隊希望給它至少300億個參數,這些參數是影響其輸出的值,可以作為衡量其規模的尺度。

然而,富嶽法學專家可能會被一個更大的法學專家繼任。日本文部科學省正在資助創建一個適應科學需求的日本人工智能項目,該項目將通過學習已發表的研究成果來生成科學假設,從而加快確定調查目標的速度。該模型一開始可以有 1000 億個參數,這只是 GPT-3 大小的一半多一點,並且會隨著時間的推移而擴展。

「我們希望大幅加快科學研究週期並擴大搜索空間,」理化學研究所生物系統動力學研究中心副主任 Makoto Taiji 談到該項目時說道。LLM 的開發成本至少為 300 億日元(2.04 億美元),預計將於 2031 年公開發布。

投資200 億日元用日語文本訓練的AI

其他日本公司已經或計劃將自己的法學專家技術商業化。超級計算機製造商 NEC 從 5 月份開始使用其基於日語的生成式人工智能,並聲稱其將創建內部報告所需的時間減少了 50%,將內部軟件源代碼所需的時間減少了 80%。7月,該公司開始為客戶提供可定制的生成式人工智能服務。

NEC 數據科學實驗室的高級首席研究員 Masafumi Oyamada 表示,它可以「用於廣泛的行業,例如金融、運輸和物流、分銷和製造」。他補充說,研究人員可以將其用於編寫代碼、幫助撰寫和編輯論文以及調查現有已發表的論文等任務。

與此同時,日本電信公司軟銀正在投資約 200 億日元用於基於日語文本訓練的生成人工智能,併計劃明年推出自己的法學專家。軟銀擁有 4000 萬客戶,並與 OpenAI 投資者微軟建立了合作夥伴關係,該公司表示,其目標是幫助企業實現業務數字化並提高生產力。軟銀預計其法學專家課程將被大學、研究機構和其他組織使用。

對國際聯合研究產生積極影響

與此同時,日本研究人員希望精確、有效、日本製造的人工智能聊天機器人能夠幫助加速科學發展並縮小日本與世界其他國家之間的差距。

日本慶應義塾大學醫學院醫療技術研究員 Shotaro Kinoshita 表示:「如果日語版的 ChatGPT 能夠做到準確,預計將為想要學習日語或進行日本研究的人們帶來更好的結果。」東京。「因此,可能會對國際聯合研究產生積極影響。」

本文僅代表作者立場,不代表本平台立場

分享文章

Facebook Comments 文章留言

特別報導
特別報導
銳傳媒資料中心

專欄

推薦閱讀