科技巨頭 OpenAI 推出了一款名為「深度研究」的付費存取工具,該工具將數十或數百個網站的資訊綜合成一份長達數頁的引用報告。該工具與Google 12 月發布的類似工具類似,可充當個人助理,在幾十分鐘內完成相當於數小時的工作。尼古拉瓊斯Nicola Jones發表在最新一期權威期刊《自然》(Nature)的< OpenAI 的「深度研究」工具:對科學家有用嗎?>( OpenAI’s ‘deep research’ tool: is it useful for scientists?)說此模型產生的長達數頁的引用報告可能有助於產生文獻評論。(The model produces cited, pages-long reports that might be helpful for generating literature reviews.)
OpenAI深度研究工具引人注目
許多嘗試過的科學家都對其撰寫文獻綜述或全文評論論文甚至發現知識差距的能力印象深刻。其他人就沒有那麼熱情了。加州莫菲特菲爾德灣區環境研究所的數據科學家凱爾·卡巴薩雷斯 (Kyle Kabasares) 在一段在線視頻評論中說道:“如果是人類做這件事,我會想:這需要大量的工作。”
這些公司推出這些工具是朝著能夠處理複雜任務的人工智慧「代理」邁出的一步。觀察家表示,OpenAI 於 2 月 2 日發布的深度研究工具之所以引人注目,是因為它將o3 大型語言模型(LLM) 改進的推理能力與網路搜尋能力結合在一起。谷歌表示,其深度研究工具目前基於 Gemini 1.5 Pro,而不是基於其領先的推理模型 2.0 Flash Thinking。
可以用來更新人類撰寫的評論
這兩種工具都給許多用戶留下了深刻的印象。加州舊金山新創公司 FutureHouse 的化學家兼人工智慧專家安德魯懷特 (Andrew White) 表示,谷歌的產品“真正利用了谷歌在搜尋和計算方面的優勢”,讓用戶快速了解某個主題,而 o3 的推理技能則為 OpenAI 的報告增添了複雜性。
康乃狄克州法明頓傑克遜實驗室的免疫學家 Derya Unutmaz 可以免費使用 OpenAI 授予的 ChatGPT Pro 進行醫學研究。 “我認為寫評論已經過時了。”
懷特預計,像這樣的人工智慧系統可以用來更新人類撰寫的評論。 “權威評論不可能每六個月由人類更新一次。”
OpenAI承認「尚處於早期階段且存在局限性」
但許多人警告說,所有基於 LLM 的工具有時都是不準確或誤導的。 OpenAI 網站承認,其工具「尚處於早期階段且存在局限性」:它可能會引用錯誤、產生幻覺、無法區分權威訊息和謠言,也無法準確傳達其不確定性。該公司希望隨著使用時間的增加和使用量的增加,這些問題將會得到改善。 Google 的深度研究有一個免責聲明,上面簡單地寫著「Gemini 可能會犯錯,因此請仔細檢查」。
本文僅代表作者立場,不代表本平台立場
Facebook Comments 文章留言