文化台灣民俗【洪存正專欄】在遊戲中研究...

【洪存正專欄】在遊戲中研究人類的行為

Date:

布里亞 龍、簡· 西姆森(Bria Long, Jan Simson)等人在《自然》(Nature)期刊上寫的<遊戲如何讓行為科學變得更好>(How games can make behavioural science better)說,「數百萬人在線玩 Wordle、Minecraft 和 Scrabble。遊戲化實驗可以使行為研究更具包容性、嚴謹性和可重複性——如果做得好的話。」(Wordle, Minecraft and Scrabble are played online by millions. Gamifying experiments can make behavioural research more inclusive, rigorous and reproducible — if it’s done right.)

文 / 洪存正 綜合報導

美國認知科學家 Joshua Hartshorne 在調查世界各地的人們如何學習英語時,需要讓數萬人參加語言測試。他設計了Which English?,一個語法遊戲,提出了一系列棘手的單詞問題,然後猜測玩家在世界上的哪個地方學會了這種語言。參與者在社交媒體上分享了他們的結果——無論準確與否——為招聘創造了滾雪球效應。該調查結果基於近 670,000 人的數據,揭示了第二語言學習的「關鍵時期」一直延續到青春期。

技術進步使遊戲化變得更便宜、更直接

這種「遊戲化」正在成為研究人類的各個領域的強大研究工具,包括心理學、神經科學、經濟學和行為經濟學。通過讓研究變得有趣,該方法可以幫助實驗接觸到成千上萬的參與者。例如,視頻遊戲中嵌入的實驗表明,兒童居住的城市佈局會影響他們未來的導航能力。來自數字單詞搜索的數據表明,精通遊戲的人不一定會給嘗試學習遊戲的人更好的建議。一場涉及數百萬人的兩難博弈表明,大多數人都有可靠的道德直覺。

遊戲化可以讓研究人員研究不同的人群,進行更複雜的實驗並觀察自然環境中的人類行為,從而有助於避免傳統實驗室實驗的陷阱。它可以提高統計能力和可重複性,使研究更加穩健。技術進步使遊戲化變得更便宜、更直接,而 COVID-19 大流行迫使許多實驗室將他們的人體實驗轉移到網上。但儘管發生了這些變化,大多數人還沒有接受遊戲化提供的機會。

遊戲激勵人們參與實驗

為了充分發揮這種方法的潛力,研究人員必須消除誤解,開發新的遊戲化技術,改善對現有技術的訪問,並將這些方法應用於富有成效的研究問題。我們是心理學、語言學、發展科學、數據科學和音樂方面的研究人員,他們進行了自己的遊戲化實驗。我們認為現在是科學認真對待遊戲的時候了。

遊戲化通過結合計分、競爭、績效反饋和通過遊戲了解自己的機會來激勵人們參與實驗。在 2005 年和 2008 年的早期嘗試中,現就職於馬薩諸塞州波士頓哈佛醫學院的認知神經心理學家 Laura Germine 調整了心理評估並將其放在她的公民科學網站TestMyBrain.org 上。她的工作表明,即使參與者沒有監督和無償,自選樣本也可以產生高質量的數據。隨著遊戲化的發展,它將發展心理學與計算機科學、網絡開發和用戶體驗研究結合起來,為參與者創造令人興奮、身臨其境的體驗。

遊戲化激勵人們通過競爭、樂趣和了解自己的機會參與實驗。以下是一些可以嘗試的遊戲:哪個英語?作為語言研究的一部分,一種病毒式語法測試試圖確定某人說的是哪種」世界英語」。你是超級傾聽者嗎?

流行遊戲 Wordle——世界上最大的心理語言學實驗

一項公民科學實驗,參與者嘗試在雜亂的音調中檢測音樂和聲。

Glyph:一個在線遊戲小程序,用於探索世界書寫系統中字母的形狀。

道德機器:一個平台,用於收集人類對機器智能做出的道德決策的看法。

視覺詞彙:對整個生命週期詞彙知識的在線評估。

遊戲化可以包括將實驗轉化為定制遊戲、將實驗嵌入現有遊戲以及從正在進行的遊戲中提取數據。流行遊戲 Wordle——從某種意義上說,是世界上最大的心理語言學實驗——已經激發了對主動學習中的優化問題和人們作弊的背景等主題的調查。

傳統的基於實驗室的人類行為研究的參與者通常數量很少而且很奇怪(即來自西方、受過教育、工業化、富裕和民主的社會)。這導致結果在統計上不精確或不可重現,或者無法推廣到其他組。

遊戲化實驗鼓勵兒童參與學校或博物館

遊戲化科學支持的海量數據集有助於解決有關可重複性和普遍性的問題。例如,小型研究表明,一個人使用有聲調的語言(使用音調或聲調來區分單詞的語言,如普通話)的經歷會改變他們感知音調的能力。然而,這些工作主要是用普通話或廣東話進行的。為了探索不太常研究的音調語言,Jingxuan Liu(現在是紐約市哥倫比亞大學的研究生)和我們中的一員 (SAM) 使用了來自流行的基於網絡的測驗「測試你的音樂智商」的數據,以在 50 萬講這些語言的人中複制這些發現,包括在西非使用的母羊語和在緬甸使用的緬甸語。

對於與難以接觸到的研究人群(如兒童)打交道的科學家來說,可重複性和普遍性問題尤為突出。遊戲化實驗有可能鼓勵兒童參與學校或博物館等環境,而不需要專程去實驗室,而只有一些家庭有時間或有興趣去做。例如,我們中的一個人 (BL) 安裝了「讓我們畫畫吧!」 加利福尼亞州聖何塞兒童探索博物館的售貨亭。參觀博物館的孩子們被要求畫出各種東西——比如手錶或老虎——然後玩遊戲試圖認出彼此的畫。在接下來的 18 個月裡,售貨亭從大約 8,000 名 2 至 10 歲的兒童那裡收集了 37,000 多幅畫作,.

減少行為科學研究的以英語為中心的本質

在實驗室玩的遊戲也可以提高數據的穩健性。AB-L. 和 DGW與賓夕法尼亞州維拉諾瓦大學的心理語言學家 Joe Toscano 合作,想要研究人們如何通過韻律交流——傳達重要信息的語調、停頓和節奏的模式,以及諷刺和幽默。參與者通常在實驗室中進行的生硬對話限制了這些聲學線索,並且之前關於韻律的結果不一致。我們在 Minecraft 遊戲中設計了謎題,玩家必須在專注於遊戲的同時通過交流來解決這些謎題。這產生了更自然的對話和更高質量的數據,表明參與者使用語音語調和持續時間來傳達微妙的信息,例如對話中是否有新詞。

與基於實驗室的研究相比,在線遊戲化實驗可以更容易、更便宜地招募不同的參與者,包括來自科學研究中代表性不足的群體的參與者。在去年發表的一項研究中,一項針對嬰兒的語音和歌曲的遊戲化實驗在美國招募了數百名自我認同為三個性別類別以及各種家庭收入和種族的人。更廣泛地說,翻譯一個遊戲化實驗並在全球互聯網上分發它可以幫助減少行為科學研究的以英語為中心的本質。

JavaScript是最常用的基本人體實驗工具

遊戲化的障礙正在消退。編寫在線運行的實驗過去需要實驗室維護和開發自定義代碼。但在過去幾年中,主流編程語言(如 JavaScript 和 Python)中的免費開源工具呈爆炸式增長。JavaScript 庫 jsPsych 13是Internet 上最常用的基本人體實驗工具之一,由紐約波基普西瓦薩學院的認知科學家 Josh de Leeuw 於 2012 年推出。根據谷歌學術搜索,它已被用於近 1,000 篇已發表的論文中。

jsPsych 工具為研究人員提供了一種向參與者展示刺激物(文本、圖像、音頻、視頻)的方法;詢問有關他們的問題;以各種方式收集回复(多項選擇、自由文本、點擊或點擊圖像);並以結構化格式輸出數據。最重要的是,de Leeuw 維護著一個活躍的用戶論壇和 GitHub 存儲庫,研究人員可以在其中討論問題並就其代碼庫進行協作。這個和類似的工具——例如 lab.js、Open Sesame 和 psychTestR——讓研究人員可以直接開始在線創建行為實驗。

使用簡單的工具並對遊戲化實驗的設計進行小的調整可以大大提高參與度並增加參與者的數量。

提供激勵。這可以是點數、分數或百分位排名

  • 利用前端工具。包括 jsPsych、psychTestR、lab.js 和 OpenSesame 在內的軟件提供了 Web 開發和遊戲化的入口點。用於數據收集的通用框架——例如顯示一系列圖像和測量按下按鈕所花費的時間——默認情況下可通過插件獲得。將基於實驗室的實驗遊戲化的研究人員只需要一台計算機和一個想法。
  • 考慮後端工具。更大規模的實驗需要能夠分發它們、處理數據收集和動態擴展的雲基礎設施,這樣如果您的實驗像病毒一樣傳播開來,整個事情就不會崩潰。可以使用可定制的選項,例如Pushkin,儘管它們目前需要比前端工具更多的技術專長。
  • 提供激勵。這可以是點數、分數或百分位排名,讓參與者看到他們做得有多好,或者了解一些關於他們自己的事情。對於長期或繁重的任務,向參與者支付合理的工資。
  • 保持簡短。盡量將在線遊戲時間限制在 10 分鐘以內。一些遊戲化實驗甚至更快。
  • 幫助它在社交媒體上滾雪球。讓參與者可以輕鬆地在社交媒體上分享他們的結果——尤其是作為圖像或圖表。這吸引了更多的參與者。
  • 使用鉤子。嘗試添加故事情節或其他形式的可見進度,以保持參與者的參與度。在一項關於聽覺感知的實驗中,參與者在完成聽力任務以幫助鳥類化身保持在高空時贏得積分。目前已有近20萬人參與。
  • 視覺效果很重要。花點力氣選擇免費圖形或付費設計視覺效果可以幫助吸引參與者。
  • 進行試點。在將您的實驗公開之前,請在朋友和合作者身上試用。他們將能夠告訴您哪些有效,哪些可以改進。
  • 計劃和測試。如果您的遊戲走紅,請確保您有一個數據管理計劃來處理大量湧入的數據(例如 MongoDB 或 Google Cloud Firestore)。
  • 協作和共享。使用遊戲化實驗室開發項目可以使每個人受益。如果您開發新功能,請將其添加到協作代碼庫中,就像 jsPsych 插件一樣。

遊戲化實驗有明顯的弱點

遊戲化實驗有明顯的弱點。許多科學家習慣於完全控制他們的實驗室環境:他們可以在實驗期間直接觀察參與者的行為,並檢查人們是否如他們所言。批評者可能擔心失去這種控制,或者可能擔心人們不會完全參與測試,或者會通過偽造身份、多次完成遊戲或使用 Internet 機器人惡意參與來扭曲結果。

這些批評可以部分平息。遊戲化研究有可能比基於實驗室的研究更好地吸引參與者,因為它們具有內在的激勵作用。事實上,許多心理學家已經觀察到各種脫離實驗室實驗的方式,例如參與者查看社交媒體,甚至小睡片刻,因為任務通常很無聊且報酬低。許多遊戲化實驗在 YouTube、Reddit 和其他社交媒體平台上風靡一時,這一事實證明了參與者可以深入參與研究的概念——也許比傳統方法更深入,儘管我們需要更多數據才能確定。

減輕對參與者可能是機器人的擔憂

實驗設計和數據分析的創造性方法也可以讓研究人員比預期更多地控制遊戲化科學。例如,在一項針對兒童的音樂研究中,新西蘭奧克蘭大學的認知科學家 Courtney Hilton 和他的同事(包括 SAM)研究了參與者玩遊戲的時間,並將當地時間的分佈與成人玩遊戲的時間進行了比較。參與者不太可能在晚上玩耍,這意味著他們確實是孩子,他們在那個時候更有可能睡著。通過將招募高峰的時間與已知事件(例如推廣遊戲的社交媒體帖子)進行比較,以及通過使用旨在讓參與者輕鬆識別的操縱檢查,可以減輕對參與者可能是機器人的擔憂。答案,但對騙子或機器人來說很難。然而,最終,一些研究問題更適合實驗室。基於網絡的遊戲化科學中使用的控制較少的環境可以而且應該補充實驗室工作的環境。

低收入更可能使用智能手機

另一個有道理的批評是,遊戲化的科學在網上傳播時,將那些缺乏智能手機、電腦和互聯網接入的人排除在外。但它仍然提供了對現狀的改進。資源貧乏的社區已經面臨被排除在實驗室實驗之外的風險,因為實驗室集中在少數地方,參與者必須花時間和金錢去參觀。相比之下,智能手機在全球範圍內變得無處不在。根據華盛頓特區皮尤研究中心 2021 年的一項調查,在美國,家庭年收入低於 30,000 美元的成年人中有四分之三擁有智能手機. 與台式電腦相比,低收入社區的人們更可能使用智能手機連接互聯網這一事實意味著,研究人員優先開發適合移動設備的實驗,以便在互聯網連接緩慢或時斷時續工作。

解決版權、隱私、數據存儲和數據問題

遊戲化實驗,尤其是大型在線實驗,還必須解決有關版權、隱私、數據存儲和數據可訪問性的問題。數據保護和隱私法因國家/地區而異,一些研究收集的信息(例如有關性別或收入的信息)屬於受保護類別。為了保護隱私並避免法律問題,研究人員可以避免收集與個人相關的數據,例如 IP 地址或其他身份信息。

如果數據是由第三方公司在現有遊戲中收集的,則該信息可能是專有的。研究和避免利益衝突需要數據使用協議。許多大學都有法律和道德團隊,可以就遊戲化實驗提供建議,就像他們為實驗室實驗所做的那樣。例如,在對涉及已出版音樂唱片的實驗進行遊戲化時,我們中的一員 (SAM) 從哈佛律師那裡獲得了有關美國版權法的有用指導。

使遊戲化發揮全部潛力四個步驟

為使遊戲化發揮其全部潛力,需要執行四個步驟。首先,已經在社區中的研究人員需要協調他們的開發活動,以擴大對技術的獲取並分享技術技能。實驗室應該公開他們的軟件,這樣一開始的科學家就不需要重新發明輪子。儘管開放科學實踐正變得越來越普遍,但由於 GitHub、Zenodo 和開放科學框架等平台,它們尚未普及。社區將受益於集中資源創建集中式工具和技術開發最佳實踐,以及舉辦旨在增加遊戲化和公民科學專業知識的機會的會議和研討會。

其次,應改進現有工具。許多研究人員使用 Qualtrics 或 SurveyMonkey 等商業軟件進行在線調查,但沒有免費的類似軟件可用於遊戲化實驗。jsPsych 等前端工具通常尚未針對移動友好型實驗進行優化。沒有大量技術專長的科學家也可以使用的後端工具並不常見——但這些工具將啟動科學家進行大規模遊戲化實驗的能力,這仍然相對罕見。科學界應該努力開發這些資源,世界各地的資助者應該優先支持這些努力。美國國家科學基金會已經呼籲數字基礎設施項目作為推進可重複性努力的一部分。

第三,科學家需要尋求研究以外的職業來拓寬他們的技術工具包。產生大量數據的遊戲化實驗可以受益於技術行業標準軟件和實踐的使用,但在科學中仍未得到充分利用。這些包括使用 Git(一種系統地跟踪不同版本代碼的方法)的版本控制和將數據存儲在關係數據庫中(例如使用 SQL 的數據庫管理語言,一種在科技公司中普遍存在的數據庫管理語言)。研究實驗室應考慮諮詢或招募藝術家、平面設計師、教育工作者和其他來自不同領域的人,他們可以通過改進遊戲設計來提高實驗的穩健性。僱用或簽約專門的軟件開發人員可確保在研究生和博士後離開實驗室團隊時不會失去技術技能。資助者應該支持這些重要職位。

在互聯網上收集數據是強大而常規的

最後,社區需要改進消除對遊戲化的不準確印象的方式,遊戲化從本質上講可能聽起來像是一種消遣,而不是一種嚴肅的研究工具。我們認為最好的方法是通過科學本身。如果遊戲化研究繼續推動實質性科學發現,那麼結果將不言自明。科學家應該嘗試對他們最有創意、最緊迫和最激動人心的研究問題進行遊戲化。

社區有責任確保這些實驗可信且有價值。研究人員可以通過設計吸引公眾深入參與的研究、使用強大的數據管理實踐、採用證明遊戲化數據有效性的分析策略以及共享數據供同事審查來實現這一目標。編輯和審稿人可以通過鼓勵發表高質量的實驗來支持這些努力。

1986 年,社會學家 Lee Sproull 建議研究人員考慮「一種新的數據收集工具——電子郵件」。在她從事可能是最早的基於網絡的研究幾十年後,在互聯網上收集數據是強大而常規的。遊戲化科學尚未得到如此廣泛的接受,但我們認為它可以、應該並且將會。

本文僅代表作者立場,不代表本平台立場

分享文章

Facebook Comments 文章留言

特別報導
特別報導
銳傳媒資料中心

專欄

推薦閱讀