ChatGPT-4在創(chuàng)造力測試中表現(xiàn)不俗

2024-03-04 08:29 來源：環(huán)球網(wǎng) 閱讀數(shù)：2086

科技日報(bào)北京3月3日電（記者劉霞）美國阿肯色大學(xué)科學(xué)家開展了一項(xiàng)最新研究，讓151名人類參與者與人工智能（AI）工具ChatGPT-4在3項(xiàng)測試中進(jìn)行對決，以評估二者的發(fā)散思維。結(jié)果顯示，AI的表現(xiàn)優(yōu)于人類。相關(guān)論文發(fā)表于最新一期《科學(xué)報(bào)告》雜志。

發(fā)散思維是創(chuàng)造性思維的衡量指標(biāo)，其特點(diǎn)是能對沒有預(yù)期解決方案的問題提出獨(dú)特的答案。在最新研究中，GPT-4提供了比人類參與者更新穎、更精細(xì)的答案。

最新研究使用的3項(xiàng)測試分別是“替代用途任務(wù)”“結(jié)果任務(wù)”及“發(fā)散聯(lián)想任務(wù)”?！疤娲猛救蝿?wù)”要求參與者針對繩索或叉子等日常物品，提出創(chuàng)造性用途；“結(jié)果任務(wù)”要求參與者想象假設(shè)情況的可能結(jié)果，如人類不再需要睡眠會怎么辦；“發(fā)散聯(lián)想任務(wù)”則要求參與者提供10個(gè)語義上盡可能遙遠(yuǎn)的名詞?！肮贰焙汀柏垺敝g的語義距離不大，而“貓”和“本體論”等詞之間的語義距離很大。

研究團(tuán)隊(duì)對人類和AI工具回答問題的數(shù)量、長度和單詞間的語義差異進(jìn)行了評估。結(jié)果發(fā)現(xiàn)，在每一項(xiàng)發(fā)散性思維任務(wù)上，GPT-4提供的答案都比人類提供的答案更具獨(dú)創(chuàng)性，且更精確。換言之，在一整套發(fā)散性思維任務(wù)中，GPT-4都表現(xiàn)出了更高的創(chuàng)造力。

研究負(fù)責(zé)人之一、阿肯色大學(xué)心理學(xué)博士生肯特·休伯特表示，最新研究也有一些需要注意的地方，如研究中使用的指標(biāo)都是對創(chuàng)造潛力的衡量，但參與創(chuàng)造性活動或獲得成就是衡量創(chuàng)造能力的另一個(gè)方面。此外，AI依賴人類用戶的幫助，除非得到提示，否則AI的創(chuàng)造力一直處于停滯狀態(tài)。

盡管如此，研究團(tuán)隊(duì)強(qiáng)調(diào)，大型語言模型正在迅速發(fā)展，并以前所未有的方式超越人類。它們能否取代人類的創(chuàng)造力還有待觀察。但不管怎樣，讓AI作為靈感工具，為人類的創(chuàng)造性活動提供幫助已是指日可待。

上一篇：恒星周圍水蒸氣重量首次算出下一篇：上過太空，它們有了“超能力”

欄目推薦

国产免费一级精品视频|久久久久亚洲日日精品|虎白女粉嫩在线播放网站|国产亚洲精aa在线观看|国产在线欧美一区二区三区|国产免费av片无码免费看|一夲道无码人妻精品一区二区|人妻少妇精品无码一区二区三已

ChatGPT-4在創(chuàng)造力測試中表現(xiàn)不俗