国产免费一级精品视频|久久久久亚洲日日精品|虎白女粉嫩在线播放网站|国产亚洲精aa在线观看|国产在线欧美一区二区三区|国产免费av片无码免费看|一夲道无码人妻精品一区二区|人妻少妇精品无码一区二区三已

ChatGPT-4在創(chuàng)造力測試中表現(xiàn)不俗

2024-03-04 08:29 來源:環(huán)球網(wǎng) 閱讀數(shù):1515

科技日報北京3月3日電 (記者劉霞)美國阿肯色大學(xué)科學(xué)家開展了一項最新研究,讓151名人類參與者與人工智能(AI)工具ChatGPT-4在3項測試中進行對決,以評估二者的發(fā)散思維。結(jié)果顯示,AI的表現(xiàn)優(yōu)于人類。相關(guān)論文發(fā)表于最新一期《科學(xué)報告》雜志。

發(fā)散思維是創(chuàng)造性思維的衡量指標,其特點是能對沒有預(yù)期解決方案的問題提出獨特的答案。在最新研究中,GPT-4提供了比人類參與者更新穎、更精細的答案。

最新研究使用的3項測試分別是“替代用途任務(wù)”“結(jié)果任務(wù)”及“發(fā)散聯(lián)想任務(wù)”。“替代用途任務(wù)”要求參與者針對繩索或叉子等日常物品,提出創(chuàng)造性用途;“結(jié)果任務(wù)”要求參與者想象假設(shè)情況的可能結(jié)果,如人類不再需要睡眠會怎么辦;“發(fā)散聯(lián)想任務(wù)”則要求參與者提供10個語義上盡可能遙遠的名詞。“狗”和“貓”之間的語義距離不大,而“貓”和“本體論”等詞之間的語義距離很大。

研究團隊對人類和AI工具回答問題的數(shù)量、長度和單詞間的語義差異進行了評估。結(jié)果發(fā)現(xiàn),在每一項發(fā)散性思維任務(wù)上,GPT-4提供的答案都比人類提供的答案更具獨創(chuàng)性,且更精確。換言之,在一整套發(fā)散性思維任務(wù)中,GPT-4都表現(xiàn)出了更高的創(chuàng)造力。

研究負責(zé)人之一、阿肯色大學(xué)心理學(xué)博士生肯特·休伯特表示,最新研究也有一些需要注意的地方,如研究中使用的指標都是對創(chuàng)造潛力的衡量,但參與創(chuàng)造性活動或獲得成就是衡量創(chuàng)造能力的另一個方面。此外,AI依賴人類用戶的幫助,除非得到提示,否則AI的創(chuàng)造力一直處于停滯狀態(tài)。

盡管如此,研究團隊強調(diào),大型語言模型正在迅速發(fā)展,并以前所未有的方式超越人類。它們能否取代人類的創(chuàng)造力還有待觀察。但不管怎樣,讓AI作為靈感工具,為人類的創(chuàng)造性活動提供幫助已是指日可待。

0.072300s