版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

向“傳統(tǒng)”抗衡:AI來了,將改寫搜索邊界?

利維坦
原創(chuàng)
亂七八糟,什么都有,微博:利維坦行星。
收藏

原文題:《真相時刻:維基百科會不會在協(xié)助AI不斷完善的過程中自取滅亡?》

圖片

? Tech Crunch

利維坦按:

目前我使用的還是ChatGPT 3.5版本,和本文開頭的維基編輯一樣,我發(fā)現(xiàn)ChatGPT經(jīng)常滿嘴胡說……它不僅經(jīng)常煞有介事地捏造一些子虛烏有的事實,當(dāng)你指出它的錯誤后,它還會瞬間改變自己的回答,盡管再次的回答往往還是錯誤的。

這對于一個編輯來說無疑是很不爽的體驗——這時候維基百科就顯示出了它與人工智能的不同,盡管在反復(fù)的編輯中某些詞條自然存在部分爭議,但依照“N.P.V.O”的原則,關(guān)于事實陳述部分要比ChatGPT靠譜很多了。

圖片

2021年初,當(dāng)一位維基百科(Wikipedia)的編輯首次試用ChatGPT 3時,他發(fā)現(xiàn)這個語言模型錯誤百出——它會隨意編造事實,胡亂引用文章。但同時,他也意識到了這個工具的巨大潛能,并深信在不久的將來,它將取代他深愛的維基百科。這位編輯為此寫下了一篇名為《維基百科之死》(Death of Wikipedia)的文章。

圖片

? Mashable

如今兩年的時間過去了,ChatGPT已經(jīng)更新到了版本4;維基百科也在今年1月度過了自己22周歲的生日,那么,二者目前究竟存在一種怎樣的關(guān)系呢?

新聞記者、作家喬恩·格特納(Jon Gernter)深入探討了這個問題,并在《紐約時報》上發(fā)表文章: 《真相時刻:維基百科會不會在協(xié)助智能聊天機器人不斷完善的過程中自取滅亡?》(Moment of Truth:Can Wikipedia help tech A.I. chatbots to get their facts right—without destroying itself in the process?)

回顧維基百科的歷史,我們仿佛回到了網(wǎng)絡(luò)的黃金年代:那時候,每個人,只要能聯(lián)網(wǎng),就能免費學(xué)習(xí)和分享所有人類的知識。

現(xiàn)如今,維基百科上的文章總數(shù)已經(jīng)超過了6100萬篇,由334種不同的語言書寫。它長期在訪問量最大的網(wǎng)站排行中榜上有名,并且,與同樣上榜的Google、Youtube與Facebook不同,維基百科始終拒絕任何廣告,只通過接受捐贈獲取資金。

此外,它所有的貢獻者都不收任何報酬——而這個群體保證了每分鐘345次的編輯量。

圖片

? Wikipedia

如今的維基百科早已不僅僅是電子版的百科全書,而成為了將整個數(shù)字世界粘合在一起的知識網(wǎng),為人們提供了一個可靠的信息來源。我們從Google/Bing/Alexa/Siri上搜索、了解到的知識大部分都來自維基百科,油管也使用維基百科來打擊謠言。

而智能聊天機器人當(dāng)然也不例外,在其接受訓(xùn)練的過程中,維基百科起到了至關(guān)重要、甚至可能是最關(guān)鍵的作用。

西門菲莎大學(xué)(Simon Fraser University)的研究員尼古拉斯·文森特(Nicholas Vincent)認為,沒有維基百科就不可能有強人工智能,但他也認為,ChatGPT一類大語言模型的流行可能會導(dǎo)致維基百科的消亡。

在今年3月召開的一次大會上,人們探討了人工智能對維基百科帶來的威脅。編輯們的心情是喜憂參半的:他們既認為人工智能可以協(xié)助維基百科快速發(fā)展,又擔(dān)心人們會越來越傾向于選擇ChatGPT而不是維基百科來回答問題——比起維基有點兒古板生硬的詞條,ChatGPT的回答顯然更通俗易懂、自然流暢。

基于大會探討的結(jié)果,一個共識性的呼吁是:“我們希望身處于一個全部知識是由人類生產(chǎn)和建構(gòu)的世界?!?strong>但現(xiàn)在,是不是已經(jīng)有點太遲了呢?

其實,早在2017年,維基媒體基金會的社群及其志愿者就在探討如何進一步發(fā)展,在2030年實現(xiàn)永久性保存、分享世界知識。彼時,他們就注意到了人工智能的出現(xiàn)是如何改變知識的收集、組合和整合方式的。

維基百科在發(fā)展過程中遇到的挑戰(zhàn)

除開維基百科,如今的大語言模型還廣泛吸收來自Google patent database(谷歌專利數(shù)據(jù)庫)、政府文件、Reddit上的問答、線上圖書館以及海量的線上新聞的作為信息來源;不過,西雅圖艾倫人工智能研究所(Allen Istitute for AI)的計算機科學(xué)家杰西·道奇(Jesse Dodge)認為,維基百科的貢獻是無以倫比的,這不僅是因為它在用于培訓(xùn)大語言模型的數(shù)據(jù)總量中占到了3%-5%,更因為它是最大的、最經(jīng)過精心篩選的數(shù)據(jù)庫之一。

圖片

? Erik Carter

如今,維基百科的編輯們就AI與維基百科關(guān)系的熱烈討論,有點兒類似10年之前,他們就谷歌和維基百科之間關(guān)系的探討,那時候的結(jié)論是,谷歌和維基百科互惠互利,和諧共生:維基百科使得谷歌成為了更好的搜索引擎,而維基百科也從谷歌那里獲得了大量的流量。

當(dāng)然,與谷歌及其他搜素引擎保持緊密關(guān)系,也給維基百科帶來了一些存在危機:要是問谷歌,俄烏戰(zhàn)爭是怎么一回事?它會引用并簡要總結(jié)來自維基百科的文章內(nèi)容,而讀者往往更喜歡谷歌的答案,而不會去順藤摸瓜閱讀背后超過一萬字并帶有400個腳注的維基文章。

進一步,這會導(dǎo)致普通人過于簡化理解我們的世界,也會影響維基百科招募到年輕一代的內(nèi)容貢獻者。

2017年的一項研究表明[1],人們對維基百科的訪問量確實在下降。而且,智能聊天機器人的出現(xiàn)更是加速了這一進程。

維基媒體基金會機器學(xué)習(xí)研究小組的帶頭人阿隆·哈爾法克(Aaron Halfaker)表示,搜索引擎在提供簡要答案的同時至少還會貼出來源鏈接,幫助人們回到維基百科的頁面;而大語言模型只會把信息整合成流暢的語言,沒有引用、沒有依據(jù),人們無從知曉答案的來源。這使得人工智能成為維基百科更難纏的對手——它可能更有害,而且很難與之競爭。

維基百科自身的缺陷及解決措施

當(dāng)然,維基百科遠不是盡善盡美的:首先,在4萬名活躍的英語編輯中,有80%是男性,75%是美國白人男性,這導(dǎo)致維基百科在性別和種族方面的內(nèi)容存在一些偏差。

其次,維基百科的文章可信度也不是穩(wěn)定不變的:佐治亞理工學(xué)院(Georgia Institute of Technology)的教授艾米·布魯克曼(Amy Bruckman)認為,在維基百科上,一篇經(jīng)過上千人編輯的長文質(zhì)量相當(dāng)有保證,而一些短文卻很可能出錯甚至完全是垃圾。

圖片

? Wikipedia

這使得編輯需要曠日持久地與謬誤作戰(zhàn):其中有經(jīng)驗的會出手編輯包含一些缺乏事實依據(jù)或無法驗證真假的文章;此外,在編輯守則中,內(nèi)容編輯也被要求保持“N.P.V.O”——即“Neutral Point of View”(觀點中立)。

人工智能工具的問題及解決方案

與之相對,對于智能聊天機器人來說,追尋真理之路甚至更為艱險[2]:就像ChatGPT會隨意編造事實,胡亂引用不存在的文獻(術(shù)語叫“hallucination”虛假信息);會過度簡化一個復(fù)雜事實,例如分析俄烏戰(zhàn)爭;也會亂給醫(yī)學(xué)建議……

今年4月,斯坦福的科學(xué)家檢驗了4種內(nèi)置AI工具的搜索引擎:Bing Chat,NeevaAI,perplexity AI和YouAI,發(fā)現(xiàn)它們生成的答案只有差不多一半能經(jīng)得起事實的檢驗[3]。

圖片? MobileSyrup

這是為什么呢?原因很簡單:聊天機器人的目標(biāo)不是追求絕對的真理或準(zhǔn)確性,而是盡量根據(jù)給定的上下文和概率來產(chǎn)生合理的回答[4]。這種選擇可能基于統(tǒng)計數(shù)據(jù)和語言模型,因此不是百分之百準(zhǔn)確的。

難道答案的準(zhǔn)確性不應(yīng)該是研發(fā)、培訓(xùn)智能聊天機器人的公司首要追求的目標(biāo)嗎?對于公眾來說,這幾乎是個毋庸置疑的問題。然而,據(jù)計算機科學(xué)家、前谷歌研究員瑪格麗特·米切爾(Margaret Mitchell)爆料,在目前商業(yè)競爭白熱化的階段,比起真實可靠,公司更在意盡快向公眾推出旗下的AI產(chǎn)品。(順帶說一句,米切爾正是因為批評谷歌在這個領(lǐng)域研發(fā)方向的問題而被解雇的。)

不過,米切爾也相信前景是光明的,她已經(jīng)看到使用優(yōu)質(zhì)信息接受訓(xùn)練的模型在提高準(zhǔn)確性方面顯著的提升。只是,目前AI產(chǎn)品的數(shù)據(jù)訓(xùn)練方法是“放任自流”式,即不管好的壞的就把盡可能多的信息喂給模型,設(shè)想是輸入的信息越多,輸出的信息質(zhì)量就越高;而不是反過來——全部輸入優(yōu)質(zhì)信息,得出優(yōu)質(zhì)信息。

此外,市場競爭也有助于智能聊天機器人的自我完善,例如,OpenAI與許多商業(yè)公司都有合作關(guān)系,這些公司非常注重答案的準(zhǔn)確性。另外,谷歌公司研發(fā)的人工智能系統(tǒng)與醫(yī)學(xué)界的專家保持了緊密合作,進行疾病診療方面的探索。

圖片

? The Cymes

相較以前的版本,ChatGPT 4在提供涉及“事實內(nèi)容”的回答時已經(jīng)有了顯著進步,不過,離它能準(zhǔn)確地回答復(fù)雜的、多層面的歷史問題,還有很長的路要走。對這樣的智能聊天機器人來說,準(zhǔn)確性與創(chuàng)造性、流暢性之間永遠存在著張力。而開發(fā)的目標(biāo),絕不僅僅是讓它們能“反芻”接收知識,而是需要看穿知識的模式,并用通俗易懂的語言告訴使用者。

目前二者的合作現(xiàn)狀

6月底,記者試用了維基媒體基金會為ChatGPT開發(fā)的插件。

ChatGPT4目前擁有的全部知識截止于它受訓(xùn)結(jié)束的時間:2021年9月;而這個插件可以讓它接觸到迄今為止的所有信息:這使得用戶可以同時享受到這兩種工具的帶來的便利:來自維基百科的知識具有準(zhǔn)確性和時效性,而智能聊天機器人能用流暢、自然的語言將其輸出。同時,ChatGPT也會列出信息來源——維基百科的頁面。

維基百科也在內(nèi)化一些人工智能模型,以更好地幫助新用戶,或協(xié)助編輯工作。但目前,維基的社群還是比較抵觸完全由人工智能編輯的文章;而編輯們也非常擔(dān)心,面對強大的無休無眠的對手,面對能瞬時生成海量內(nèi)容的人工智能,人類編輯在內(nèi)容審核方面付出的努力是否只是螳臂當(dāng)車,終會一敗涂地。

按照目前的情況來看——任何站到人工智對立面的舉動都是不理智的,一個很可能出現(xiàn)的場景是:像維基百科一類的組織必須努力適應(yīng)由人工智能創(chuàng)造的未來才可能得以存續(xù),而不是妄想對其施加影響甚至出手阻攔。

圖片

? Analytics Insight

當(dāng)然,許多接受采訪的學(xué)者和維基編輯也認為,人工智能治霸之路不會是摧枯拉朽的,它將面臨重重阻礙:

首先是社會性的:歐盟議會目前正著手制定一系列法律條文和規(guī)章制度,來規(guī)范對人工智能產(chǎn)品的使用:例如強制科技公司標(biāo)明由人工智能生成的內(nèi)容;公開人工智能受訓(xùn)的數(shù)據(jù);以及標(biāo)明信息來源,不可未經(jīng)授權(quán)盜用其他網(wǎng)站、數(shù)據(jù)庫資源等。

其次是技術(shù)上的。事實上,文章一開篇已經(jīng)強調(diào),如果沒有維基百科、Reddit社區(qū)提供的海量數(shù)據(jù),大語言模型根本無從接受訓(xùn)練,而人工智能的研發(fā)公司完全清楚這些數(shù)據(jù)庫的重要性,這就就給了維基百科等網(wǎng)站一些談判的籌碼。

此外,今年5月底,一些人工智能研究員還合作發(fā)表了一篇論文[5],探討新的人工智能系統(tǒng)是否能只靠人工智能模型生成的知識來發(fā)展自身,而完全不使用人類生成的數(shù)據(jù)庫接受訓(xùn)練。結(jié)果,研究者發(fā)現(xiàn)這會導(dǎo)致一種系統(tǒng)性崩潰——稱為“模型崩塌”(Model collapse):使用人工智能合成的數(shù)據(jù)可能會導(dǎo)致混亂,因為它們可能不準(zhǔn)確或不真實,進而會對下一代模型的訓(xùn)練數(shù)據(jù)集造成負面影響,使其對現(xiàn)實世界的認知產(chǎn)生偏差。

而維基百科的插件可以避免這一情況發(fā)生,但如果在未來,維基百科上充斥著由人工智能生成的文章,那么問題同樣會產(chǎn)生:新一代的語言模型會陷入自說自話循環(huán)論證的狀態(tài)。

最終,這項研究證明了,真人交互產(chǎn)生的數(shù)據(jù)的價值對未來大語言模型的發(fā)展不可估量,這對維基百科的編輯們來說是個振奮人心的消息。至少一段時間之內(nèi),人工智能還需要我們,需要我們?nèi)祟愖屗兊每尚哦杏谩?/strong>

不過,這又涉及到一個叫做“結(jié)盟”(alignment)的理論概念,即假設(shè)人工智能符合人類最大的利益。保證人工智能與人類站在同一邊,既是巨大的挑戰(zhàn),也是研發(fā)人工智能的首要任務(wù)。

而真人的好處是,人性使得人類天生就具備一些形成同盟的條件:例如一些人樂于分享高質(zhì)量的教育資源的動機,恰好符合另一些人的需求。作者最后采訪了一位維基百科的英文編輯杰德(Jade),她提到知識分享是自己的人生信條:她每周會固定花10-20個小時編輯維基百科。

目前,她致力于編輯一條關(guān)于美國內(nèi)戰(zhàn)的條目,其一年的閱讀量已經(jīng)超過了484萬次,她的目標(biāo)是繼續(xù)完善這篇文章,直到獲得維基百科“精選”的認證——這是一種極為珍惜的認證,在維基百科的英文版中,僅僅有0.1%的內(nèi)容有資格得到這項認可。

最后,記者問及杰德是否認為人工智能會完全取代她的工作,杰德回答,她是個樂觀主義者,相信至少在本世紀(jì)內(nèi),機器人不會完全替代人類來編輯維基百科。

然而記者本人就沒有這么確定了,畢竟,根據(jù)他自己與ChatGPT聊天的經(jīng)驗,盡管在在信息交換的準(zhǔn)確性和細節(jié)方面人工智能做得還不夠完善,但人機交互的體驗已經(jīng)足夠吸引他了,一切都是如此輕松。

(原文有刪改)

參考文獻:

[1]ojs.aaai.org/index.php/ICWSM/article/view/14883/14733

[2]www.nytimes.com/2023/05/01/business/ai-chatbots-hallucination.html

[3]arxiv.org/pdf/2304.09848.pdf

[4]www.nytimes.com/2022/04/15/magazine/ai-language.html

[5]arxiv.org/pdf/2305.17493.pdf

文/Jon Gertner

編譯/南瓜大王

校對/tim

原文/www.nytimes.com/2023/07/18/magazine/wikipedia-ai-chatgpt.html

本文基于創(chuàng)作共享協(xié)議(BY-NC),由Jon Gertner在利維坦發(fā)布

文章僅為作者觀點,未必代表利維坦立場

評論
高高雁
大學(xué)士級
維基百科的貢獻是無以倫比的,這不僅是因為它在用于培訓(xùn)大語言模型的數(shù)據(jù)總量中占到了3%-5%,更因為它是最大的、最經(jīng)過精心篩選的數(shù)據(jù)庫之一。
2023-11-13
傳承解惑
大學(xué)士級
真人交互產(chǎn)生的數(shù)據(jù)的價值,對未來大語言模型的發(fā)展不可估量,這對維基百科的編輯們來說是個振奮人心的消息。
2023-11-13
高高雁
大學(xué)士級
沒有維基百科就不可能有強人工智能。
2023-11-13