版權歸原作者所有,如有侵權,請聯(lián)系我們

風口浪尖上的NLP,究竟路在何方?

北京智譜人工智能科普基地
發(fā)揚科學思辨精神,打造全國人工智能科普基地。
收藏

2020年5月,1750 億參數(shù)級別的萬能語言模型GPT-3誕生,一躍成為AI界的流量巨星。有人高呼“通用人工智能”的破冰而出,也有人質疑這不過是一場嚴重依賴數(shù)據和算力資源的氪金游戲。

人類語言錯綜復雜,機器以假亂真的“模仿游戲”絕非易事。作為人工智能皇冠上的耀眼明珠,自然語言處理會成為黃金時代的寵兒,還是誤入歧途的悲情英雄?學術界與產業(yè)界的革故鼎新,又路在何方?

2020年中國科技峰會系列活動青年科學家沙龍上,第20期AI Time圓桌會議邀請了百度人工智能技術委員會主席何中軍、清華大學計算機系副教授劉知遠、北京彩智科技有限公司CEO徐劍軍、中國科學院計算所研究員蘭艷艷,由北京交通大學副教授萬懷宇和AI Time負責人何蕓主持,共話自然語言處理的研究瓶頸與未來曙光!

1. 算法的瓶頸與突破

機器:“無知”的文盲

過去大家經常聽到一個段子:在翻譯外文著作中把把中國的哲學家Mencius(孟子)錯譯為門修斯,這是由于缺乏相關背景知識造成的。作為領域專家尚且會犯這種錯誤,可見融合知識對于人類而言也是非常具有挑戰(zhàn)性的。而不懂運用知識和常識,機器很多時候只是在一本正經地胡言亂語。

即便是目前臨近數(shù)據驅動和計算的極限狀態(tài)的GPT-3,也會在執(zhí)行文本生成任務時答非所問,連基本的常識和簡單的邏輯推理都不過關。非常典型的例子就是:

How many eyes does my foot have?

我的腳有多少只眼睛?

Your foot has two eyes.

你的腳有兩只眼睛。

因此,單純基于現(xiàn)有數(shù)學模型計算的方式,對理解自然語言的語義仍有著極大的局限性。打破語義解析和建模的瓶頸,結合知識和常識是一個非常關鍵的方向。

知識和常識如何定義和獲???

常識是難以界定的、寬泛抽象的東西。從統(tǒng)計時代到深度學習,機器從數(shù)據中捕捉和學習共現(xiàn)規(guī)律。然而,人類很多常識并不以明確可見的數(shù)據形式存在,即便搜刮互聯(lián)網的邊邊角角,也很難挖掘到這樣的數(shù)據。機器能否學到常識?如何描述、存儲和積累常識?這條路是否行得通,語言理解真的需要跨越常識這座大山么?

最近知識圖譜在NLP中的融合取得了巨大進展,然而現(xiàn)在很多知識圖譜是利用手工自建的方式,能否自動構建大規(guī)模知識,仍待攻克。

跨模態(tài)的自然語言理解

實現(xiàn)從感知到認知、從NLP到NLU,蘭艷艷強調也可以引入多模態(tài)。語用學證明,語言的真正含義不一定在字面意義上體現(xiàn),需要結合特殊場景挖掘其隱含意圖。例如小朋友們微信聊天:

問:你要玩游戲嗎?

答:我媽媽在家。

很多時候,融入視覺聽覺、活動歷程、主體與環(huán)境的交互等多模態(tài)信息,才能達到更準確的語言理解。要捕捉弦外之音,需利用外部知識的支持。

“舉一反三”的抽象學習

目前人工智能數(shù)據驅動的方法,更多是舉十反一:學習“十”分數(shù)據、達到“一點”泛化的能力。反觀人類,則擁有舉一反三的智慧。人的大腦是有可塑性和變通性的,能利用極少的數(shù)據學到知識并擴展運用到其他領域。

因此,盡管GPT-3能夠激活現(xiàn)實世界中極大規(guī)模的無監(jiān)督數(shù)據,但絕非終點。在利用現(xiàn)實世界數(shù)據的基礎上,我們還需要突破當前深度學習中數(shù)學建模、函數(shù)學習的研究范式,嘗試構建世界認知模型,讓機器具備抽象學習的能力。

術業(yè)有專攻:小而精的行業(yè)數(shù)據

目前,大規(guī)模預訓練模型在很多NLP任務上拔高了層次。但術業(yè)有專攻,拿體量巨大的通用模型GPT-3應用到極小的細分領域,仍是行不通的,并且無異于大炮打蚊子?;蛟S在某些特定任務上收集更高質量數(shù)據并融入知識進行訓練,能夠更精準高效地解決問題。

之前我們青睞大數(shù)據,其實比起依賴數(shù)據擴充,一個很有意思的研究方向是知識遷移,譬如小樣本( few-shot )甚至零樣本學習( one-shot learning )。

2. 人才培養(yǎng)與產業(yè)落地

頂天立地:產學研的結合

在何中軍看來,百度一貫追求“頂天立地”的理念,一方面腳踏實地做基礎研究,另一方面立足于用戶和產業(yè)的需求。這也是一種軟硬實力的結合,將學校的基礎知識和工程能力快速應用到產品、服務和不同場景中去。

從學術角度,研究者應當破除深度學習的假象,不滿足于跑跑模型達到效果就萬事大吉的走捷徑心態(tài),而是深入探究底層原理。從產業(yè)角度,尤其需要知其所以然、懂得算法原理,同時又能深入到場景和具體領域、掌握其數(shù)據資源和知識結構的關鍵人才,然而這種人才無法通過傳統(tǒng)的學校教育方式培養(yǎng)。在產業(yè)鏈中,我們會被各種持續(xù)不斷的問題困擾,現(xiàn)階段技術遠遠難以滿足用戶的終極需求。

學術界和產業(yè)界應當形成一個互動互惠的生態(tài)圈。學術圈不應過分崇尚論文為王的競爭法則,學術成果固然重要,但創(chuàng)造社會價值、解決實際問題才是根本目的。同時,技術產業(yè)應用也受限于科學問題的變革與突破,因此急需沉心靜氣的基礎研究者。徐劍軍坦言,背負盈利壓力、講求快速增長迭代的企業(yè),要面向一個NLP產業(yè)問題持續(xù)數(shù)十年踏踏實實埋頭耕耘,會面臨業(yè)界過高的期望值、人才受到太多誘惑等外界干擾。

針對高校研究與工業(yè)脫節(jié)的現(xiàn)象,如何各取所長、攜手并進,劉知遠指出,我們需要探索出一種新型的人才培養(yǎng)與科研模式,例如業(yè)界對學術界的算力支援、提供類似維基百科這樣開放共建的公益平臺等。對知識產權的尊重與保護、避免創(chuàng)新思想被大公司竊取侵吞也是亟待解決的問題。

NLP為何難出獨角獸?

計算機視覺領域有以包括商湯、曠視在內的“CV 四小龍”為首的獨角獸公司。然而,盡管NLP研究近年來突飛猛進、甚至在ACL 2020中投稿數(shù)量高達3429篇,該領域卻似乎難以涌現(xiàn)出獨角獸。

這或許是因為一方面,單純人臉識別或者安防系統(tǒng),就可以構成很大的場景,成就一家專門的公司。然而NLP中的文本分析等任務,似乎還局限于小范圍場景。另一方面,產業(yè)落地受到技術限制,例如智能音箱仍無法做到真正的語言理解,機器同傳也出現(xiàn)層出不窮的錯誤。NLP本身的復雜性,決定了它離產業(yè)爆發(fā)還有一定距離。

另外,NLP的落地在于與不同場景融合,尤其是法律、醫(yī)療等以語言或文本為重要載體和工具的領域。隨著技術進步,在智能個人信息助理、智能問答方面,NLP技術或許會徹底改變搜索引擎這種獲取信息的方式,針對你提出的問題實現(xiàn)音視頻結合的精準回答,逐漸成為日?;A設施!

3. 人與機器,路在何方?

深度學習時代,自然語言處理似乎勝利在望,卻又迷霧茫茫。從知識融合到認知推理甚至情感表達,實現(xiàn)可解釋的、去偽存真的語言理解,依舊道阻且長。

可以預見,未來必定是人機共存的世界。機器消費著人類積累的信息,同時產出信息,從新聞、網聊到小說無處不在。計算機會通過信息間接控制人類社會嗎?人的主體地位在哪里?如今出行都離不開導航的我們,未來又會對機器產生怎樣的依賴?

盡管現(xiàn)在的語言智能時常懵懂如孩童,然而在保險、銀行、證券或政府部門等具體行業(yè),通過實現(xiàn)自然語言的輸入輸出、培養(yǎng)出一個堪比三十歲人類的智能職員,是大有可為的。非創(chuàng)造性、機械重復的勞動,終將被取代!

在知識的記憶和提取上,AI或許會超越人類。曾經勤學苦練數(shù)年才掌握一門外語的你,或許已經面對機器翻譯的出色表現(xiàn)啞口無言。未來教育中,“知識就是力量”還會是至理名言嗎?怎樣的知識才值得人類去學習與創(chuàng)造呢?

主持人最后的話讓人一愣:所以學就應該學人工智能是嗎?

評論
中氣旋
少師級
科學
2024-12-16
????
貢士級
2023-11-07