8月29日至30日,由中國(guó)科學(xué)技術(shù)協(xié)會(huì)、中國(guó)科學(xué)院、南京市人民政府為指導(dǎo)單位,中國(guó)人工智能學(xué)會(huì)、南京市建鄴區(qū)人民政府、江蘇省科學(xué)技術(shù)協(xié)會(huì)主辦的主題為“智周萬(wàn)物”的2020年中國(guó)人工智能大會(huì)(CCAI 2020)在江蘇南京新加坡·南京生態(tài)科技島舉辦。在大會(huì)上,國(guó)務(wù)院參事、CAAI理事長(zhǎng)、中國(guó)工程院院士、清華大學(xué)信息學(xué)院院長(zhǎng)、教授、CAAI Fellow戴瓊海做了主題為《人工智能:算法·算力·交互》的特邀報(bào)告,從算力、算法與人機(jī)交互三方面展開(kāi)了分享。
戴瓊海
國(guó)務(wù)院參事、CAAI理事長(zhǎng)、中國(guó)工程院院士
清華大學(xué)信息學(xué)院院長(zhǎng)、教授、CAAI Fellow
以下是戴瓊海院士演講實(shí)錄:
人工智能是一個(gè)很交叉的學(xué)科,要關(guān)注的問(wèn)題很多。大家看,圖靈獎(jiǎng)獲得者有研究心理學(xué)的,有研究認(rèn)知的,有研究人工智能的,還有做數(shù)學(xué)的。我聚焦算法、算力和交互這三個(gè)方面和大家討論。算力就需要有力量。說(shuō)到力量,我們先回顧一下歷史。在人類(lèi)歷史上中,從原始、農(nóng)耕到工業(yè)和電氣革命,最重要的是要把人的力量,人對(duì)資源環(huán)境的認(rèn)識(shí),用以改造自然,帶來(lái)更好的生活和工作;我們把我們的力量交給了機(jī)械、交給了電力,蒸汽機(jī)的發(fā)明,包括電力方面的工作,那是我們力量的發(fā)揮。直到信息時(shí)代,也是有一種載體,希望在這上面把力量給機(jī)器也好,電力、電氣也好。
到信息時(shí)代就發(fā)生一些變化,很多人很幸運(yùn),在信息時(shí)代享受到了計(jì)算機(jī)、芯片、互聯(lián)網(wǎng)的力量。在這個(gè)時(shí)代里,實(shí)際上人工智能也在不斷地發(fā)展。在這個(gè)發(fā)展中最大的特點(diǎn)是,我們把大腦一部分的力量也交給了計(jì)算機(jī),比如一些解析和計(jì)算于是推動(dòng)了更多的自然科學(xué)和工程科學(xué)的發(fā)展。比如大家看原子能技術(shù)、空間科技、生物工程和基因技術(shù)都在發(fā)展,使得我們?nèi)烁诱J(rèn)識(shí)到自己。
現(xiàn)在往人工智能發(fā)展,這個(gè)時(shí)期正在這樣往前推進(jìn)。到人工智能時(shí)代以后,大家發(fā)現(xiàn)學(xué)科的概念好像更加模糊了,更加是一種交叉的概念在這里面討論。這個(gè)里面也有力量,剛才楊強(qiáng)老師說(shuō)的,機(jī)器學(xué)習(xí)模型,包括周志華老師也是在做機(jī)器學(xué)習(xí),包括我們的算法,這個(gè)時(shí)候我們想解析的問(wèn)題更多,想把更多大腦的思考和不可解析的問(wèn)題交給機(jī)器來(lái)做。這個(gè)時(shí)候我們才發(fā)現(xiàn)我們的腦力和機(jī)器的腦力是不一樣的,機(jī)器的腦力不夠,我們的腦力是夠的。但是在那些固定的算法上面,我們的腦力是不夠的,這個(gè)時(shí)候怎么辦呢?包括量子計(jì)算、納米科技、物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)、無(wú)人系統(tǒng),發(fā)現(xiàn)我們要交給機(jī)器的時(shí)候,機(jī)器的力量還有點(diǎn)不夠。因?yàn)槭裁茨??我們很多的模型算法也沒(méi)有達(dá)到它所需要的特點(diǎn),于是楊強(qiáng)老師發(fā)現(xiàn)用聯(lián)邦的學(xué)習(xí)方法、遷移學(xué)習(xí)的方法,把數(shù)據(jù)從大數(shù)據(jù)怎么摘一個(gè)小數(shù)據(jù)進(jìn)行工作,這個(gè)時(shí)候人工智能發(fā)展更需要機(jī)器學(xué)習(xí)模型,我們大腦交給機(jī)器的算法是什么,怎么樣提高它的算力,這是人工智能時(shí)代要考慮的問(wèn)題。
大家都知道,人工智能時(shí)代發(fā)展得非???,快在哪兒呢?大家可以看到現(xiàn)在是邏輯推理,推理的這個(gè)功能能不能交給機(jī)器來(lái)做?另外,視覺(jué),包括自然語(yǔ)言處理,大家看周?chē)膽?yīng)用非常多。比如說(shuō)機(jī)器人,有了機(jī)器人就存在人和機(jī)器人怎么去交互?機(jī)器人和環(huán)境怎么交互?又出現(xiàn)了很多的新的問(wèn)題需要我們?nèi)ヌ接憽?/p>
另外,比如自動(dòng)駕駛,我們突然發(fā)現(xiàn)我們的學(xué)習(xí)算法模型在車(chē)路協(xié)同,在車(chē)全天候全天時(shí)駕駛的時(shí)候,你的機(jī)器學(xué)習(xí)模型應(yīng)該是什么?如果強(qiáng)大的復(fù)雜模型出來(lái)以后,你的算力夠不夠?這都是我們需要探討的問(wèn)題。
我今天給大家匯報(bào)一下在算力、算法和交互方面,這上面我們應(yīng)該怎么去一些什么工作,我們也做了一些工作,在這上面發(fā)力發(fā)現(xiàn)。
算力和人工智能是相輔相成的,大家都知道,最早Rosenblatt發(fā)明了512個(gè)計(jì)算單元。但是如果做更復(fù)雜的數(shù)據(jù)算法和分類(lèi)的話,做不到,算力不夠。于是人工智能第一步存在什么根本問(wèn)題呢?一個(gè)是模型不夠,就是這個(gè)數(shù)學(xué)模型存在問(wèn)題。第二個(gè)是算力不夠,實(shí)際上算力里面就體現(xiàn)在軟件和硬件的結(jié)合怎么發(fā)展。
第二個(gè)是摩爾定律出現(xiàn),每單位面積18個(gè)月晶體管的數(shù)量要翻一番,為的是提高算力,提高算法可實(shí)現(xiàn)性,變成一個(gè)芯片,這是信息時(shí)代最偉大的貢獻(xiàn),計(jì)算機(jī)、芯片加上互聯(lián)網(wǎng)。
大家都知道,到了1999年,英偉達(dá)為了提升算力的能力,他提出了GPU,為我們的算力做貢獻(xiàn),因此我們的力量從體力已經(jīng)到腦力這個(gè)方面移植了,這個(gè)算力體現(xiàn)在腦力上面。大家可以看到AlphaGo用176個(gè)GPU,1000多個(gè)CPU。包括AlexNet GPU加速開(kāi)啟了深度學(xué)習(xí)的黃金時(shí)代。人工智能要繼續(xù)發(fā)展,一定要在算力上有所保障才行。
大家可以看到這個(gè),我們要想把我們的算法和機(jī)器學(xué)習(xí)模型用上去,無(wú)人系統(tǒng)、無(wú)人駕駛、智能醫(yī)療和智能制造,算法是越來(lái)越復(fù)雜。我們知道,無(wú)人系統(tǒng)、自我感知的視覺(jué)系統(tǒng),4節(jié)電池支持不到25分鐘,怎么去工作?這是一個(gè)很大的問(wèn)題。
視頻在全世界的播放量,大家可以看到58%是我們的下行流量,還有包括每月超過(guò)20億的注冊(cè)訪問(wèn)量,因此人工智能的蓬勃發(fā)展帶來(lái)了算力需求的指數(shù)增長(zhǎng)。
科學(xué)家在研究在硬件和軟件上如何提高算力,如果這個(gè)提不高,就限制了人工智能的發(fā)展和應(yīng)用,所以它是一個(gè)非常大的問(wèn)題。
最近MIT專(zhuān)家發(fā)了一篇文章,對(duì)1500篇文章關(guān)于算力方面的問(wèn)題做了仔細(xì)的分析。這個(gè)算力的分析結(jié)果是什么呢?深度學(xué)習(xí)正在逼近現(xiàn)有芯片的算力極限,計(jì)算能力提高10倍相當(dāng)于三年算法的改進(jìn)。算力提高的硬件、環(huán)境和金錢(qián)成本接下來(lái)將無(wú)法承受。因?yàn)槿藗儗?duì)于人工智能的期望越來(lái)越高,希望它能做更大舞臺(tái)上的事,在這上面承受的壓力很大。
最后是底層技術(shù)(半導(dǎo)體物理與硅制造),在人工智能已經(jīng)大規(guī)模應(yīng)用和發(fā)展的時(shí)候,這個(gè)空間比較小了。這個(gè)方面我們專(zhuān)門(mén)和清華微電子系的吳華強(qiáng)老師也專(zhuān)門(mén)討論過(guò),這個(gè)PPT是我們和吳華強(qiáng)老師一塊來(lái)討論的。大家知道,摩爾定律近五年已經(jīng)逐步放緩了,已經(jīng)達(dá)不到每18個(gè)月翻一番。
這個(gè)里面大家都提出不同的路徑來(lái)做:
第一個(gè)是量子計(jì)算,最近Google、IBM紛紛發(fā)起了量子計(jì)算的能力。這個(gè)量子計(jì)算未來(lái)給我們帶來(lái)到底是什么?要做一個(gè)特殊任務(wù)大規(guī)模的計(jì)算,用別的很難算,我們要搭一塊量子計(jì)算。而這個(gè)量子計(jì)算要搭起來(lái),至少100平方米的大房子,為什么呢?因?yàn)橐WC那個(gè)時(shí)間段所捕獲量子的相關(guān)性要強(qiáng),而且在持續(xù)工作當(dāng)中,穩(wěn)定性要高。所以這種是屬于特種計(jì)算應(yīng)用的方面,因此對(duì)我們現(xiàn)在十年二十年人工智能算法算力的提升是有難度的,因?yàn)槲覀冃枰玫礁鱾€(gè)方面,而不光是特殊計(jì)算。
第二個(gè)就是存算一體的架構(gòu),這個(gè)是用一體機(jī)陣列來(lái)做這個(gè)東西,使得它的算力能夠大大提升。
第三個(gè)就是類(lèi)腦計(jì)算,希望能夠逼近人腦的計(jì)算力,這樣以來(lái)也能夠提升一定的算力。
還有一種就是光電智能計(jì)算,用光來(lái)計(jì)算。這是不是一種很好的算力提升的方面呢?
接下來(lái)我們討論一下如果用光電智能計(jì)算和存算一體,包括再和類(lèi)腦結(jié)合起來(lái),這個(gè)算力的提升,這個(gè)做成了保證十年二十年的算力能夠滿足人工智能發(fā)展的需求,這個(gè)時(shí)候才能保證人工智能不像有些人說(shuō)的人工智能到泡沫了,不是泡沫,是我們的技術(shù)、算力遇到了瓶頸。
光電智能計(jì)算,大家可以看到這是一個(gè)物理學(xué)家,他專(zhuān)門(mén)對(duì)光電智能計(jì)算基本理論做了一個(gè)推導(dǎo),推導(dǎo)的結(jié)果是如果用這個(gè)光計(jì)算的話,算力能提升3個(gè)數(shù)量級(jí),功耗下降6個(gè)數(shù)量級(jí)。有了這個(gè)理論的保障,大家才說(shuō)再去做光電計(jì)算,用光和電,就是有硅基和光基,這樣做的話是不是能更好地解決問(wèn)題。
于是我們就討論光計(jì)算,這個(gè)是我們所說(shuō)的光計(jì)算的發(fā)展路徑,這是1956年提出光計(jì)算,大家都在做。1964年光計(jì)算出現(xiàn)下坡,因?yàn)槟莻€(gè)時(shí)候根本不需要那么高的算力,于是光計(jì)算就跌下來(lái)。到1990年,貝爾實(shí)驗(yàn)室采用了砷化鎵,到1990年英偉達(dá)發(fā)展非常快,受到市場(chǎng)的沖擊,又沒(méi)有完成,直到2017年、2018年突飛猛進(jìn),這個(gè)和人工智能2010年開(kāi)始起來(lái),剛好滯后近10年。為什么滯后近10年?因?yàn)槿斯ぶ悄馨l(fā)展起來(lái)當(dāng)時(shí)還不需要那么大的算力,但是2015年以后對(duì)算力需求很強(qiáng),于是光計(jì)算馬上在這個(gè)時(shí)候發(fā)展,所以我說(shuō)光計(jì)算比人工智能發(fā)展慢半拍,就是接近5年的樣子。
大家可以看,這個(gè)是三維可控的光傳輸實(shí)現(xiàn)并行光速計(jì)算,大家知道光里面的維度很高,有光射、折射、反射,還有其他方面,維度高帶來(lái)大量的并行計(jì)算。而我們的硅計(jì)算是電,一維計(jì)算、二維計(jì)算,大規(guī)模計(jì)算比較難,因此可以提供很強(qiáng)的計(jì)算能力。
第二,如果做全相位調(diào)制通光率帶來(lái)?yè)p耗,大家知道用電耗電能量很強(qiáng)。
第三,高維光場(chǎng)信號(hào)帶來(lái)通量帶寬很大。
第四,感存算一體是光的特點(diǎn)。大家知道拿一個(gè)手機(jī)照個(gè)相光進(jìn)來(lái)了,轉(zhuǎn)成電才能計(jì)算,如果是光計(jì)算的話,直接計(jì)算了。存算一體是大家都在做的,能不能實(shí)現(xiàn)感存算一體,要找到好的材料,以可控高維光場(chǎng)傳播實(shí)現(xiàn)高速高效并行計(jì)算。
這里面最重要的特點(diǎn)是什么?
第一、范式顛覆了傳統(tǒng),采集與計(jì)算無(wú)縫銜接,突破存算分離、感存算機(jī)制。
第二、速度提升了3個(gè)數(shù)量級(jí),功耗能下降6個(gè)數(shù)量級(jí)。
對(duì)比一下國(guó)際上三個(gè)重要的機(jī)構(gòu)做的,第一個(gè)是MIT,麻省理工2017年發(fā)到《Nature》上的,是計(jì)算能效顯著提升,最重要的是做光學(xué)矩陣的乘法,算力非常快。
第二個(gè)是牛津大學(xué)和劍橋大學(xué),用相陣材料做脈沖網(wǎng)絡(luò),這里面光學(xué)相陣材料能夠起到很大的作用。
清華大學(xué)是2019年做衍射的神經(jīng)網(wǎng)絡(luò),在這里面可以做到大規(guī)模光學(xué)、神經(jīng)元的光學(xué)并行計(jì)算,現(xiàn)在清華大學(xué)在國(guó)家研究中心組織一個(gè)團(tuán)隊(duì),包括材料、芯片、架構(gòu)和范式、機(jī)器學(xué)習(xí)與算法,有一個(gè)大的團(tuán)隊(duì),也開(kāi)展了這個(gè)方面的研究。
如果說(shuō)把光計(jì)算這個(gè)做好了以后,大家看智能仿真機(jī)器人、微型修理機(jī)器人都能做,如果功能做好了,云計(jì)算的服務(wù)器功耗會(huì)大大下降。光電計(jì)算機(jī)在自動(dòng)駕駛上面速度可以不斷提升。
如果說(shuō)3個(gè)數(shù)量級(jí)達(dá)不到,1個(gè)數(shù)量級(jí)、2個(gè)數(shù)量級(jí)至少能夠支持現(xiàn)在人工智能的大規(guī)模應(yīng)用。
光電智能芯片,使龐大的計(jì)算中心小型化,而且可以做到納秒級(jí)目標(biāo)感知與識(shí)別,這種無(wú)人系統(tǒng)都能夠用得上。再一個(gè)是工業(yè)互聯(lián)網(wǎng)、計(jì)算機(jī)視覺(jué)、大數(shù)據(jù)分析、光通信能夠帶來(lái)大規(guī)模提升。
第二部分要講到算法,大家一說(shuō)算法都很敏感,應(yīng)該是怎么去討論,怎么去做?這張圖大家都知道,從達(dá)特茅斯會(huì)議走出來(lái),一直走到這兒,2012年、2013年深度學(xué)習(xí)掀起了人工智能熱潮,實(shí)際上就是我們做的算法。
但是這些算法,我們現(xiàn)在去分析分析,存在幾個(gè)方面的問(wèn)題。
第一個(gè)問(wèn)題是魯棒性的問(wèn)題,大家用機(jī)器學(xué)習(xí)的算法,在汽車(chē)的后世,大家可以看到尾燈,我們通過(guò)提升亮度來(lái)檢測(cè),我們的檢測(cè)就失敗。輸入這種小的變化,引起輸出大的變化,魯棒性差,怎么改進(jìn)這個(gè)算法?
我們先分析問(wèn)題,不是說(shuō)做得不好,在應(yīng)用當(dāng)中存在這個(gè)問(wèn)題。
第二個(gè),就是剛才楊強(qiáng)老師講的遷移性。大家可以看到在這個(gè)場(chǎng)景里面,特殊場(chǎng)景效果欠佳,沒(méi)有遷移性。
這里面就存在一個(gè)問(wèn)題,無(wú)人駕駛要全天時(shí)全天候開(kāi)這個(gè)車(chē),可是這個(gè)數(shù)據(jù)不夠,難學(xué)到這些東西,因此這種遷移性就比較差。
能效比,大家都知道我們的大腦所能理解的場(chǎng)景,所能分析的場(chǎng)景,所能解決的場(chǎng)景,都是功耗在20W左右,而我們現(xiàn)在要用GPU的話,這是英偉達(dá)GPU250—300W,這個(gè)功耗還是比較大的。相對(duì)生物神經(jīng)網(wǎng)絡(luò),能效比較低。
自適應(yīng)性,我們有6萬(wàn)條腦的數(shù)據(jù),在做的過(guò)程當(dāng)中,就發(fā)現(xiàn)不同類(lèi)型不同癥狀,最后要做成自適應(yīng)性是非常難的一件事情,因此在這里面也存在它的問(wèn)題。
最后一個(gè)問(wèn)題,大家都非常清楚,不可解釋性,通過(guò)這個(gè)場(chǎng)景,通過(guò)計(jì)算、深度學(xué)習(xí)以后,到輸出,怎么解釋是一個(gè)問(wèn)題。
這三個(gè)圖靈獎(jiǎng)都表達(dá)了深度學(xué)習(xí)有嚴(yán)重的缺陷,欠魯棒性、難解釋?zhuān)四X在無(wú)監(jiān)督學(xué)習(xí)方面遠(yuǎn)遠(yuǎn)優(yōu)于深度學(xué)習(xí),因此怎么做算法上的創(chuàng)新,我們要思考這樣的問(wèn)題。
實(shí)際上大家可以看看非常簡(jiǎn)單的一個(gè)問(wèn)題,就是機(jī)器把東西放到桌子上的問(wèn)題都做不好。在初級(jí)感知、信息處理與高級(jí)認(rèn)知過(guò)程當(dāng)中遠(yuǎn)不如人腦。借鑒神經(jīng)系統(tǒng)的多模數(shù)據(jù)表示、變換和學(xué)習(xí)規(guī)律及反饋方式,能不能通過(guò)魯棒性進(jìn)行改進(jìn)?
深度學(xué)習(xí)路在哪里?這是人工智能誕生、人工智能初步產(chǎn)業(yè)化、人工智能變革迎來(lái)了爆發(fā),各個(gè)地方都在用,但是大家想到不可解釋性就限制使用,魯棒性差、自適應(yīng)性差限制了自動(dòng)駕駛的應(yīng)用,所以很多方面沒(méi)有辦法做。
深度學(xué)習(xí)的來(lái)源,是優(yōu)化控制論在這里面。大家可以看到這個(gè)公式是深度學(xué)習(xí)使用最廣泛的一個(gè)東西,也是卷積神經(jīng)網(wǎng)絡(luò)、語(yǔ)言和注意力模型、生成對(duì)抗網(wǎng)絡(luò),包括深度強(qiáng)化學(xué)習(xí),能不能從根本上解決深度學(xué)習(xí)里的問(wèn)題,我們要討論能不能構(gòu)成一個(gè)認(rèn)知計(jì)算模型。
在這里面大家會(huì)看到,我們以前的做法也是從這里面做的,也是從神經(jīng)科學(xué)家里面來(lái)的。第一個(gè)是什么呢?發(fā)現(xiàn)簡(jiǎn)單和復(fù)雜細(xì)胞,發(fā)現(xiàn)視覺(jué)系統(tǒng)的卷積特性這里面來(lái)的。包括日本的科學(xué)家借鑒簡(jiǎn)單復(fù)雜細(xì)胞概念提出新認(rèn)知機(jī),在這里面一系列的工作,包括提出卷積神經(jīng)網(wǎng)絡(luò)、認(rèn)知計(jì)算模型,2015年開(kāi)始做這個(gè)方面的工作。
所以能不能再反過(guò)頭來(lái)重新認(rèn)識(shí)腦科學(xué),再到我們的深度學(xué)習(xí)算法,來(lái)討論這個(gè)問(wèn)題。
當(dāng)然還有一個(gè)類(lèi)腦的方向,大家可以看,從1907年開(kāi)始做,到1989、2013、2018、2019年,中國(guó)的兩位科學(xué)家,這是從類(lèi)腦角度去做。
還有腦觀測(cè)到啟發(fā),我們以前觀察腦觀測(cè)通過(guò)什么呢?通過(guò)核磁共振,通過(guò)CT。但是大家都知道,我們那時(shí)候探討的腦,包括現(xiàn)在看不到神經(jīng)元細(xì)胞,只能看腦功能區(qū),因此我們說(shuō)這些模型來(lái)的特點(diǎn)是從腦功能到深度算法,到卷積算法,這么一個(gè)算法層面的工作。能不能到神經(jīng)元角度來(lái)?這是一個(gè)非常重要的特點(diǎn)。神經(jīng)元是通過(guò)軸突與樹(shù)突建立關(guān)系,人腦有860億個(gè)神經(jīng)元,這些神經(jīng)元要通過(guò)構(gòu)建環(huán)路,不同的環(huán)路解決不同的問(wèn)題。還包括我們的記憶。大家看突觸尺寸有26類(lèi),我們神經(jīng)元的細(xì)胞10個(gè)微米左右,我們的軸突和樹(shù)突500納米,現(xiàn)在用核磁共振都看不到,因此極其希望研究界觀尺度的腦科學(xué)成像,看神經(jīng)元的環(huán)路怎么樣,把軸突和樹(shù)突的尺寸看清楚,因此我們覺(jué)得應(yīng)該是這么一個(gè)架構(gòu)。
這邊是腦科學(xué),那邊是人工智能。我記得五年前聽(tīng)李德毅老師的報(bào)告,說(shuō)腦科學(xué)和人工智能是兩條平行線,不相交,我們就搞了兩個(gè)堡壘,它們都是平行的。
多模態(tài)回路觀測(cè),就是包括宏觀、微觀、界觀,能不能做得到?那邊提出多層次認(rèn)知模型,能不能構(gòu)建這樣一個(gè)橋梁,使得在認(rèn)知計(jì)算情況下達(dá)到這么一個(gè)算法的特征。
這是兩條平行線,這都是腦科學(xué)的諾貝爾獎(jiǎng),從1906年以來(lái),我們調(diào)研了一下,到現(xiàn)在獲得腦科學(xué)的諾貝爾獎(jiǎng)有23項(xiàng)。到現(xiàn)在我們主要和神經(jīng)信息傳遞機(jī)制,和人工智能相關(guān)的,梳理出來(lái),人類(lèi)如何思考,那邊是機(jī)器如何思考,是圖靈獎(jiǎng)提出和解決的一些問(wèn)題。這兩條平行線建立起來(lái)了,如何從腦思考到機(jī)器思考,建立一個(gè)路徑。
2016年美國(guó)阿波羅項(xiàng)目1億美金獎(jiǎng)勵(lì)給三位科學(xué)家,這三位科學(xué)家做什么呢?這三個(gè)是神經(jīng)元計(jì)算模型到下面機(jī)器學(xué)習(xí)算法模型,這兩個(gè)能不能打通,10萬(wàn)個(gè)神經(jīng)元之間的連接關(guān)系要找到,就是研究這套機(jī)制。嚙齒動(dòng)物就是神經(jīng)小鼠,能不能來(lái)做?第一位叫Tai Sing Lee,是腦神經(jīng)科的專(zhuān)家;第二位叫David Cox,是生物學(xué)家、計(jì)算科學(xué)家;第三位叫Andreas Tolias,是神經(jīng)科學(xué)家。
在這里面我們就探討從記憶角度看,能不能從記憶的角度研究算法,第一個(gè)記憶痕跡假設(shè),包括海馬體與記憶、記憶多腦區(qū)的協(xié)同。這里面和它的算法有什么關(guān)系?我們要建立這種關(guān)聯(lián)關(guān)系,就比較容易打通這個(gè)通路。這就是尖波漣漪等記憶曲線,這是脈沖的。清華大學(xué)課題組通過(guò)三年的努力,已經(jīng)開(kāi)始構(gòu)建這么一個(gè)模型架構(gòu),當(dāng)然還正在研究,供大家一塊討論,共同研究。
這是生物機(jī)制,那邊希望做到物理原理的平衡,就是短期記憶和長(zhǎng)期記憶。在研究這樣一套機(jī)制以后,我們能不能建立一套新型的網(wǎng)絡(luò)模型。這個(gè)模型正在架構(gòu)當(dāng)中,也有一個(gè)組專(zhuān)門(mén)討論。給大家共享,也是看看各位老師各位同學(xué)們能不能在這個(gè)上面做出更新的一個(gè)算法模型的貢獻(xiàn)?
全腦觀測(cè),大家可以看到上面是介觀,我們現(xiàn)在有這個(gè)儀器,小鼠全腦的連接,這個(gè)是宏觀觀測(cè),我們能夠看到神經(jīng)元的結(jié)構(gòu)加這個(gè)功能,和機(jī)器學(xué)習(xí)深度學(xué)習(xí)算法的關(guān)聯(lián)關(guān)系是什么。大家都知道一個(gè)系統(tǒng)有什么樣的結(jié)構(gòu),就能表達(dá)什么樣的功能,所以結(jié)構(gòu)是主體。因此從微觀、宏觀到介觀,三個(gè)層面目前架構(gòu)都有了,怎么樣從結(jié)構(gòu)到功能,來(lái)研究機(jī)器學(xué)習(xí)的算法、人工智能算法的模型。在這里面主要打通這個(gè)。
大家可以看到,這是知識(shí)驅(qū)動(dòng)模型和腦科學(xué)驅(qū)動(dòng),包括數(shù)據(jù)的驅(qū)動(dòng)。最后能不能有一個(gè)認(rèn)知的驅(qū)動(dòng)?提出一個(gè)問(wèn)題。這個(gè)問(wèn)題也是可以在人工智能學(xué)界,大家可以關(guān)注和研究,能夠產(chǎn)生一些顛覆性的算法和應(yīng)用,給我們的算力算法上都能夠往前走的這么一個(gè)架構(gòu),才能得到更好的東西。
第三個(gè),有人工智能了,有機(jī)器人了,人類(lèi)的發(fā)展就是不斷地和環(huán)境交互,不斷地把自己的能力提升。
AI賦能人類(lèi),而不是成為人類(lèi),更不是取代人類(lèi)。
這里面講的問(wèn)題,我們能不能開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人類(lèi)智慧能力的理論方法、技術(shù)及應(yīng)用系統(tǒng),從而解決復(fù)雜問(wèn)題的基礎(chǔ)科學(xué)并服務(wù)于人類(lèi)。
通過(guò)這樣一來(lái),我們就想到剛才楊老師專(zhuān)門(mén)講聯(lián)邦學(xué)習(xí)里面隱私的問(wèn)題,這是非常重要的問(wèn)題。
以人為本、服務(wù)于人,包括協(xié)同性、安全性、公平性和隱私,這里面怎么樣搭開(kāi)一個(gè)架構(gòu),人工智能整個(gè)算法和算力應(yīng)用的架構(gòu)。
因此這里面需要做到人工智能和AI怎么交互,AI和物理世界怎么交互?我們要教AI和物理世界交互。什么意思?我們?nèi)搜勰芸吹剑床灰?jiàn)的交給機(jī)器去看,看不清的聽(tīng)不見(jiàn)的聽(tīng)不清的都能交給AI,人和AI的交互。
這里面體現(xiàn)很多的東西,大家知道AI里面的交互,包括汽車(chē),包括多足機(jī)器人、人形機(jī)器人、服務(wù)機(jī)器人,這是不同AI的實(shí)體有不同的接口,因此把它定為AI的專(zhuān)用接口。
還有一種,信息時(shí)代,十年前就在說(shuō)AR/VR,一直起不來(lái),到了人工智能時(shí)代,AI通用接口希望能成型、能起來(lái)、能應(yīng)用,因?yàn)槿斯ぶ悄芩惴?、算力足以支持它們的?yīng)用。包括眼鏡、虛擬主播、數(shù)字化AI的形象就可以建立起來(lái)。
目前AI通用接口驅(qū)動(dòng)AI與AR的融合。北航趙老師一直在搞AR,都應(yīng)用到數(shù)字虛擬手術(shù)上去。通用接口能做什么?
第一,拓展人類(lèi)的能力。
第二,改變產(chǎn)品的形態(tài)和服務(wù)模式。
第三,推動(dòng)認(rèn)知、智能與文化藝術(shù)的變革。
第四,促進(jìn)未來(lái)人-AI-物融合社會(huì)發(fā)展。
這是AI的通用交互接口能帶來(lái)非常大的變革。
以前要做AI對(duì)人體行為的理解,要理解人的行為,才能跟你交互。因此對(duì)人的行為怎么樣建設(shè)好,視覺(jué)三維重建是重中之重。對(duì)視覺(jué)怎么樣三維重建,包括人的屬性怎么樣去做,AI怎么樣去理解?這是大的方面。
其次,疫情時(shí)代,基本上是線上,線上上課,中小學(xué),包括大學(xué),上課質(zhì)量受到影響,據(jù)統(tǒng)計(jì)大一、大二的授課存在30%的知識(shí)獲取下降。因此能否做一個(gè)新的虛擬線下的工作?這個(gè)發(fā)展也有歷史,最早以前是寫(xiě)郵件,第二是電報(bào),第三個(gè)語(yǔ)音電話,然后是視頻電話,未來(lái)是全息投影,這些人都不在會(huì)場(chǎng),戴上AR眼鏡就可以看到他們?cè)诰€上開(kāi)會(huì),這個(gè)demo在清華已經(jīng)做成了,這個(gè)系統(tǒng)一旦做完,清華大學(xué)首先要試用。
從三維重建里來(lái)做,目前做到單相機(jī)的三維重建。三維重建是AI和人接口的一個(gè)重要關(guān)鍵,三維重建是核心關(guān)鍵技術(shù)。
影創(chuàng)、谷歌AR眼鏡只有50克,非常輕,使得我們教育、教學(xué)、醫(yī)療都可以引用。包括301提出虛擬手術(shù)問(wèn)題怎么做?用這樣的東西,包括講課中的PPT,人書(shū)寫(xiě)的demo,包括上面的東西,都可以放到虛擬線下環(huán)境當(dāng)中,能夠提高各方面AI和人交互的能力。
混合現(xiàn)實(shí)虛擬手術(shù),包括中關(guān)村一條街上可以虛擬看到人在走過(guò)的場(chǎng)景,還有教學(xué)平臺(tái)等都可以用AI來(lái)做,人和AI的交互變得直接可以討論。
AI和物理世界的交互。把人和AI的交互傳遞給AI和物理世界的交互,這方面工作清華大學(xué)孫老師團(tuán)隊(duì)做得很好,人類(lèi)以前進(jìn)化是不斷和自然環(huán)境打交道,三維重建是人和AI的交互,人和環(huán)境交互是AI認(rèn)識(shí)環(huán)境。所以智能是在智能體與環(huán)境的相互作用中逐步產(chǎn)生和發(fā)展的。所以在這里我們要做包括觸覺(jué)、視覺(jué)、聽(tīng)覺(jué)多模態(tài)的感知能力能否結(jié)合起來(lái),AI才能對(duì)自然界能夠有認(rèn)知能力。
要讓電腦如何像人一樣下棋是相對(duì)容易的,但要讓電腦有如一歲小孩般的感知和行動(dòng)能力卻是相當(dāng)困難的。它做復(fù)雜的行為、牽涉感情方面的東西還不如一歲小孩,我們要學(xué)習(xí)靈巧的手能抓取東西,抓取操作對(duì)機(jī)器來(lái)說(shuō)是非常困難的事情。所以要一步一步去操作,讓AI去感知這種環(huán)境和理解這里面的東西。這是國(guó)際上非常大的研究熱點(diǎn),操作的三大重要因素是感知、學(xué)習(xí)和多模態(tài),利用視覺(jué)和觸覺(jué)多模態(tài)融合,實(shí)現(xiàn)AI和環(huán)境的學(xué)習(xí)能力和復(fù)雜的交互能力的提升。
我們要想AI能夠感知到各方面。人手具有上百億個(gè)觸感神經(jīng)元,有哪一種材料做出來(lái)能放到AI上,使得人體動(dòng)態(tài)觸覺(jué)可以區(qū)分出不超過(guò)十幾納米的凸凹的感覺(jué),我們手能感覺(jué)到,機(jī)器能否感覺(jué)到?我們考察人的特征,把這些東西賦予AI,它對(duì)場(chǎng)景的獲取能力、感知能力就會(huì)變得非常強(qiáng)。
觸覺(jué)感知是非常難的問(wèn)題,也是非常重要的問(wèn)題,在國(guó)際上,歐盟、美國(guó)學(xué)術(shù)界都開(kāi)展了這方面研究,包括歐盟的new touch,包括機(jī)器人領(lǐng)域著名的國(guó)際會(huì)議都在考慮觸覺(jué)的問(wèn)題,機(jī)器人具身觸覺(jué)智能引起廣泛關(guān)注和高度重視,我們國(guó)家多個(gè)團(tuán)隊(duì)都在研究這方面工作。
視覺(jué)與觸覺(jué)能夠結(jié)合,眼見(jiàn)為實(shí),但是感覺(jué)為真,有時(shí)候看到和摸到的東西不一樣。所以觸覺(jué)先于視覺(jué)也先于語(yǔ)言,既是第一語(yǔ)言也是最后的語(yǔ)言,所以觸覺(jué)在AI感知自然場(chǎng)景當(dāng)中起著非常重要的作用。視覺(jué)幫助我們了解全貌,觸覺(jué)使我們了解細(xì)節(jié)。
觸覺(jué)里面包括很多細(xì)節(jié),包括指尖、指掌、軀干等等,因此觸覺(jué)傳感器是機(jī)器人的核心部件?!犊萍既?qǐng)?bào)》登了35項(xiàng)“卡脖子”技術(shù)問(wèn)題之一,觸覺(jué)是很難的一個(gè)問(wèn)題,大家也都在這方面開(kāi)展應(yīng)用。
包括空間視覺(jué)敏銳度和時(shí)間視覺(jué)敏銳度方面,孫老師團(tuán)隊(duì)在國(guó)際智能機(jī)器人大會(huì)上抓取操作比賽獲得冠軍,說(shuō)明我們?cè)谶@上面也有向上走的趨勢(shì),未來(lái)能夠做得更好。
清華做的一件事情,能飛的機(jī)器人,當(dāng)感知到前面有障礙時(shí),路被擋住時(shí),能飛著跳躍過(guò)去,這也是視覺(jué)和觸覺(jué)整個(gè)感知功能在這里體現(xiàn)的一個(gè)特長(zhǎng)。
人-AI-環(huán)境的協(xié)同交互能夠給我們帶來(lái)更多人工智能的應(yīng)用,也給我們?nèi)藥?lái)更多發(fā)展,包括人工智能像人一樣思考以后,人工智能像人一樣能夠去做事,能達(dá)到多少量級(jí),這是我們現(xiàn)在要分析和研究的問(wèn)題。人工智能怎樣去發(fā)展、怎樣去應(yīng)用?視覺(jué)、觸覺(jué)、聽(tīng)覺(jué)都能體現(xiàn)非常重要的特征。
發(fā)揮多智能體的群體效應(yīng)是未來(lái)重要了發(fā)展方向,包括群體協(xié)同交互問(wèn)題,一群機(jī)器人怎么樣交互也是很重要的一個(gè)研究。群體協(xié)同交互是構(gòu)筑智能通天塔的必由之路,也是有望挑戰(zhàn)莫拉維克悖論的重要途徑。
我們希望能夠有更靈巧的手,有更明亮的眼睛,更靈敏的耳朵,把這些東西交給AI,交給機(jī)器人,它們能夠?qū)Νh(huán)境有更加深刻的認(rèn)識(shí)。
智能光電芯片、知識(shí)驅(qū)動(dòng)、數(shù)據(jù)驅(qū)動(dòng)、認(rèn)知驅(qū)動(dòng)使得未來(lái)的AI能夠發(fā)展的更好,能夠更有效地發(fā)展。
算力有很多提升方法,大家在做光電計(jì)算架構(gòu),能不能先行把這個(gè)做出來(lái),這也是國(guó)際上競(jìng)爭(zhēng)的制高點(diǎn)。
在算法上能夠更加逼近本源的認(rèn)知計(jì)算理論與方法,做的過(guò)程中需要做新的認(rèn)知機(jī)理測(cè)試的范式出來(lái)。
更高的工作效率、生活質(zhì)量和安全保障。這是我們強(qiáng)調(diào)的交互問(wèn)題,交互給我們帶來(lái)人工智能更加重要的特點(diǎn)。
信息時(shí)代,計(jì)算機(jī)強(qiáng)調(diào)人機(jī)交互,人和機(jī)器交互,那個(gè)交互完全是機(jī)器被動(dòng)式,人主動(dòng)式,未來(lái)人和AI的交互就是互相都有主動(dòng)式,AI和環(huán)境交互,AI是主動(dòng)式,和我們信息時(shí)代的人機(jī)交互有著不同的理解和相關(guān)方面的工作。