精品无人区无码乱码毛片国产_性做久久久久久免费观看_天堂中文在线资源_7777久久亚洲中文字幕

首頁(yè) 自媒自媒體大數(shù)據(jù)文摘正文

李飛飛四大視角看視覺(jué)智能:AI會(huì)改變世界,誰(shuí)會(huì)改變AI

  談及計(jì)算機(jī)視覺(jué)領(lǐng)域的青年領(lǐng)袖,應(yīng)該沒(méi)有人比李飛飛更有代表性。作為斯坦福大學(xué)計(jì)算機(jī)系終身教授、Google Cloud首席科學(xué)家,李飛飛已然引領(lǐng)著學(xué)術(shù)界和產(chǎn)業(yè)界密切結(jié)合的探索新方向;而其作為一位女性的角色,又讓她在人工智能多樣性的探索中有著自己嶄新且不同的視角。

  在1月15日,未來(lái)論壇2017年會(huì)暨首屆未來(lái)科學(xué)大獎(jiǎng)?lì)C獎(jiǎng)典禮上,李飛飛作為人工智能領(lǐng)域的代表,發(fā)表了題為《視覺(jué)智能探索(The Quest for Visual Intelligent)》的主題演講。演講中,李飛飛從生物領(lǐng)域視覺(jué)的出現(xiàn)開(kāi)始娓娓道來(lái),進(jìn)而闡述了計(jì)算機(jī)視覺(jué)探索過(guò)程中的四大視角:從孩子成長(zhǎng)、大腦發(fā)展、技術(shù)從業(yè)者、教育者和母親的角度,如何看待計(jì)算機(jī)視覺(jué)和人工智能。

  演講的最后一個(gè)部分,李飛飛提出了這樣的問(wèn)題:人工智能AI會(huì)改變世界,但這里真正的問(wèn)題是,誰(shuí)會(huì)改變AI?由此,她鼓勵(lì)人工智能多樣化的發(fā)展,讓更多人更多元的文化參與到相關(guān)研究和產(chǎn)業(yè)中來(lái),這樣我們會(huì)看到技術(shù)發(fā)現(xiàn)上的大爆炸,使我們的世界變得更好。

(李飛飛在1月15日未來(lái)論壇2017年會(huì)上發(fā)表演講 圖丨魏子敏)

  以下內(nèi)容基于李飛飛演講(原演講為英文),在不改變?cè)獾那闆r下部分有刪改:

  今天我想跟大家分享一下計(jì)算機(jī)視覺(jué)方面最新的進(jìn)展。

  大概5億年前,一些非常簡(jiǎn)單的生物生活在海洋中,捕獲獵物、或者成為別人的食物。動(dòng)物世界在當(dāng)時(shí)非常簡(jiǎn)單,只有一些簡(jiǎn)單的物種存在,后來(lái)可能是出于偶然或者“上帝之手”,某種生物衍化出了第一雙真正意義上的“眼睛”,這時(shí)的眼睛還很簡(jiǎn)單,就像我們最初最簡(jiǎn)單的照相機(jī)一樣。

  視覺(jué)的出現(xiàn)讓生物世界大不一樣:生物物種變得更加有活力和積極,捕獵者可以自發(fā)進(jìn)攻,被捕獵的生物也會(huì)尋找更隱蔽的地方躲藏起來(lái),避免自己成為它人的食物。

  在很短的時(shí)間內(nèi),生物物種數(shù)量以驚人的速度增加,這也是視覺(jué)發(fā)展的一個(gè)結(jié)果——寒武紀(jì)大爆發(fā)。寒武紀(jì)大爆發(fā)之后,視覺(jué)就在動(dòng)物中發(fā)揮著非常重要的作用,幫助它們尋找食物、幫助它們躲避敵人等。作為人,我們也是一樣的,我們也用視覺(jué)支持我們的生活、我們的工作、我們的交流,讓我們更好地了解世界。

  人類(lèi)社會(huì)還處于“失明”狀態(tài)

  事實(shí)上,在5億年的進(jìn)化之后,視覺(jué)已經(jīng)成了我們?nèi)俗钪匾母兄到y(tǒng),我們的大腦中有一半的功能都是和視覺(jué)系統(tǒng)聯(lián)系在一起的,動(dòng)物們大概在5.3億年前就看到了世界的光明,而對(duì)于我們的機(jī)器和計(jì)算機(jī)來(lái)說(shuō),整個(gè)世界還是黑暗一片。

  盡管,目前到處都是監(jiān)控器,但是當(dāng)一個(gè)孩子在泳池溺水時(shí),機(jī)器并不能提醒人類(lèi);目前每一分鐘我們都有成百上千萬(wàn)小時(shí)的視頻上傳到Y(jié)ouTube或者Facebook的服務(wù)器上,但是我們?nèi)匀粺o(wú)法根據(jù)內(nèi)容進(jìn)行視頻搜索;現(xiàn)在無(wú)人機(jī)可以在非常廣的范圍航行,但我們還無(wú)法根據(jù)無(wú)人機(jī)拍攝的圖景標(biāo)記出地球環(huán)境??偠灾?,人類(lèi)社會(huì)還處于“失明”狀態(tài),因?yàn)榧幢闶亲钪悄艿臋C(jī)器,目前還沒(méi)有視覺(jué)能力。

  一個(gè)小目標(biāo):讓計(jì)算機(jī)視覺(jué)

  為數(shù)字世界帶來(lái)光明

  作為計(jì)算機(jī)視覺(jué)的科學(xué)家,我們希望使用能夠?qū)W習(xí)視覺(jué)世界的人工智能算法來(lái)識(shí)別圖像和視頻,我們有這樣一個(gè)小目標(biāo),讓計(jì)算機(jī)視覺(jué)為數(shù)字世界帶來(lái)光明。

  為了實(shí)現(xiàn)這樣一個(gè)目標(biāo),首先我們要教計(jì)算機(jī)識(shí)別物品,也即世界最基本的組成部分。簡(jiǎn)單來(lái)說(shuō),給計(jì)算機(jī)看某個(gè)物品的訓(xùn)練圖片:比如說(shuō)我們可以把一只貓放到電腦中去,讓它識(shí)別,然后我們會(huì)建立一些數(shù)學(xué)模型,人可以為貓寫(xiě)出一組公式來(lái),讓電腦識(shí)別它,這就是我們最初做的嘗試。

  我們想要把一個(gè)物品的不同部分分離出來(lái),然后用非常簡(jiǎn)單的幾何模型,數(shù)字模型,模擬模型來(lái)做“cat model”,很直接的把它變成一些圓形、三角形等,讓電腦更好識(shí)別出放在它面前的是什么樣的東西。

  但是不同的貓?jiān)诓煌膱D片中都有所不同,所以是否每次都要重新設(shè)計(jì)一個(gè)模型,讓電腦能夠識(shí)別出不同姿勢(shì)的貓?為了讓不同的貓都能被計(jì)算機(jī)識(shí)別出來(lái),我們需要設(shè)計(jì)無(wú)數(shù)的模型。所以很多年來(lái)我們都想找到一個(gè)非常神奇的數(shù)字模型,它能夠滿(mǎn)足不同的貓的變形體。

  孩子學(xué)習(xí)的啟發(fā):

  從大量數(shù)據(jù)中學(xué)習(xí)

  八年前,一個(gè)很簡(jiǎn)單但重要的事情然我的思維得到了非常大的改變,那就是從孩子學(xué)習(xí)的過(guò)程中得到了靈感,因?yàn)槲覀儾](méi)有告訴一個(gè)孩子你要怎樣認(rèn)出一只貓,我們沒(méi)告訴他貓是這個(gè)樣子,哪里是三角形、圓形,他們只是靠經(jīng)驗(yàn)學(xué)習(xí)。如果我們把孩子的眼睛看作一對(duì)最簡(jiǎn)單的生物照相機(jī),他們每秒鐘可以拍照5次,到3歲的時(shí)候,孩子們已經(jīng)看過(guò)了成百上千萬(wàn)張世界各樣的照片。所以,在我們找到更好的算法之前,我們需要給計(jì)算機(jī)進(jìn)行像孩子們大腦發(fā)育時(shí)期一樣的訓(xùn)練,也即是給計(jì)算機(jī)比目前領(lǐng)域內(nèi)所使用得多得多的訓(xùn)練數(shù)據(jù)集。

  我們花了很多時(shí)間來(lái)做這項(xiàng)研究。我和普林斯頓的同事一起在網(wǎng)絡(luò)上找到了很多圖片、很多數(shù)據(jù),我們用了成百上千的圖片構(gòu)建這套系統(tǒng)。在三年的辛勤研究后,2009年我們終于做出了這樣一個(gè)體系,其中包括1500萬(wàn)張圖片和22000個(gè)不同的單詞門(mén)類(lèi),都是我們?nèi)粘R?jiàn)到的,從數(shù)量和質(zhì)量來(lái)說(shuō),這個(gè)系統(tǒng)在計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)方面都是前所未有的,我們也因此在解決計(jì)算機(jī)物體識(shí)別這個(gè)問(wèn)題上,比以往任何時(shí)候都準(zhǔn)備充分。

  從孩子的角度,我們獲取了寶貴的第一課,從大量數(shù)據(jù)中學(xué)習(xí)。

  來(lái)自大腦的靈感:

  卷積神經(jīng)網(wǎng)絡(luò)

  這一圖片庫(kù)提供的豐富資料也完美適配卷積神經(jīng)網(wǎng)絡(luò),這是最初由70、80年代代科學(xué)家們開(kāi)拓的一個(gè)領(lǐng)域,其靈感來(lái)自大腦。

  就像我們的大腦一樣,卷積神經(jīng)網(wǎng)絡(luò)有成百上千個(gè)“類(lèi)神經(jīng)元”單位互相連接在一起。

  這是一個(gè)非常經(jīng)典的放在電腦上的神經(jīng)系統(tǒng),它大概有2400萬(wàn)個(gè)節(jié)點(diǎn),1.4億個(gè)參數(shù)和150億個(gè)接口。

  擁有這么龐大的信息的圖片庫(kù),卷積神經(jīng)網(wǎng)絡(luò)算法以難以預(yù)料到的速度迅速發(fā)展了起來(lái),也在物品識(shí)別上給我們帶來(lái)了一些非常振奮人心的結(jié)果。

  電腦告訴我們這張照片里有一只貓,這個(gè)貓?jiān)谀抢?這邊是計(jì)算機(jī)告訴我們,小孩拿著他的泰迪熊。我們看到的物體都比較小,但電腦還是能夠識(shí)別出來(lái)。

  截止到目前,我們都一直專(zhuān)注于教電腦怎樣識(shí)別物體,就像小孩學(xué)最簡(jiǎn)單的單詞一樣,這只是第一步,小孩很快會(huì)進(jìn)入下一階段的發(fā)展,那就是用句子交流。

  所以要教電腦看懂圖片,并且用一句話(huà)來(lái)描述它,我們其實(shí)需要用到神經(jīng)系統(tǒng),并且把神經(jīng)系統(tǒng)推向一個(gè)高度,我們需要把視覺(jué)信息和文本信息結(jié)合起來(lái),并且讓它生成出一句具有意義的句子。

  又經(jīng)過(guò)一個(gè)階段的努力研究,大概是一年半以前,我們成為了第一批通過(guò)深度學(xué)習(xí)讓電腦在看到圖片后告訴我們一些信息的實(shí)驗(yàn)室。

  之后我們把圖片獲取的能力和視覺(jué)識(shí)別結(jié)合起來(lái),我們發(fā)現(xiàn)針對(duì)一張圖片,計(jì)算機(jī)其實(shí)可以生成很多句不同的話(huà),能夠提供給我們更多信息。這是我們最近的一項(xiàng)工作,大概是一年半之前出版發(fā)表的,電腦能夠在一幅畫(huà)中整理出非常多的句子。

  我們也在近期提交了另外一篇論文,這篇論文中提到,計(jì)算機(jī)能夠用算法生成出完整的自然段。

  得到大腦的啟發(fā)之后,我們發(fā)現(xiàn)深度學(xué)習(xí)的算法和公式能夠幫助我們做一些視覺(jué)方面的檢測(cè),

  這是從人腦這個(gè)視角得到的啟發(fā)。

  從技術(shù)從業(yè)者的視角:

  讓真實(shí)世界從中獲益

  在神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)技術(shù)得到如此大的發(fā)展之后,我們也開(kāi)始把焦點(diǎn)轉(zhuǎn)向其它一些視覺(jué)領(lǐng)域,比如視頻,我們?cè)趫D片識(shí)別中學(xué)習(xí)到的東西能否復(fù)制到視頻中去,能否讓真實(shí)世界從中獲益。

  我的實(shí)驗(yàn)室和谷歌的團(tuán)隊(duì)合作,把1百萬(wàn)YouTube上500種運(yùn)動(dòng)相關(guān)的視頻都抓取出來(lái),它們分別屬于不同的運(yùn)動(dòng)類(lèi)別,我們希望有一天這樣的技術(shù)能夠幫助我們?nèi)ス芾?、索引和搜索大量的視頻和圖片,能夠在一個(gè)大數(shù)據(jù)的庫(kù)存中進(jìn)行圖片和視頻的搜索。

  最近我們和Facebook進(jìn)行了合作,進(jìn)一步擴(kuò)展了我們工作的范圍,不僅僅能夠讓機(jī)器識(shí)別出視頻中運(yùn)動(dòng)的類(lèi)型,而且可以看看單個(gè)隊(duì)員做了哪些事情。在NBA的籃球視頻中,機(jī)器可以追蹤每個(gè)隊(duì)員在重要事件中(的表現(xiàn)),譬如三分球,罰球,可以看到隊(duì)員在其中的表現(xiàn)。

  我們拿了一些醫(yī)院的安檢視頻,通過(guò)深度傳感器的視頻來(lái)進(jìn)行分析應(yīng)用,通過(guò)這樣可以識(shí)別出人類(lèi)的肢體活動(dòng),看看他們?cè)诃h(huán)境下的行為是安全的還是危險(xiǎn)的。

  另外一項(xiàng)工作中,我們和歐洲一個(gè)火車(chē)站進(jìn)行了合作,將成百上千個(gè)傳感器安裝在公共空間,利用這些計(jì)算機(jī)的傳感器來(lái)追蹤每個(gè)乘客的行動(dòng),有非常多的乘客每天、每周、每年在火車(chē)站穿梭,通過(guò)這樣一種監(jiān)測(cè)可以幫助優(yōu)化火車(chē)站的空間,調(diào)整火車(chē)發(fā)車(chē)時(shí)段。

  最近我們利用了深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)讓機(jī)器學(xué)習(xí)如何預(yù)測(cè)人類(lèi)行為的軌跡,這項(xiàng)工作的有趣之處在于能夠把我們前邊所討論的問(wèn)題結(jié)合在一起,這樣,算法不僅有IQ——可以識(shí)別出人,而且它也有EQ,有情商——可以預(yù)測(cè)人的社會(huì)行為,譬如說(shuō)機(jī)器人的行為:機(jī)器人不應(yīng)該干擾人的行為,或者是機(jī)器人在空間行走時(shí)不能打破東西。

  我們利用所有這些技術(shù)和現(xiàn)實(shí)中的情況進(jìn)行合作,現(xiàn)在我們和斯坦福醫(yī)院合作,部署相關(guān)技術(shù),可以提高他們工作流程的績(jī)效、洗手的習(xí)慣,在老人的家庭中也可以對(duì)他們進(jìn)行類(lèi)似的監(jiān)測(cè)。

  從技術(shù)從業(yè)者的視角看到計(jì)算機(jī)視覺(jué)算法的發(fā)展,真的讓我感到特別興奮,它能夠幫助我們解決現(xiàn)實(shí)世界的問(wèn)題。

  這是一個(gè)技術(shù)從業(yè)者的視角。

  從教育者和母親的視角:

  AI需要多樣化

  5億年前,動(dòng)物和視覺(jué)面臨的挑戰(zhàn)是存活下來(lái),而現(xiàn)在機(jī)器視覺(jué)和AI所面臨的挑戰(zhàn)就是讓人類(lèi)能夠繁榮,永遠(yuǎn)持續(xù)下去。作為技術(shù)從業(yè)者我們要問(wèn),AI是否會(huì)成為一種摧毀力?還是能給我們帶來(lái)更好的世界?

  我一直在思考這個(gè)問(wèn)題,已經(jīng)思考很久了,最近我突然頓悟,AI的世界是位于那些創(chuàng)造、開(kāi)發(fā)和使用AI的人的手中。

  人工智能AI會(huì)改變世界,但這里真正的問(wèn)題是,誰(shuí)會(huì)改變AI。

  大家都知道,世界各地都是缺乏多樣性的,包括美國(guó)的硅谷,中國(guó)、歐洲,還有很多其它區(qū)域都缺乏多樣性,在美國(guó)學(xué)術(shù)界只有25%的計(jì)算機(jī)專(zhuān)業(yè)人士是女性,不到15%的美國(guó)領(lǐng)先工程學(xué)校的教職員工是女性,對(duì)于少數(shù)族裔來(lái)說(shuō),女性的代表就更少了,產(chǎn)業(yè)界也面臨著同樣的情況。這里不僅涉及到工作場(chǎng)所文化的問(wèn)題,實(shí)際上這個(gè)問(wèn)題也是經(jīng)濟(jì)和公共財(cái)產(chǎn)的問(wèn)題。

  幾個(gè)月前我受邀美國(guó)白宮討論了在AI中多樣性的必要性,我指出有三個(gè)理由使我們必須要提高AI的多樣性。

  第一個(gè)就是涉及到經(jīng)濟(jì)和勞動(dòng)力的原因:AI人工智能是一個(gè)日益增長(zhǎng)的技術(shù),會(huì)影響到每個(gè)人,我們需要更多人能開(kāi)發(fā)出更好的技術(shù);

  第二個(gè)原因是涉及到創(chuàng)造力和創(chuàng)新:很多研究都顯示出,當(dāng)擁有多種多樣背景的人共同合作時(shí),會(huì)產(chǎn)生更好的結(jié)果,會(huì)找到更具有創(chuàng)意的解決方案;

  最后也是涉及到社會(huì)正義和道德價(jià)值的:當(dāng)各種各樣背景的人聚集到一起時(shí),他們有著各種各樣不同的價(jià)值觀,代表著人類(lèi)的技術(shù)也會(huì)有更加多樣性的思考。

  視覺(jué)和智能的發(fā)展造成了動(dòng)物品種多樣性在5億年前大爆炸式的增長(zhǎng),現(xiàn)在如果我們能夠讓更多的人參與到AI教育和研究當(dāng)中,我們可以鼓勵(lì)更多技術(shù)多樣化的發(fā)展,這樣我們會(huì)看到技術(shù)發(fā)現(xiàn)上的寒武紀(jì)大爆炸,會(huì)使我們的世界變得更好。

  這是一位教育家和一位母親的視角。

  謝謝各位!

??? 注:本稿件摘自數(shù)據(jù)觀入駐自媒體-大數(shù)據(jù)文摘,轉(zhuǎn)載請(qǐng)注明來(lái)源,百度搜索“數(shù)據(jù)觀”獲取更多大數(shù)據(jù)資訊。

責(zé)任編輯:湯德正

分享: