精品无人区无码乱码毛片国产_性做久久久久久免费观看_天堂中文在线资源_7777久久亚洲中文字幕

首頁 自媒自媒體大數(shù)據(jù)文摘正文

用機(jī)器學(xué)習(xí)經(jīng)驗(yàn)指導(dǎo)人生:如何實(shí)現(xiàn)學(xué)習(xí)效率最大化

原作者 | Raimundo Manterola

編譯團(tuán)隊(duì) |大數(shù)據(jù)文摘-Aileen,黃文暢,范玥燦

  果要是我告訴你我們可以依照“訓(xùn)練”電腦的經(jīng)驗(yàn)來指導(dǎo)人類學(xué)習(xí)新的技能,你覺得怎么樣?

  在這篇文章中我不會太深入的分析機(jī)器學(xué)習(xí)是如何工作的。但是,在介紹如何把AI應(yīng)用于你自身的學(xué)習(xí)之前,我希望你能了解一些基本的概念。

  我們都喜歡狗狗的照片,它們讓我們想起那些與這些這些四條腿的小伙伴們一起玩耍度過的清晨。

  我們可以很容易的在照片中認(rèn)出狗狗,因?yàn)槲覀円呀?jīng)看過千百次它們長什么樣子。

  可是如果一個(gè)外星人因?yàn)楹闷婀饭烽L什么樣而綁架你,你會怎么辦?他強(qiáng)迫你教他如何識別狗狗,這樣他就可以綁架一只帶回他的星球。

  請記住,他完全不知道狗狗長什么樣。你要怎么做?

  你可能需要告訴交給他一些“規(guī)則”:狗狗有四條腿,兩只眼睛,兩只耳朵…可是,這可能沒有想象的那么容易,因?yàn)橛泻芏嗪芏嗟囊?guī)則。試想一下,你要怎么教會他區(qū)別狗狗和狼?這真的很難。

  這個(gè)設(shè)定一些規(guī)則并照之遵守以得到想要結(jié)果的學(xué)習(xí)過程叫做 “演繹學(xué)習(xí)”??墒请y點(diǎn)就在于很難顧全所有的可能的變化。

  想象一下,除了展示給他一千張狗狗的照片,另外如果給讓他看一千張照片都不是狗狗的照片。那事情就變得容易很多了!

  我們?nèi)祟愓沁@么學(xué)習(xí)的。通過千百次的觀察我們知道了狗狗長什么樣。當(dāng)我們的大腦看到一些它可以認(rèn)知的東西的時(shí)候,某些神經(jīng)區(qū)域就會顯示出逐漸增加的活躍性。但根據(jù)國家研究委員會出版的《人們?nèi)绾螌W(xué)習(xí)》一書,人類在出生時(shí)并沒有這些神經(jīng)特征。隨著年齡的增長,有了越來越多的經(jīng)驗(yàn),我們的大腦就開始整理如何建立這些聯(lián)系。

  神奇的是,機(jī)器學(xué)習(xí)正是這么工作的。當(dāng)建立一個(gè)機(jī)器學(xué)習(xí)模型的時(shí)候,我們不會教他“規(guī)則”。而是提供給誒他大量的案例,有的可以得到想要的結(jié)果,有的不可以,然后就讓電腦自己整理,就像我們的大腦會做的一樣。

  大部分人認(rèn)為AI是一個(gè)使工作自動化的工具,可是讓人們專注于建立像人類行為一樣的算法理論。舉例來說,臉書(Facebook)的面部識別算法理論比人類的識別能力還要強(qiáng)??墒侨绻覀兎聪蚨鵀槟兀?/p>

  機(jī)器學(xué)習(xí)是如何工作的?

  假設(shè)沒有空調(diào)也沒有泳池的你實(shí)在是難以忍受這炎熱的夏天,你決定在鄰居不在家的時(shí)候偷偷的潛入他家用他的泳池。

  你已經(jīng)知道大多數(shù)時(shí)候他都不在家,因?yàn)樗蚓W(wǎng)球。所以你決定應(yīng)用你的AI技能來建模,根據(jù)天氣挺起情況預(yù)測他是否會打網(wǎng)球。

  經(jīng)過幾周對他的觀察他和并收集了相關(guān)數(shù)據(jù),你總結(jié)了如下表格:

  既然你有了好的、有代表性的數(shù)據(jù),你便可以開始建模。

  有很多種不同的方法,我將用一種叫做決策樹的技巧來簡單講解歸類問題。

  你覺得在上圖表格中哪個(gè)那個(gè)變量會影響你鄰居要不要打網(wǎng)球的決策?可能是天氣情況。

  要弄清如何構(gòu)建決策樹,我們的模型會找出哪那些變量可以將數(shù)據(jù)最好的分割開來。把天氣情況放在決策樹的根部,然后我們就可以開始用同樣的方法來建立更多的枝杈,直到?jīng)Q策樹看起來如下圖:

  訓(xùn)練完模型之后,我們就會得到一個(gè)可以幫助我們預(yù)測鄰居是否在家的決策樹。

  你可能會想:“這到底會怎么幫助我學(xué)習(xí)一個(gè)新的技能?”

  如果你想要訓(xùn)練一個(gè)好的理論可以用來使你的學(xué)習(xí)收益最大化,有一些主要的規(guī)則需要遵守。

  如果你想了解更多關(guān)于機(jī)器學(xué)習(xí)的知識,這里有一些很棒的資源。

   練習(xí),練習(xí),再練習(xí)——收集大量的數(shù)據(jù)

  “

  不是當(dāng)你已經(jīng)優(yōu)秀了才去練習(xí),而是不斷地練習(xí)幫助你變得優(yōu)秀。

  ——Malcolm Gladwell

  ”

  這一條比較簡單——練習(xí)的越多,你就會變得越好。

  我們都聽過“大數(shù)據(jù)”這個(gè)時(shí)下很火的詞??墒侵挥泻苌俚娜苏娴牧私馑嬲暮x。根據(jù)牛津詞典的解釋,大數(shù)據(jù)是:極其大的數(shù)據(jù)集,需要用計(jì)算機(jī)來分析并展現(xiàn)出它的特征、趨勢和聯(lián)系,尤其是與人類行為相關(guān)的部分。

  大數(shù)據(jù)是用很多很多的例子來訓(xùn)練一個(gè)模型。

  根據(jù)牛津關(guān)于技能學(xué)習(xí)的神經(jīng)機(jī)制的研究,當(dāng)我們開始學(xué)習(xí)一些新東西,這個(gè)過程中包含了很多神經(jīng)活動。但當(dāng)我們反復(fù)練習(xí)同一個(gè)任務(wù)的時(shí)候,每一次完成他所需要的腦力就會逐漸減少。

  當(dāng)你建一個(gè)機(jī)器學(xué)習(xí)的模型時(shí),這會很大程度上決定你算法表現(xiàn)的好壞。你需要很多很多的案例才能得到一個(gè)好的模型。相較于給外星人看幾張照片,給他看更多的案例會讓他學(xué)習(xí)的更好。

  “

  但是不變的是,基于大量的數(shù)據(jù)建立簡單的模型勝過只有少量數(shù)據(jù)的復(fù)雜模型。

  ——Alon Halevy, Peter Norvig, and Fernando Pereira, Google. The unreasonable effectiveness of data.

  ”

  我們花了很多時(shí)間來學(xué)習(xí)相關(guān)的課題,比如閱讀,看視頻,向人們請教等,但在真正上手練習(xí)之前還是會猶豫很久。

  唯一能讓你有所提高的辦法就是去實(shí)踐。

  ◆ 不要死記硬背:避免過度擬合

  回顧在學(xué)生時(shí)代的時(shí)候,你是否又有因?yàn)樗烙浻脖衬硞€(gè)數(shù)學(xué)題目的解法,卻因?yàn)榭荚囍械念}目與記下來的題目稍有不同而解不出來?這其實(shí)是同樣的概念,那一點(diǎn)點(diǎn)的不同就可以讓你的方法一文不值。

  如果你死記硬背一個(gè)流程同樣會如此,我們會失去將問題普適化、解決沒有見過的情形的能力。

  在機(jī)器學(xué)習(xí)過程中,這個(gè)叫過度擬合。當(dāng)你訓(xùn)練你的模型通過記憶來學(xué)習(xí),就會發(fā)生這樣的事情。 這其實(shí)很危險(xiǎn),因?yàn)槿缥覀內(nèi)绻猛瑯拥臄?shù)據(jù)集來測驗(yàn),可能會有100%的擬合度,但當(dāng)遇到?jīng)]有見過的問題的時(shí)候會表現(xiàn)的很差很差。

  當(dāng)我們知道有辦法可以點(diǎn)擊一下鼠標(biāo)就解決問題,就沒有必要死記硬背了。

  這就是為什么很多人學(xué)不會編程。他們會因?yàn)橛刑嗟臇|西去要記憶而失去信心??墒?,這正是問題本身——我知道的所有擅長編程的人都很會使用“谷歌”。

  根據(jù)Eric Mazui (哈佛大學(xué)物理學(xué)教授,同時(shí)也是Peer Instruction的作者)的研究,一個(gè)互動式的學(xué)習(xí)會讓學(xué)生對問題的理解力比死記硬背的學(xué)習(xí)高三倍。

  這個(gè)道理很簡單,強(qiáng)迫你自己在沒有指導(dǎo)的情況下學(xué)習(xí)。當(dāng)你自己弄明白了一些道理之后,你就可以回顧整個(gè)過程,這樣可以避免沒有理解就死記硬背。

  ◆ 給你的訓(xùn)練做適當(dāng)?shù)淖兓簻?zhǔn)備多樣、有代表性的數(shù)據(jù)

  我們通常會認(rèn)為不斷重復(fù)做同一件事會讓我們最終成為專家。即使我們從中取得進(jìn)步,但還有更快捷的方法。不只是練習(xí)本身,而是練習(xí)的方式。

  最關(guān)鍵的就是使學(xué)習(xí)有變化。

  最好的吉他手不只是演奏一個(gè)類型——這也是為什么搖滾明星不可能通過只玩搖滾而成為最卓越的演奏家。要達(dá)到他們的高度,需要不斷嘗試并練習(xí)不同的音樂類型。所有這些不同的類型的特質(zhì),會幫助吉他手成為全能大師。

  “

  如果不知道布魯士…就沒有辦法用吉他玩搖滾或是其他大眾音樂。

  ——Keith Richards

  ”

  要想在某一領(lǐng)域有所建樹,你不可以只是重復(fù)做同一件事。你必須要使得你做的事情有所變化,這樣才能有更普適的能力。

  用代表不同情形的數(shù)據(jù)來訓(xùn)練一個(gè)機(jī)器學(xué)習(xí)模型是至關(guān)重要的一點(diǎn)。

  如果你想教那個(gè)外星人朋友椅子長什么樣,就需要保證提供給他不同類型、不同視角的照片。

  下一次當(dāng)你想學(xué)習(xí)一項(xiàng)新的技能,嘗試盡可能的從不同的視角進(jìn)行學(xué)習(xí)。

  ◆ 不要重新發(fā)明輪胎:學(xué)會遷移學(xué)習(xí)

  在硅谷你會見到很多換了新的工作領(lǐng)域的人都做得非常好。有建筑師轉(zhuǎn)去做設(shè)計(jì)師,律師去做銷售代表,工程師去做市場營銷人員等等。有趣的是,他們都會發(fā)現(xiàn)有很多原來工作中的知識可以應(yīng)用到新的工作。

  在人工神經(jīng)網(wǎng)絡(luò)(主要用于圖像識別)領(lǐng)域有一個(gè)叫轉(zhuǎn)移學(xué)習(xí)的技巧。無須把全部的東西重建,你可以用以前訓(xùn)練過的相似的任務(wù)中的一部分放入新的任務(wù)。不難想象,這會幫助提高模型的表現(xiàn)并能節(jié)省很多時(shí)間。

  回想吉他演奏家的例子——如果你已經(jīng)知道如何彈鋼琴,可能對你來說學(xué)吉他就會容易很多。雖然是完全不同的樂器,但基礎(chǔ)的音樂素養(yǎng)是普適的。

  最重要的是學(xué)會利用大腦中已經(jīng)建立的聯(lián)系,將其應(yīng)用于不同的技能當(dāng)中。

  就像滑板的技能可以應(yīng)用于滑雪板一樣。

  通過應(yīng)用已知的知識,你可以快速的上手新的東西。

  機(jī)器學(xué)習(xí)不是什么新東西,已經(jīng)有幾十年了。這是一個(gè)緩慢的過程,而且現(xiàn)在逐漸開始可以看到回報(bào)了。現(xiàn)在我們有資源來創(chuàng)造一個(gè)巨大的影響。上一周我參加Gigaom AI 2017 會議,Jerry Kaplan形容說,從歷史上看,我們現(xiàn)在的這是時(shí)代可以和猶如之前輪子的發(fā)明發(fā)明輪子的革命般相提并論。

  既然你有一個(gè)大概的概念這些神秘的黑箱是如何運(yùn)作的,我鼓勵你去探索一下AI。我們不僅僅需要工程師和數(shù)據(jù)科學(xué)家,我們還需要懂得這幕后是如何運(yùn)作的、并將這科技的力量應(yīng)用于新的領(lǐng)域的人們。

  “

  AI是下一個(gè)猶如電的的發(fā)明般的存在,并會一直不斷的對一個(gè)又一個(gè)的行業(yè)進(jìn)行轉(zhuǎn)變。

  ——Andrew Ng

  ”

  原文來源:http://www.21jieyan.cn

  注:本稿件摘自入駐數(shù)據(jù)觀自媒體-大數(shù)據(jù)文摘,轉(zhuǎn)載請注明來源,百度搜索“數(shù)據(jù)觀”獲取更多大數(shù)據(jù)資訊。

責(zé)任編輯:王培

分享: