來源:數(shù)據(jù)科學(xué)淺談 時間:2017-02-08 10:20:45 作者:田軍
導(dǎo)讀:今天和大家分享一下筆者關(guān)于兩個熱點“學(xué)習(xí)遷移”和“遷移學(xué)習(xí)”的認(rèn)識,以及遷移學(xué)習(xí)在大數(shù)據(jù)領(lǐng)域的重要意義。本文部分文字內(nèi)容來源自其它專家或網(wǎng)絡(luò),在此聲明感謝。
——
關(guān)于學(xué)習(xí)遷移
——
我們先來看一下網(wǎng)絡(luò)上比較通用的一種表達(dá):“學(xué)習(xí)遷移即一種學(xué)習(xí)對另一種學(xué)習(xí)的影響,它廣泛地存在于知識、技能、態(tài)度和行為規(guī)范的學(xué)習(xí)中。任何一種學(xué)習(xí)都要受到學(xué)習(xí)者已有知識經(jīng)驗、技能、態(tài)度等的影響,只要有學(xué)習(xí),就有遷移。遷移是學(xué)習(xí)的繼續(xù)和鞏固,又是提高和深化學(xué)習(xí)的條件,學(xué)習(xí)與遷移不可分割。”
以上這段話是不是太繞了?通俗的說,學(xué)習(xí)遷移就是把學(xué)習(xí)一種知識的經(jīng)驗運用在學(xué)習(xí)另一種知識中,從而快速建立起新領(lǐng)域的知識和能力。古語所說的“舉一反三”、“觸類旁通”就是典型的學(xué)習(xí)遷移。舉一反三來自《論語·述而》,孔子曾對他的學(xué)生說:“舉一隅,不以三隅反,則不復(fù)也?!币馑际钦f“我舉出一個方面,你們應(yīng)該要能靈活的推想到另外幾個方面,如果不能的話,我也不會再教你們了?!焙髞砭桶芽鬃诱f的這段話變成了“舉一反三”這句成語,意思是說學(xué)一件東西,要可以靈活地思考,運用到其他相類似的東西上。
那么學(xué)習(xí)的遷移是不是一定可行呢,其實不然,學(xué)習(xí)的遷移有一定的影響因素和理論基礎(chǔ)。
主要影響因素:
學(xué)習(xí)遷移的效果在一定程度上取決于學(xué)習(xí)材料之間的共同因素。由于材料之間存在著共同的因素,就會產(chǎn)生相同的反映,因而在學(xué)習(xí)中就會產(chǎn)生不同程度的遷移。
對學(xué)習(xí)材料的概括水平,蘇聯(lián)著名心理學(xué)家魯賓斯坦(C.Л.Pyбцнusтеǔн)強(qiáng)調(diào),概括是遷移的基礎(chǔ)。
知識的組織結(jié)構(gòu)和受眾的認(rèn)知結(jié)構(gòu),知識教材是學(xué)習(xí)的基本材料,其科學(xué)的基本結(jié)構(gòu)有助于學(xué)習(xí)的遷移。
學(xué)習(xí)的指導(dǎo)和訓(xùn)練,形式訓(xùn)練說假定,人類大腦的許多區(qū)域代表了許多不同的官能。人的心智是由許多不同的官能組成的,不同的官能活動相互配合就構(gòu)成各種各樣的心理活動。各種官能可以像訓(xùn)練肌肉一樣通過練習(xí)增加力量(能力)。
「學(xué)習(xí)的遷移(順向、逆向作用)」
主要理論基礎(chǔ)與分類(7類):
?。?)正負(fù)零:正遷移,一種學(xué)習(xí)對另一種學(xué)習(xí)起到積極的促進(jìn)作用,例如:學(xué)習(xí)數(shù)學(xué)有利于學(xué)習(xí)物理,學(xué)習(xí)珠算有利于學(xué)習(xí)心算;負(fù)遷移,兩種學(xué)習(xí)之間互相干擾、阻礙,例如:方言影響普通話的學(xué)習(xí);零遷移,兩種學(xué)習(xí)間不存在直接的互相影響。
?。?)順向逆向:順向遷移,先前的學(xué)習(xí)對后來學(xué)習(xí)的影響,例如:舉一反三;逆向遷移,后來的學(xué)習(xí)對先前學(xué)習(xí)的影響。
?。?)一般具體(也稱非特殊遷移與特殊遷移):一般遷移,一種習(xí)得的一般原理、方法、策略或態(tài)度遷移到另一種學(xué)習(xí)中去,例如:獲得基本的運算技能、閱讀技能以后,運用到各種具體的學(xué)科學(xué)習(xí)中;具體遷移,一種學(xué)習(xí)中的具體特殊性經(jīng)驗直接運用到另一種學(xué)習(xí)中。
?。?)近遠(yuǎn)自動:自遷移,個體所學(xué)的經(jīng)驗影響著相同情景中的任務(wù)操作;近遷移,把所學(xué)的經(jīng)驗遷移到與原初學(xué)習(xí)情景相似的情境中;遠(yuǎn)遷移,把所學(xué)的經(jīng)驗遷移到與原初學(xué)習(xí)情景極不相似的情境中,例如:課堂知識運用到社會實踐。
(5)水平垂直:水平遷移,處于同一抽象和概括水平的經(jīng)驗之間相互影響;垂直遷移,先前學(xué)習(xí)內(nèi)容與后續(xù)學(xué)習(xí)內(nèi)容是不同水平的學(xué)習(xí)活動之間的遷移。
?。?)低通高通:低通路遷移,反復(fù)練習(xí)的技能自動化地遷移,例如:開過自家車的人可以輕松的開從朋友那兒借來的車;高通路遷移,有意識地將習(xí)得的抽象知識運用到新的情境中,例如:學(xué)習(xí)教育學(xué)時想到這些原理將會在之后的教育教學(xué)實踐中應(yīng)用。
(7)同化性、順應(yīng)性、重組性遷移(根據(jù)遷移過程中所需要的內(nèi)在心理機(jī)制不同):同化性遷移,直接將原有的認(rèn)知經(jīng)驗應(yīng)用到本質(zhì)特征相同的一類事物中去;順應(yīng)性遷移,將原有認(rèn)知經(jīng)驗運用于新情境中時,需要調(diào)整原有的經(jīng)驗或?qū)π陆?jīng)驗加以概括,形成一種能包容新舊經(jīng)驗的更高一層的認(rèn)知結(jié)構(gòu),以適應(yīng)外界變化;重組性遷移,重新組合原有認(rèn)知結(jié)構(gòu)中某些構(gòu)成要素或或成分,調(diào)整各成分間的關(guān)系或建立新的關(guān)系,從而應(yīng)用于新情境。
以上,使大家簡單地了解了學(xué)習(xí)的遷移,下面我們來談一談遷移學(xué)習(xí)。
——
關(guān)于遷移學(xué)習(xí)
——
我們先來看一下網(wǎng)絡(luò)上一種比較通用的說法,又說該說法來自香港科技大學(xué)楊強(qiáng)教授:“遷移學(xué)習(xí)即在源領(lǐng)域已經(jīng)擁有大量數(shù)據(jù),并且在源領(lǐng)域能對數(shù)據(jù)進(jìn)行很好的應(yīng)用建立了模型后,我們換一個領(lǐng)域也能讓它使用,這樣既節(jié)省了資源,又打到時間和效果的好處,就叫做遷移學(xué)習(xí)。這就很想人的舉一反三的學(xué)習(xí)能力,比如我們學(xué)會騎自行車以后,我們又去學(xué)摩托車,發(fā)現(xiàn)很簡單,我們打球、學(xué)語言、學(xué)物理化學(xué)也有很多這樣的例子。
實現(xiàn)遷移學(xué)習(xí)的方法有四種:1)樣本遷移;2)特征遷移;3)基于模型的遷移學(xué)習(xí);4)通過關(guān)系進(jìn)行遷移,比如社交網(wǎng)絡(luò)?!?/p>
楊強(qiáng)教授在研究過程中,詳細(xì)闡述了機(jī)器學(xué)習(xí)領(lǐng)域:深度學(xué)習(xí)(DeepLearning)、強(qiáng)化學(xué)習(xí)(Reinforcement Learning)、遷移學(xué)習(xí)(Transfer Learning)的差異,如圖:
「深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)的差異」
深度學(xué)習(xí)主要強(qiáng)調(diào)的是特征,強(qiáng)化學(xué)習(xí)主要強(qiáng)調(diào)的是反饋,而遷移學(xué)習(xí)主要強(qiáng)調(diào)的是適應(yīng)。
深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí),在大樣本數(shù)據(jù)、數(shù)據(jù)總量豐富的情景下具有重要的意義,但在小樣本數(shù)據(jù)下卻很難發(fā)揮應(yīng)應(yīng)有的價值。
遷移學(xué)習(xí)則在小樣本數(shù)據(jù)情況下,具有特別重要意義。
——
遷移學(xué)習(xí)在大數(shù)據(jù)領(lǐng)域的重要意義
——
制約行業(yè)大數(shù)據(jù)快速發(fā)展和應(yīng)用的一個特別嚴(yán)重的問題,就是在某些領(lǐng)域的既有數(shù)據(jù)量不足,如歷史數(shù)據(jù)沒有留存,又如缺乏有效的數(shù)據(jù)整理等等,總之由于數(shù)據(jù)量的不足就導(dǎo)致了無法根據(jù)已有的樣本數(shù)據(jù)快速的進(jìn)行機(jī)器學(xué)習(xí)和建模。
遷移學(xué)習(xí)可以有效解決上述難題,筆者從事和研究大數(shù)據(jù)應(yīng)用在行業(yè)領(lǐng)域如何落地已有多年,深有感觸。
數(shù)據(jù)量不足的問題:比如客戶剛剛構(gòu)建了一個電商平臺,針對某款產(chǎn)品售賣,沒有任何的數(shù)據(jù),就無法建立模型對用戶行為進(jìn)行分析以及進(jìn)行個性化推薦。一般來說,用戶買一種貨品還會買另一種貨品,但如果知道客戶在另外一個領(lǐng)域已經(jīng)構(gòu)建了很好的模型,這個模型又與新的業(yè)務(wù)比較類似,就可以通過遷移學(xué)習(xí)將模型遷移到新電商平臺中,達(dá)到快速應(yīng)用的目的??傮w來說,就是有兩個領(lǐng)域,一個領(lǐng)域已經(jīng)有很多的數(shù)據(jù),能成功地建一個模型,有一個領(lǐng)域數(shù)據(jù)不多,但是和前面那個領(lǐng)域是關(guān)聯(lián)的,就可以把那個模型給遷移過來。
行業(yè)個性化的問題:比如金融領(lǐng)域的客戶,他們都希望在通用的大數(shù)據(jù)高級分析模型的基礎(chǔ)上,構(gòu)建屬于自己獨有的模型,這個模型來源于共知模型又區(qū)別于共知模型,還需要快速進(jìn)行構(gòu)建和應(yīng)用,對于此就可以通過遷移學(xué)習(xí)來有效解決這類問題。
對于遷移學(xué)習(xí)來說,大數(shù)據(jù)分析模型如何有效管理并快速應(yīng)用在其他領(lǐng)域是遷移學(xué)習(xí)最為關(guān)鍵的問題,而選擇一款有效的工具則是解決問題的關(guān)鍵所在。
這里為大家介紹一款工具,東軟依托在25年的行業(yè)解決方案開發(fā)經(jīng)驗的基礎(chǔ)上,對各個行業(yè)深入理解,融合了當(dāng)前最領(lǐng)先的大數(shù)據(jù)相關(guān)技術(shù),推出了一款產(chǎn)品:SaCa RealRec數(shù)據(jù)科學(xué)平臺,這款平臺產(chǎn)品也是以筆者所在BU為核心來研發(fā)和交付的,它可以有效的解決遷移學(xué)習(xí)的問題。
「SaCa RealRec數(shù)據(jù)科學(xué)平臺產(chǎn)品組成」
SaCa RealRec數(shù)據(jù)科學(xué)平臺軟件:
SaCa RealRec數(shù)據(jù)科學(xué)平臺是聚焦大數(shù)據(jù)智能戰(zhàn)略的分析挖掘平臺及服務(wù)。整個系統(tǒng)基于分布式批處理框架、分布式內(nèi)存處理框架、分布式流數(shù)據(jù)實時框架以及大規(guī)模機(jī)器學(xué)習(xí)算法庫等大數(shù)據(jù)科學(xué)相關(guān)技術(shù),提高企業(yè)構(gòu)建智能應(yīng)用的能力及效率,簡化復(fù)雜機(jī)器學(xué)習(xí)算法的使用成本,從而幫助企業(yè)實現(xiàn)數(shù)據(jù)驅(qū)動的商業(yè)模式。可以將大數(shù)據(jù)分析模型沉淀為企業(yè)的知識資產(chǎn)進(jìn)行有效的管理,從而可以進(jìn)行快速的遷移學(xué)習(xí)和訓(xùn)練,應(yīng)用到其它相關(guān)的領(lǐng)域。
作為數(shù)據(jù)科學(xué)平臺,產(chǎn)品系統(tǒng)提供了標(biāo)準(zhǔn)的數(shù)據(jù)挖掘流程,包括數(shù)據(jù)采集、特征抽取、模型訓(xùn)練、評估評測以及部署應(yīng)用五大關(guān)鍵功能。
「SaCa RealRec數(shù)據(jù)科學(xué)平臺」
以上,筆者與大家分享了關(guān)于兩個熱點“學(xué)習(xí)遷移”和“遷移學(xué)習(xí)”的認(rèn)識,以及遷移學(xué)習(xí)在大數(shù)據(jù)領(lǐng)域的重要意義。期望本文能為大家?guī)韼椭?/p>
作者簡介
田軍,大連理工大學(xué)碩士,現(xiàn)任東軟集團(tuán)先行產(chǎn)品研發(fā)事業(yè)部咨詢總監(jiān),在平臺產(chǎn)品及企業(yè)信息化領(lǐng)域從業(yè)十多年,曾在東軟集團(tuán)基礎(chǔ)軟件事業(yè)部、東軟云科技有限公司任職,目前專注于數(shù)據(jù)科學(xué)、人工智能等領(lǐng)域的研究,主要研究大數(shù)據(jù)項目如何在行業(yè)進(jìn)行落地,服務(wù)過數(shù)百家行業(yè)領(lǐng)導(dǎo)者客戶,在大數(shù)據(jù)、云計算、數(shù)據(jù)中心、企業(yè)應(yīng)用平臺、業(yè)務(wù)流程管理、企業(yè)信息化集成等領(lǐng)域具有多年實戰(zhàn)經(jīng)驗。
注:本文系「數(shù)據(jù)科學(xué)淺談」投稿授權(quán)數(shù)據(jù)觀發(fā)布,作者:田軍,版權(quán)著作權(quán)屬原創(chuàng)者所有,禁止二次轉(zhuǎn)載,如需轉(zhuǎn)載務(wù)必申請授權(quán)。編輯: Fynlch(王培),數(shù)據(jù)觀微信公眾號(ID:cbdioreview),欲了解更多大數(shù)據(jù)行業(yè)相關(guān)資訊,可搜索數(shù)據(jù)觀(中國大數(shù)據(jù)產(chǎn)業(yè)觀察網(wǎng)www.21jieyan.cn)進(jìn)入查看。
責(zé)任編輯:王培