來(lái)源:云科技時(shí)代 時(shí)間:2017-07-04 15:30:04 作者:吳寧川
過(guò)去兩年出現(xiàn)了人工智能的熱潮,特別是以深度學(xué)習(xí)算法為代表人工智能在中國(guó)市場(chǎng)出現(xiàn)了井噴現(xiàn)象。根據(jù)麥肯錫統(tǒng)計(jì),2016年全球科技巨頭在人工智能上投入了200億到300億美元,VC/PE投融資達(dá)60億到90億美元。在中國(guó),根據(jù)鈦媒體TMTbase全球創(chuàng)投數(shù)據(jù)庫(kù)的數(shù)據(jù)統(tǒng)計(jì),目前共收錄中國(guó)人工智能企業(yè)398家、共發(fā)生571起投資事件,投資總額高達(dá)571億人民幣。
就在AlphaGo先后挑戰(zhàn)世界和中國(guó)圍棋高手后,關(guān)于人工智能的熱炒更有甚囂塵上的趨勢(shì),也有行業(yè)專家發(fā)出人工智能泡沫的警告。然而,人工智能泡沫現(xiàn)象卻有一個(gè)意想不到的效果。2017年6月24日,在由鈦媒體與大數(shù)據(jù)運(yùn)籌優(yōu)化公司杉數(shù)科技聯(lián)合舉辦的“鈦媒體AI大師圓桌會(huì)”中,來(lái)自美國(guó)與中國(guó)的頂級(jí)優(yōu)化算法專家均表示,人工智能熱帶動(dòng)了優(yōu)化算法的繁榮。
斯坦福大學(xué)李國(guó)鼎工程講座教授、華人運(yùn)籌學(xué)領(lǐng)袖、杉數(shù)科技首席科學(xué)顧問(wèn)葉蔭宇表示,機(jī)器學(xué)習(xí)算法強(qiáng)化了單體機(jī)器的智能,但在機(jī)器人群體協(xié)同工作時(shí)則需要“通盤考慮、統(tǒng)籌優(yōu)化”的優(yōu)化算法。正因?yàn)樵朴?jì)算、大數(shù)據(jù)與人工智能的井噴,才出現(xiàn)了超大規(guī)模的大數(shù)據(jù),而這正是優(yōu)化算法繁榮的基礎(chǔ),優(yōu)化算法的發(fā)展也將反過(guò)來(lái)推動(dòng)人工智能進(jìn)入新階段。
算法戰(zhàn)爭(zhēng)與戰(zhàn)爭(zhēng)算法
?。ㄉ蠄D為斯坦福大學(xué)李國(guó)鼎工程講座教授、杉數(shù)科技首席科學(xué)顧問(wèn)葉蔭宇)
2017年4月26日,美國(guó)防部在一份備忘錄中對(duì)“戰(zhàn)爭(zhēng)算法”進(jìn)行了描述,提出了“算法戰(zhàn)”概念,更為重要的是組建了“算法戰(zhàn)跨功能團(tuán)隊(duì)”,該團(tuán)隊(duì)將通過(guò)編寫人工智能、機(jī)器學(xué)習(xí)等代碼來(lái)改變作戰(zhàn)方式,比如利用人工智能對(duì)無(wú)人機(jī)采集的海量視頻數(shù)據(jù)進(jìn)行分析以獲得豐富的戰(zhàn)爭(zhēng)情報(bào)。
而早在二戰(zhàn)的時(shí)候,還沒(méi)有大數(shù)據(jù)甚至也沒(méi)有計(jì)算機(jī),在獲取數(shù)據(jù)的途徑、數(shù)量和速度都很有限的前提下,發(fā)源了對(duì)后來(lái)全球社會(huì)經(jīng)濟(jì)有廣泛影響的“戰(zhàn)爭(zhēng)算法”:運(yùn)籌學(xué)。葉蔭宇介紹說(shuō),運(yùn)籌學(xué)是一種研究?jī)?yōu)化的學(xué)問(wèn),就是對(duì)于所有的實(shí)際生活中出現(xiàn)的問(wèn)題,不是簡(jiǎn)單是找一個(gè)可行的方案,而且是一定要找到最優(yōu)的方案。用現(xiàn)代的話說(shuō),就是要把事情做到極致。
生活在1707年到1783年的著名瑞典數(shù)學(xué)家萊昂哈德·歐拉就曾說(shuō)過(guò):這個(gè)世界上的任何事情或事物都有最大值或最小值。在二戰(zhàn)中,盟軍使用數(shù)學(xué)模型解決各種作戰(zhàn)的最優(yōu)化問(wèn)題,包括雷達(dá)部署問(wèn)題、運(yùn)輸船隊(duì)的護(hù)航問(wèn)題、反潛深水炸彈投擲問(wèn)題、太平洋島嶼軍事物資存儲(chǔ)問(wèn)題、項(xiàng)目管理問(wèn)題等等,這些問(wèn)題的解決保障了最后的勝利。
二戰(zhàn)結(jié)束后,人們將運(yùn)籌學(xué)廣泛應(yīng)用到企業(yè)和政府之中,包括生產(chǎn)、服務(wù)、金融等行業(yè)。由于運(yùn)籌學(xué)源于解決現(xiàn)實(shí)世界中的決策問(wèn)題,因而后來(lái)涌現(xiàn)了大量運(yùn)籌學(xué)算法,運(yùn)籌學(xué)各重要分支得到快速發(fā)展,包括線性規(guī)劃、非線性規(guī)劃、整數(shù)規(guī)劃、組合規(guī)劃、圖論、網(wǎng)絡(luò)流、決策分析、排隊(duì)論、可靠性數(shù)學(xué)理論、庫(kù)存論、博弈論、搜索論等。
現(xiàn)代運(yùn)籌學(xué)利用統(tǒng)計(jì)學(xué)、數(shù)學(xué)模型和算法等方法,為復(fù)雜問(wèn)題尋找在滿足約束的條件下能夠最大化/最小化某一目標(biāo)的最優(yōu)決策,典型的應(yīng)用就是解決復(fù)雜巨系統(tǒng)的優(yōu)化決策問(wèn)題。復(fù)雜巨系統(tǒng)指的是規(guī)模巨大、構(gòu)成要素復(fù)雜、包含眾多子系統(tǒng)的系統(tǒng),如電力系統(tǒng)、城市交通網(wǎng)、數(shù)字通信網(wǎng)、柔性制造系統(tǒng)、水資源系統(tǒng)、社會(huì)經(jīng)濟(jì)系統(tǒng)等。
復(fù)雜巨系統(tǒng)性能的優(yōu)化將產(chǎn)生巨大的經(jīng)濟(jì)效益或社會(huì)效益,而其中運(yùn)籌學(xué)的應(yīng)用就能起到重要作用。比如工廠生產(chǎn)、貨物庫(kù)存、銷售中心和消費(fèi)區(qū)域等管理等,不能對(duì)各個(gè)環(huán)節(jié)孤立地進(jìn)行研究和管理,必須把這些環(huán)節(jié)連接起來(lái),以獲得全局優(yōu)化的運(yùn)行管理。
能夠解決復(fù)雜巨系統(tǒng)的優(yōu)化問(wèn)題,才是以運(yùn)籌學(xué)為代表的最優(yōu)化算法的最大價(jià)值,甚至對(duì)于一個(gè)國(guó)家來(lái)說(shuō)具有著戰(zhàn)略意義。從商業(yè)價(jià)值這個(gè)角度來(lái)說(shuō),大數(shù)據(jù)是從0到1、人工智能是從1到2、統(tǒng)計(jì)和運(yùn)籌優(yōu)化算法是從2到N。掌握了以運(yùn)籌學(xué)為代表的優(yōu)化算法,才能真正贏得未來(lái)的算法戰(zhàn)爭(zhēng)。
大數(shù)據(jù)時(shí)代下的商業(yè)決策
?。ㄉ蠄D為美國(guó)紐約大學(xué)助理教授陳溪)
葉蔭宇曾獲得美國(guó)運(yùn)籌與管理學(xué)會(huì)馮諾依曼理論獎(jiǎng)(運(yùn)籌管理學(xué)界最高獎(jiǎng)),也是迄今為止華人唯一獲獎(jiǎng)?wù)撸?014年美國(guó)應(yīng)用數(shù)學(xué)學(xué)會(huì)優(yōu)化大獎(jiǎng)(每三年評(píng)一人)、2012年國(guó)際數(shù)學(xué)規(guī)劃大會(huì)TsengLectureship獎(jiǎng)(每三年評(píng)一人),曾主持和參與美國(guó)波音、FICO、運(yùn)通、美國(guó)衛(wèi)生部、美國(guó)科學(xué)基金、美國(guó)能源部以及美國(guó)空軍科研部門等多個(gè)科研項(xiàng)目。
1982年葉蔭宇赴美深造,當(dāng)時(shí)人工智能經(jīng)歷了一小波高潮后,由于沒(méi)有大數(shù)據(jù)等現(xiàn)代技術(shù)的支撐,理論研究與商業(yè)應(yīng)用都處于停滯狀態(tài),但運(yùn)籌學(xué)則在各行各業(yè)方興未艾,從市場(chǎng)營(yíng)銷、生產(chǎn)計(jì)劃、庫(kù)存管理、物流運(yùn)輸、財(cái)政會(huì)計(jì)到人事管理、設(shè)備維修、工程最優(yōu)化、計(jì)算機(jī)與通信系統(tǒng)以及城市管理等都有廣泛的應(yīng)用。
隨著計(jì)算機(jī)技術(shù)高速發(fā)展,要解決的問(wèn)題規(guī)模不斷增大,運(yùn)籌學(xué)的應(yīng)用范圍也取得革命性的突破。大量算法、軟件產(chǎn)生,大數(shù)據(jù)時(shí)代給運(yùn)籌學(xué)進(jìn)一步帶來(lái)了生機(jī)——如何將大數(shù)據(jù)轉(zhuǎn)化為最優(yōu)決策成為運(yùn)籌學(xué)重點(diǎn)的課題。美國(guó)紐約大學(xué)助理教授、博士后師從機(jī)器學(xué)習(xí)之父MichaelIJordan(螞蟻金服智囊團(tuán)主席)的陳溪也認(rèn)為,大數(shù)據(jù)的出現(xiàn)推動(dòng)了機(jī)器學(xué)習(xí)、大規(guī)模統(tǒng)計(jì)推斷與運(yùn)籌學(xué)算法三大領(lǐng)域齊頭并進(jìn),由此形成了大數(shù)據(jù)驅(qū)動(dòng)下的商業(yè)決策。
葉蔭宇介紹了大數(shù)據(jù)驅(qū)動(dòng)下的商業(yè)決策的三個(gè)階段:基于數(shù)據(jù)收集與管理的描述型(Descriptive)決策,數(shù)據(jù)成為大數(shù)據(jù)時(shí)代商業(yè)決策的基礎(chǔ)和公司發(fā)展的“原燃料”,通常由計(jì)算機(jī)和信息科學(xué)技術(shù)完成;基于規(guī)律性分析的預(yù)測(cè)型(Predictive)決策,從大數(shù)據(jù)中提取信息,獲得事物背后的規(guī)律,通常由統(tǒng)計(jì)和機(jī)器學(xué)習(xí)技術(shù)完成;但僅僅對(duì)數(shù)據(jù)的管理與規(guī)律性分析并不能釋放數(shù)據(jù)的巨大價(jià)值,必須真正提升決策質(zhì)量、從海量數(shù)據(jù)中發(fā)掘出規(guī)律,才能讓大數(shù)據(jù)產(chǎn)生實(shí)質(zhì)性價(jià)值,這就是基于決策建模與求解的處方型(Prescriptive)決策。
運(yùn)籌學(xué)將實(shí)際中決策問(wèn)題轉(zhuǎn)化為數(shù)學(xué)模型,用高效的優(yōu)化算法求解,運(yùn)用系統(tǒng)科學(xué)和優(yōu)化算法獲得最佳決策及戰(zhàn)略,并實(shí)現(xiàn)決策的自動(dòng)化、流程化、規(guī)范化。在美國(guó)和歐洲,已經(jīng)實(shí)現(xiàn)了運(yùn)籌學(xué)算法的軟件化與工具化。例如,在投資組合優(yōu)化及相關(guān)決策領(lǐng)域,就有Barra、Axioma、ITG、Mosek等知名軟件,其中Mosek大規(guī)模數(shù)據(jù)優(yōu)化軟件是歐洲第一大優(yōu)化軟件,葉蔭宇為該公司科技顧問(wèn)委員會(huì)主席、創(chuàng)始人也是在葉蔭宇的指導(dǎo)下對(duì)優(yōu)化算法有了深入了解,并創(chuàng)立了該公司,目前華爾街進(jìn)行風(fēng)險(xiǎn)控制的軟件求解器有很多都使用Mosek軟件。
葉蔭宇認(rèn)為高頻交易的競(jìng)賽就是算法速度的競(jìng)賽,如果一家軟件的模型求解速度需要10秒鐘,而其它家軟件的速度為0.04秒,那么誰(shuí)掌握了0.04秒求解軟件的源代碼誰(shuí)就有核心競(jìng)爭(zhēng)力,而從10秒到0.04秒就是算法的力量。
前不久的美聯(lián)航事件,是典型的不確定環(huán)境中庫(kù)存管理決策問(wèn)題。航空公司機(jī)票超售是因?yàn)榭傆?%到10%的乘客因?yàn)楦鞣N原因不登機(jī),而航空公司在不確定的條件下到底要超售多少?gòu)垯C(jī)票以彌補(bǔ)損失,當(dāng)出現(xiàn)超售后有人不愿意下機(jī)的情況下,該如何鼓勵(lì)乘客改乘下一班飛機(jī),這都是運(yùn)籌優(yōu)化算法的范圍。在不確定和測(cè)不準(zhǔn)的隨機(jī)或復(fù)雜環(huán)境下的困難決策,也是人工智能和機(jī)器學(xué)習(xí)算法的薄弱之處。
數(shù)據(jù)驅(qū)動(dòng)商業(yè)場(chǎng)景中的決策優(yōu)化
?。ㄉ蠄D為美國(guó)明尼蘇達(dá)大學(xué)助理教授、杉數(shù)科技CTO王子卓)
Mosek公司成立于1997年,迄今已經(jīng)有20年的歷史。而國(guó)內(nèi)近年來(lái)在人工智能的產(chǎn)業(yè)化和商業(yè)化方面取得了一些進(jìn)展,但優(yōu)化算法是整個(gè)人工智能推進(jìn)中不可缺失的一環(huán),在國(guó)內(nèi)卻處于相對(duì)弱勢(shì)情況。此外,即便是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的底層算法開(kāi)源求解器,在國(guó)內(nèi)也尚未見(jiàn)到。
2016年中,幾位來(lái)自斯坦福運(yùn)籌學(xué)領(lǐng)域的教授和博士,從斯坦福校徽的“杉”和大數(shù)據(jù)的“數(shù)”取名,創(chuàng)立了杉數(shù)科技,開(kāi)始致力于在中國(guó)推廣運(yùn)籌學(xué)的商業(yè)應(yīng)用以及開(kāi)發(fā)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的底層求解算法。杉數(shù)科技目前已經(jīng)有了京東等大企業(yè)客戶,2016年7月獲得了來(lái)自真格基金和北極光創(chuàng)投的210萬(wàn)美元天使輪融資。
美國(guó)明尼蘇達(dá)大學(xué)助理教授、杉數(shù)科技CTO王子卓,曾獲美國(guó)運(yùn)籌管理學(xué)會(huì)收益管理分會(huì)2015年最佳實(shí)際應(yīng)用獎(jiǎng)提名,參與過(guò)美國(guó)運(yùn)通、華為、IBM、希捷等項(xiàng)目,其中為IBM定制的定價(jià)策略系統(tǒng)獲美國(guó)兩項(xiàng)專利,為IBM創(chuàng)造過(guò)巨額的利潤(rùn)。
王子卓介紹了互聯(lián)網(wǎng)時(shí)代由大數(shù)據(jù)驅(qū)動(dòng)的定價(jià)策略,他認(rèn)為好的定價(jià)策略是企業(yè)的“生命線”,特別是互聯(lián)網(wǎng)商業(yè)模式下的實(shí)時(shí)定價(jià)更決定了酒店、零售、航空、租車等行業(yè)和企業(yè)的生死存亡以及能否獲得更大的發(fā)展。
那么電商等實(shí)時(shí)企業(yè)如何更好的獲得“生命線”,如何制定自己的定價(jià)策略?首先這就需要了解消費(fèi)者的構(gòu)成、偏好以及消費(fèi)行為等大數(shù)據(jù),其次在獲得了消費(fèi)者或消費(fèi)者群體大數(shù)據(jù)的前提下,做出價(jià)格、時(shí)間、地點(diǎn)等銷售決策。所以數(shù)據(jù)驅(qū)動(dòng)的定價(jià)策略就是在正確的時(shí)間和正確的地點(diǎn),以正確的價(jià)格為正確的客戶提供正確的產(chǎn)品與服務(wù)。
現(xiàn)在,杉數(shù)科技智能決策提供一套基于數(shù)據(jù)的完整定價(jià)解決方案,包括目標(biāo)場(chǎng)景、底層模型、優(yōu)化策略、高效算法、信息回收、模型迭代等環(huán)節(jié)。其中,在構(gòu)造和選擇底層模型的時(shí)候,由于消費(fèi)者在面臨多個(gè)選擇、不同價(jià)格、不同質(zhì)量等信息時(shí)會(huì)改變購(gòu)買行為,雖然有時(shí)候會(huì)出現(xiàn)不理性行為但依然可以從大數(shù)據(jù)分析中得出規(guī)律,隨后通過(guò)非線性、離散、高維與動(dòng)態(tài)算法等建立定價(jià)決策模型,再設(shè)計(jì)獨(dú)特高效算法得到精確最優(yōu)解/高質(zhì)量近似解,采用并行計(jì)算架構(gòu)就可以同時(shí)對(duì)大規(guī)模多SKU問(wèn)題有效求解,最終實(shí)現(xiàn)在線獲得最優(yōu)解、滿足實(shí)時(shí)性要求。當(dāng)然,價(jià)格計(jì)算不是一勞永逸,市場(chǎng)在變化、環(huán)境在變化、價(jià)格也在變化,動(dòng)態(tài)調(diào)價(jià)已經(jīng)成為很多行業(yè)的趨勢(shì),也就是在線學(xué)習(xí)消費(fèi)者購(gòu)買行為后不斷更新算法模型。
杉數(shù)科技創(chuàng)始團(tuán)隊(duì)自2016年以來(lái),利用自己在定價(jià)方面的獨(dú)特積累和技術(shù),已經(jīng)為國(guó)內(nèi)多個(gè)行業(yè)的龍頭企業(yè),包括電商、物流、出行等,提供了收益管理方向的精確量化軟件開(kāi)發(fā)和咨詢服務(wù),合同額達(dá)到了近2000萬(wàn)。
陳溪進(jìn)一步介紹了在線學(xué)習(xí)與在線決策的聯(lián)動(dòng)影響與決策算法。在線學(xué)習(xí)與在線決策聯(lián)動(dòng),有兩個(gè)基本的選擇:一是通過(guò)最少的嘗試以獲得對(duì)象的最大化信息(Exploration,勘探);二是在已獲得信息的基礎(chǔ)上做出最佳決策以最大化收益(Exploitation,收獲)。一個(gè)經(jīng)典的例子就是多臂老虎機(jī)問(wèn)題(Multi-ArmedBanditProblem,MAB):不同老虎機(jī)的收益都是隨機(jī)的,有的隨機(jī)收益低、有的隨機(jī)收益高、有的能出現(xiàn)高額隨機(jī)收益,那么如何通過(guò)最少次數(shù)的嘗試盡量多地獲得每臺(tái)老虎機(jī)的收益水平,從而優(yōu)化拉老虎機(jī)的策略?2014年,王子卓、葉蔭宇等人的一篇學(xué)術(shù)論文討論了用于單一產(chǎn)品收益最大化管理的MAB算法。
多臂老虎機(jī)MAB算法有著廣泛的商業(yè)用途,比如電商可以把該算法用于某個(gè)產(chǎn)品消費(fèi)群體的認(rèn)知和開(kāi)發(fā)。陳溪在2016年參與的一篇“電商個(gè)性化收益管理的統(tǒng)計(jì)學(xué)習(xí)算法”中就探討了杉數(shù)科技為唯品會(huì)開(kāi)發(fā)的算法。當(dāng)時(shí)在美國(guó),某電商每個(gè)月甚至每?jī)蓚€(gè)禮拜,就定期給女性顧客寄一個(gè)內(nèi)有5件衣服的盒子,顧客可以選擇一件付款再把剩下的退回,如果5件衣服都不喜歡就會(huì)象征性收取郵費(fèi)。以此來(lái)探知女性消費(fèi)者的消費(fèi)行為數(shù)據(jù),并用于相關(guān)算法的開(kāi)發(fā)。
陳溪強(qiáng)調(diào),由于現(xiàn)實(shí)中的商業(yè)環(huán)境極為復(fù)雜,因此需要機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析和運(yùn)籌優(yōu)化的共同作用,才能做出最優(yōu)化的商業(yè)決策。
?。ㄉ蠄D為清華大學(xué)交叉信息研究院助理教授、杉數(shù)科學(xué)家李建)
清華大學(xué)交叉信息研究院助理教授、杉數(shù)科學(xué)家李建介紹了基于時(shí)空大數(shù)據(jù)的機(jī)器學(xué)習(xí)算法,所謂時(shí)空大數(shù)據(jù)中是生產(chǎn)生活中帶有時(shí)間軸的地理大數(shù)據(jù)。李建表示,隨著社會(huì)發(fā)展、企業(yè)運(yùn)營(yíng)、工業(yè)生產(chǎn)朝著精細(xì)化運(yùn)作的方向發(fā)展,對(duì)于生產(chǎn)中一些關(guān)鍵性時(shí)空屬性的預(yù)測(cè)和控制就顯得越發(fā)重要。
時(shí)空大數(shù)據(jù)有著廣泛的應(yīng)用,例如:對(duì)于交通路況的預(yù)測(cè),可以幫助交通部門調(diào)整和優(yōu)化交通指揮和布局;對(duì)于給定路徑的出行時(shí)間預(yù)測(cè),可以幫助人們更好的規(guī)劃行程;對(duì)于在線租車來(lái)說(shuō),準(zhǔn)確預(yù)測(cè)未來(lái)一段時(shí)間內(nèi)的訂單量和區(qū)域分布,可以幫助公司更好的進(jìn)行車輛調(diào)度,從而提高車輛共享效率;對(duì)于物流公司而言,對(duì)各網(wǎng)點(diǎn)收發(fā)貨量的良好預(yù)測(cè),可以幫助公司提前進(jìn)行運(yùn)力、人力等資源的調(diào)度,從而提高物流效率,增加收益;無(wú)人駕駛對(duì)周圍障礙物運(yùn)動(dòng)位置的預(yù)判,可以幫助駕駛系統(tǒng)提前規(guī)劃調(diào)整路徑,從而提高安全駕駛系數(shù)。
時(shí)空數(shù)據(jù)在各行各業(yè)中海量產(chǎn)生,對(duì)于這些數(shù)據(jù)的合理挖掘與利用可以幫助生產(chǎn)者乃至整個(gè)社會(huì)提高生產(chǎn)效率。
人工智能新浪潮:結(jié)合優(yōu)化算法的快速智能決策
(上圖為佐治亞理工學(xué)院終身教授藍(lán)光輝)
機(jī)器學(xué)習(xí)和人工智能是大數(shù)據(jù)時(shí)代科技發(fā)展的產(chǎn)物,近幾年有了突破性的發(fā)展,代表性成果包括圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等,應(yīng)用場(chǎng)景包括自動(dòng)駕駛、智能診斷、無(wú)人機(jī)等。然而,機(jī)器學(xué)習(xí)和人工智能所基于的主流深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,還需要與優(yōu)化算法結(jié)合,才能適應(yīng)現(xiàn)實(shí)商業(yè)世界中超大規(guī)模、快速實(shí)時(shí)響應(yīng)等需求。
來(lái)自佐治亞理工學(xué)院的終身教授藍(lán)光輝,其主要研究領(lǐng)域?yàn)殡S機(jī)優(yōu)化和非線性規(guī)劃的理論、算法和應(yīng)用,包括隨機(jī)梯度下降和加速隨機(jī)梯度下降等于用于解決隨機(jī)凸和非凸優(yōu)化問(wèn)題。藍(lán)光輝也是國(guó)際上機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法方向頂級(jí)專家,華人年輕一代優(yōu)化算法的領(lǐng)軍人物之一。
所謂凸優(yōu)化/非凸優(yōu)化是國(guó)際上一套已經(jīng)研究很完備的優(yōu)化算法理論體系和求解算法,如果把某個(gè)優(yōu)化問(wèn)題轉(zhuǎn)化為凸優(yōu)化/非凸優(yōu)化問(wèn)題,就能快速給出最優(yōu)解。簡(jiǎn)單理解,凸優(yōu)化就是指某個(gè)問(wèn)題可以找到局部最大值或最小值,而非凸優(yōu)化就是指某個(gè)問(wèn)題雖然沒(méi)有局部最大值或最小值,但依然有幾個(gè)局部?jī)?yōu)化點(diǎn)。換句話說(shuō),非凸優(yōu)化就是可以找個(gè)幾個(gè)局部?jī)?yōu)化的解決方案以供決策,可用于投資組合交易、航線管控、生產(chǎn)排班、資源調(diào)配、信號(hào)傳輸?shù)阮I(lǐng)域。
例如在2017年6月21日到24日的北京汛期最強(qiáng)暴雨天氣中,根據(jù)航旅縱橫統(tǒng)計(jì),從21日0:00-23日12:00,全國(guó)延誤航班架次11805架,取消航班架次3052架。在這種情況下,航空公司和鐵路公司能否實(shí)時(shí)的根據(jù)受影響航班、天氣、人流等數(shù)據(jù),及時(shí)優(yōu)化調(diào)整航班與鐵路車次,就成為了影響整個(gè)社會(huì)經(jīng)濟(jì)運(yùn)行的重要因素。這不僅僅是智能學(xué)習(xí)和預(yù)測(cè),還需要超大規(guī)模、快速實(shí)時(shí)響應(yīng),才能夠解決實(shí)際的問(wèn)題。
藍(lán)光輝介紹,自2015年以來(lái),大規(guī)模凸優(yōu)化及非凸優(yōu)化算法取得了很大的進(jìn)展,已經(jīng)能夠處理超過(guò)一百萬(wàn)甚至達(dá)上億變量的超大規(guī)模數(shù)據(jù)集。把凸優(yōu)化及非凸優(yōu)化算法用于機(jī)器學(xué)習(xí)算法的優(yōu)化,就能大幅加速機(jī)器學(xué)習(xí)算法的速度。杉數(shù)科技的科學(xué)家們也一直在開(kāi)發(fā)自己的機(jī)器學(xué)習(xí)與深度學(xué)習(xí)算法求解器。同時(shí)也幫助上海財(cái)經(jīng)大學(xué)協(xié)同開(kāi)發(fā)國(guó)產(chǎn)的最優(yōu)化求解器的開(kāi)源軟件,推進(jìn)我國(guó)開(kāi)源社區(qū)在優(yōu)化算法方面的進(jìn)展。
H2O與TensorFlow是兩大界頂級(jí)機(jī)器學(xué)習(xí)求解器,其中H2O是發(fā)布最早、影響力最大的機(jī)器學(xué)習(xí)開(kāi)源軟件之一,已經(jīng)服務(wù)于三百多家金融、互聯(lián)網(wǎng)企業(yè),被全世界70000多名數(shù)據(jù)科學(xué)家和8000多家單位所使用。而TensorFlow是谷歌開(kāi)發(fā)并力推的深度學(xué)習(xí)計(jì)算引擎,也可作為通用的機(jī)器學(xué)習(xí)求解器,是Github排名第一的世界頂級(jí)開(kāi)源項(xiàng)目,在語(yǔ)音識(shí)別、圖像識(shí)別、機(jī)器翻譯等各人工智能領(lǐng)域有著廣泛的應(yīng)用。
藍(lán)光輝介紹說(shuō),杉數(shù)科技的優(yōu)化求解器軟件在9個(gè)公開(kāi)數(shù)據(jù)集上與TensorFlow和H2O兩種求解器進(jìn)行了對(duì)比測(cè)試。其中,在針對(duì)分類模型的數(shù)據(jù)集上,杉數(shù)科技求解器的求解速度在所有數(shù)據(jù)集上均大幅高于TensorFlow,提升速度為10倍~70倍不等;而在計(jì)算速度大幅領(lǐng)先的情況下,杉數(shù)科技求解器預(yù)測(cè)效果仍略好于TensorFlow。針對(duì)回歸模型的數(shù)據(jù)集上,在3個(gè)公開(kāi)數(shù)據(jù)集上的對(duì)比測(cè)試來(lái)看,在不影響求解精確度的情況下,通過(guò)選擇合適的超參數(shù)使得杉數(shù)科技求解器軟件的求解速度仍快于TensorFlow數(shù)倍,而預(yù)測(cè)效果則大致相當(dāng)。
與H2O比較來(lái)看,針對(duì)分類模型數(shù)據(jù)集,在預(yù)測(cè)精度大致相同的情況下,杉數(shù)科技在幾乎所有數(shù)據(jù)集上求解速度都大幅度領(lǐng)先于領(lǐng)先于H2O;而在回歸模型數(shù)據(jù)集上對(duì)比,通過(guò)選擇合適的超參數(shù),杉數(shù)科技的求解器求解速度略慢于H2O,但預(yù)測(cè)精度能遠(yuǎn)高于H2O。
也就是說(shuō),在新一波人工智能浪潮中,中國(guó)的科學(xué)家們已經(jīng)掌握了并不落后,甚至領(lǐng)先國(guó)外的核心算法及軟件工具,把優(yōu)化算法代碼與中國(guó)企業(yè)的商業(yè)流程無(wú)縫結(jié)合起來(lái),真正掌握從單體智能到群體協(xié)同智慧的“軟實(shí)力”。
“核心算法是一個(gè)國(guó)家的軟實(shí)力。只要互聯(lián)網(wǎng)不死、數(shù)據(jù)與信息不死,算法就永遠(yuǎn)存在。掌握了核心算法,一個(gè)國(guó)家才能在未來(lái)一波又一波人工智能浪潮中掌握主動(dòng)權(quán)?!比~蔭宇強(qiáng)調(diào)說(shuō)。
?
責(zé)任編輯:陳近梅