精品无人区无码乱码毛片国产_性做久久久久久免费观看_天堂中文在线资源_7777久久亚洲中文字幕

首頁 企業(yè)國(guó)雙科技正文

國(guó)雙CEO祁國(guó)晟:掌握大數(shù)據(jù)時(shí)代產(chǎn)業(yè)人工智能 推動(dòng)中國(guó)軟件產(chǎn)業(yè)彎道超車

  (原標(biāo)題:國(guó)雙CEO祁國(guó)晟:掌握大數(shù)據(jù)時(shí)代產(chǎn)業(yè)人工智能,推動(dòng)中國(guó)軟件產(chǎn)業(yè)彎道超車)

  以“產(chǎn)業(yè)互聯(lián)網(wǎng)時(shí)代的云計(jì)算和大數(shù)據(jù)”為主題的“2016中國(guó)軟件大會(huì)”于12月22日在北京隆重召開。會(huì)議由中國(guó)電子信息產(chǎn)業(yè)發(fā)展研究院主辦,匯聚了政府主管領(lǐng)導(dǎo)、國(guó)內(nèi)外權(quán)威專家及杰出企業(yè)領(lǐng)袖,代表了中國(guó)軟件和信息服務(wù)業(yè)發(fā)展風(fēng)向標(biāo)。北京大學(xué)教授、工業(yè)和信息化部原副部長(zhǎng)楊學(xué)山,中國(guó)工程院院士李伯虎等均參會(huì)發(fā)表演講。國(guó)雙CEO祁國(guó)晟受邀出席,發(fā)表主題為“大數(shù)據(jù)時(shí)代的產(chǎn)業(yè)AI”的演講。演講中,祁國(guó)晟強(qiáng)調(diào),重視研發(fā)創(chuàng)新的國(guó)雙積極協(xié)助企業(yè)在商業(yè)、業(yè)務(wù)的流程方面實(shí)現(xiàn)自動(dòng)化,未來通過導(dǎo)入更成熟的人工智能技術(shù)訓(xùn)練機(jī)器學(xué)習(xí)海量數(shù)據(jù),會(huì)使得包括思考與決策的自動(dòng)化也成為現(xiàn)實(shí)。對(duì)于整個(gè)中國(guó)軟件產(chǎn)業(yè)發(fā)展,祁國(guó)晟也抱有高度信心。他認(rèn)為,中國(guó)企業(yè)軟件的成長(zhǎng)與發(fā)展勢(shì)能尚未發(fā)揮,有非常大的成長(zhǎng)空間;中國(guó)的消費(fèi)互聯(lián)網(wǎng),特別在智能終端的表現(xiàn)比美國(guó)還先進(jìn),把握這兩大關(guān)鍵契機(jī),中國(guó)軟件產(chǎn)業(yè)非常有可能實(shí)現(xiàn)“彎道超車”,在全球軟件市場(chǎng)擁有更大話語權(quán)。

  以下是祁國(guó)晟在2016中國(guó)軟件大會(huì)的演講實(shí)錄:

  謝謝主辦方給我一個(gè)機(jī)會(huì)發(fā)言。在我前面的所有演講嘉賓都是行業(yè)前輩、專家,或者是我的師長(zhǎng)。我應(yīng)該是今天上午最年輕的嘉賓,但是我在大數(shù)據(jù)行業(yè)的從業(yè)時(shí)間并不短。國(guó)雙成立于2005年,當(dāng)時(shí)我還在清華上本科,在宿舍里做成的這個(gè)公司。這11年來,不管有沒有“大數(shù)據(jù)”和“云計(jì)算”這些詞,我們的營(yíng)收都來自數(shù)據(jù)處理、數(shù)據(jù)分析和為企業(yè)服務(wù)。從2007年開始,我們的所有產(chǎn)品和解決方案都是在SaaS基礎(chǔ)上,也就是用云,為社會(huì)、為各種機(jī)構(gòu)提供服務(wù)。今天,我們服務(wù)600多家商業(yè)客戶和品牌,其中很多都是世界五百強(qiáng),還有政府、司法部門、電視臺(tái)等都是我們的客戶。

  很榮幸,今年9月23日我們?cè)诿绹?guó)納斯達(dá)克上市,這個(gè)上市具有一定的意義。過去中國(guó)有很多知名的企業(yè)在美國(guó)上市,大多是消費(fèi)互聯(lián)網(wǎng)類的企業(yè)。我們是第一家大數(shù)據(jù)的企業(yè),或者第一家企業(yè)級(jí)軟件服務(wù)的供應(yīng)商。我們非常榮幸能夠成為這樣一個(gè)力量,在國(guó)際舞臺(tái)上和國(guó)際一流的公司競(jìng)爭(zhēng)。

  國(guó)雙很注重自主創(chuàng)新,目前發(fā)明專利申請(qǐng)高達(dá)1728件,其中583件是與大數(shù)據(jù)相關(guān)的,148件是與人工智能相關(guān)的。這個(gè)數(shù)字是給大家一個(gè)概念,過去兩年我們公司都是中關(guān)村發(fā)明專利的前十強(qiáng),其他九家公司無一例外都是五千人以上的巨型互聯(lián)網(wǎng)或者科技巨頭,我們是其中唯一一家規(guī)模在一千人以內(nèi)的企業(yè)。所以,今天我在“中國(guó)軟件大會(huì)”演講的標(biāo)題為《大數(shù)據(jù)時(shí)代下的產(chǎn)業(yè)AI》,我們有實(shí)力講好這個(gè)故事。

  大數(shù)據(jù)一直在我們公司的基因中,我們公司的名字叫Gridsum,Grid就是分布式(Gridcomputing),SUM是求和。Gridsum這個(gè)名字來源于我2003年在大學(xué)二年級(jí)時(shí)自己做的一個(gè)程序,當(dāng)時(shí)我們就覺得未來是什么?未來的計(jì)算機(jī)是什么?未來的計(jì)算機(jī)就是有一天連SUM,求和,這么一個(gè)簡(jiǎn)單的運(yùn)算,因?yàn)閿?shù)據(jù)量太大,必須要多臺(tái)計(jì)算機(jī)一起來做加法處理。其實(shí)它和Google的創(chuàng)始人在2004年的一篇論文中介紹的整個(gè)大數(shù)據(jù)行業(yè)的基礎(chǔ)算法MapReduce有異曲同工之妙。盡管我們沒發(fā)展成另一個(gè)Google,但我們把我們的觀點(diǎn)和我們當(dāng)時(shí)的Vision用在了隨后的為企業(yè)的數(shù)據(jù)服務(wù)之中,高效地為企業(yè)來服務(wù)。這是我們的大數(shù)據(jù)DNA。

  關(guān)于人工智能

  我從學(xué)校走出來時(shí)間還不是很長(zhǎng),《人工智能》這本教材,是我當(dāng)年上大學(xué)時(shí)用的教材,我當(dāng)時(shí)這門課成績(jī)還不錯(cuò)。印象非常深的是,我們的作業(yè)是要實(shí)現(xiàn)A星(A star, A*)搜索(注:“A*搜索, A Star search algorithm”為人工智能中的種算法)。在座如果有計(jì)算機(jī)背景的,都知道人工智能最經(jīng)典的算法叫A星搜索。這個(gè)A星搜索能做什么呢?它是一個(gè)最優(yōu)、最完備、效率最高的一個(gè)算法。但是它有一個(gè)極大的缺陷,就是在解決復(fù)雜問題時(shí),特別占內(nèi)存。十年前,內(nèi)存是一個(gè)很大的限制,很多做程序的人會(huì)放棄一個(gè)完美的算法,而去找到一個(gè)可以節(jié)省內(nèi)存、同時(shí)可放到產(chǎn)業(yè)應(yīng)用中的算法。因?yàn)槟忝媾R的數(shù)據(jù)量太大,一個(gè)完美的算法是不可能面對(duì)這么大的一個(gè)數(shù)據(jù)量的。怎么辦?我想可不可以用我們做的分布式求和的東西,用多臺(tái)計(jì)算機(jī)來解決。當(dāng)年都是單核CPU,一個(gè)核CPU16位、32位操作系統(tǒng),它的內(nèi)存是有限的。那么,多臺(tái)計(jì)算機(jī)一起是不是內(nèi)存就可以變得更大一些,它就可以有更大的空間使用這種類似完美的算法,可在當(dāng)時(shí)沒有這個(gè)時(shí)間做實(shí)踐。

  前幾天我把這本書的第三版找出來,2011年的第三版,我做的第一件事情就是看這兩個(gè)版本之間有什么區(qū)別。在“歷史”這一欄,2011年之后我們有了巨大的數(shù)據(jù),我們也有了應(yīng)對(duì)巨大數(shù)據(jù)的能力,即大數(shù)據(jù)的方法,用多臺(tái)計(jì)算機(jī)協(xié)同工作,MapReduce也好,Gridsum也好,去解決這個(gè)問題。

  我們今天的話題叫“大數(shù)據(jù)時(shí)代下的產(chǎn)業(yè)AI”,如果過去的想法實(shí)現(xiàn)了,今天用大數(shù)據(jù)的方法把AI放在一個(gè)多臺(tái)計(jì)算機(jī)上去做,它在產(chǎn)業(yè)里面就可用。以下是幾個(gè)例子。第一,我們公司最早進(jìn)入的一個(gè)行業(yè)就是做廣告效果的監(jiān)測(cè)或者互聯(lián)網(wǎng)營(yíng)銷效果的監(jiān)測(cè)。典型的例子,左面是一個(gè)熱力圖,這是一個(gè)點(diǎn)擊作弊,過去七八年中國(guó)的點(diǎn)擊作弊是非常嚴(yán)重的,多點(diǎn)擊一個(gè)就可以多收錢??梢钥吹?,在這一個(gè)點(diǎn)上點(diǎn)擊1.6萬次,每一次都點(diǎn)擊在同一個(gè)點(diǎn)上。當(dāng)年我們用熱力圖的方法抓住每一個(gè)鼠標(biāo)點(diǎn)擊在哪里,如果發(fā)現(xiàn)這么多鼠標(biāo)點(diǎn)擊都點(diǎn)在這一個(gè)點(diǎn)上,分毫不差,那肯定是機(jī)器做的。另外,從右面可以看到有很多報(bào)警的條件,當(dāng)時(shí)設(shè)置了很多條件去比較,看這個(gè)渠道給我發(fā)過來很多無效的作弊流量。我們今天已經(jīng)不需要人看這個(gè)圖或者配置這個(gè)條件來發(fā)現(xiàn),而是用人工智能的方法訓(xùn)練機(jī)器來做。我們跟機(jī)器說這種情況出現(xiàn)就是一個(gè)點(diǎn)擊作弊,機(jī)器記住了這些東西,然后機(jī)器會(huì)自動(dòng)地發(fā)現(xiàn)?,F(xiàn)在有37.4億的行為數(shù)據(jù)每天實(shí)時(shí)到我們的計(jì)算機(jī)里面,這就是互聯(lián)網(wǎng)的用戶行為,根據(jù)這個(gè)數(shù)據(jù)我們現(xiàn)在反點(diǎn)擊欺詐的能力非常強(qiáng),基本上任何一個(gè)廣告公司、媒體知道這個(gè)客戶用了國(guó)雙的產(chǎn)品,不會(huì)給它放任何有問題的流量。

  第二個(gè)例子,我們現(xiàn)在進(jìn)入了司法行業(yè),一年多以前中國(guó)最高法院開始公開了判決文書。一份判決文書大概是5K,這份判決文書的支撐文件可能有50M,這還算少的,就是庭審過程中所有記錄下來的文件?,F(xiàn)在已經(jīng)公開的判決文書有2400萬份。其實(shí)80%、90%的官司都是很簡(jiǎn)單、很普通的瑣事,比如鄰里糾紛,但是每一個(gè)在官司中的人都認(rèn)為我的情況是特殊的。造成每一個(gè)法律工作者,尤其是法院、法官要承擔(dān)很大的工作量,要把這個(gè)案子斷掉,其實(shí)這個(gè)案子根本不應(yīng)該花法官的時(shí)間去斷,因?yàn)楹芏喟缸佣继貏e有共性。我們右面的這個(gè)系統(tǒng)是一個(gè)人工智能系統(tǒng),你可以問系統(tǒng):鄰居家建房,擋住我家的采光。這是一個(gè)自然語言問出來的問題,這個(gè)系統(tǒng)的第一屏直接告訴你,它就像是一個(gè)律師一樣,因?yàn)檫@個(gè)系統(tǒng)已經(jīng)被我們通過機(jī)器學(xué)習(xí),通過人工智能,通過海量的后臺(tái)跟司法過程相關(guān)的數(shù)據(jù)訓(xùn)練過。所以,第一,它告訴你,你的這些情況是哪些法律法規(guī)起作用。它就像是一個(gè)圖靈測(cè)試一樣,你以為是一個(gè)很專業(yè)的律師,其實(shí)不是,是一個(gè)機(jī)器人。它還會(huì)告訴你統(tǒng)計(jì)結(jié)果,比如說你這個(gè)情況在上海、北京、河南、河北、遼寧有多少,勝訴數(shù)是多少,平均訴請(qǐng)金額是多少,平均訴請(qǐng)金額就是2、3萬塊錢,但是實(shí)際獲賠金額非常少。什么意思?最后得到的就是幾百塊錢。所有人都認(rèn)為我應(yīng)該拿幾萬塊錢,但是實(shí)際上獲賠的就是這個(gè)錢。試想,你還應(yīng)不應(yīng)該打這個(gè)官司,應(yīng)不應(yīng)該把這個(gè)官司走完。今年我們開始在一些法院幫助他們?nèi)プ觯泻芎玫纳鐣?huì)效應(yīng)和社會(huì)效果,這也是一個(gè)很典型的人工智能和大數(shù)據(jù)結(jié)合的例子。

  第三個(gè)例子,信息安全。最近大家可能看到很多新聞是關(guān)于信息安全的,都是丟數(shù)據(jù),你的個(gè)人信息沒有了,因?yàn)槟骋粋€(gè)企業(yè)不夠注意,所以你的個(gè)人信息就沒有了。我們傳統(tǒng)的信息安全是靠防火墻,靠很多硬件。有一個(gè)黑客來了,防火墻給你擋住,后面的服務(wù)器是安全的,這是可以擋住黑客攻擊的。但是擋不住什么呢?比如說黑客,底下有一個(gè)手機(jī),這個(gè)手機(jī)可能是一個(gè)糊涂的員工的,也有可能是被買通的員工的,這個(gè)黑客把這個(gè)手機(jī)控制了,帶進(jìn)了我們的組織。這個(gè)手機(jī)從防火墻背后攻陷了一臺(tái)服務(wù)器,這個(gè)服務(wù)器又去另一臺(tái)服務(wù)器把有用的信息偷走。但是如果用大數(shù)據(jù)的方法,不需要防火墻,所有服務(wù)器、所有的智能設(shè)備的行為數(shù)據(jù)都被一朵云記錄,然后有一個(gè)大腦去分析這些行為,哪兒的行為是異常的。機(jī)器就能夠自動(dòng)地發(fā)現(xiàn)很多異常,這個(gè)人不應(yīng)該在這個(gè)時(shí)間登錄,這樣的異常數(shù)據(jù)背后有可能是危險(xiǎn)的。這樣的方法可能是純軟件的不需要硬件,它卻能夠解決硬件不能解決的問題。

  總結(jié)

  產(chǎn)業(yè)AI有一個(gè)什么樣的方法論?從原始數(shù)據(jù)到規(guī)劃好的數(shù)據(jù),一般來講,是先用計(jì)算機(jī)純粹地通過數(shù)據(jù)去發(fā)現(xiàn)一些歧義的數(shù)據(jù),這時(shí)候需要數(shù)據(jù)專家來指出這一二三四五條數(shù)據(jù)中有些是對(duì)的,有些是錯(cuò)的,你計(jì)算機(jī)弄錯(cuò)了。這個(gè)結(jié)果反饋到計(jì)算機(jī),形成一個(gè)人工的智能,這個(gè)人工智能不斷地迭代,重復(fù)操作,不斷學(xué)習(xí),其節(jié)點(diǎn)就會(huì)變得越來越多,最后有一天就可以做到商業(yè)和業(yè)務(wù)自動(dòng)化。很多企業(yè)信息化還沒有完成,我們公司一直在做的事情就是各種商業(yè)和業(yè)務(wù)的自動(dòng)化,營(yíng)銷、銷售的自動(dòng)化,審判流程的自動(dòng)化,在線服務(wù)的自動(dòng)化,但是自動(dòng)化的過程就可以產(chǎn)生數(shù)據(jù)。如果把這些海量的數(shù)據(jù)都用人工智能的方法訓(xùn)練起來,還可以做到思考和決策的自動(dòng)化,這不僅是業(yè)務(wù)流程的自動(dòng)化,關(guān)鍵的一些節(jié)點(diǎn),思考決策也可以幫你做自動(dòng)化。

  另外,實(shí)踐這個(gè)大數(shù)據(jù)的成本是可控的。我們公司的數(shù)據(jù)量從2005年到2016年9月是一個(gè)比較線性的增長(zhǎng),但是每TB的存儲(chǔ)費(fèi)用和每事故處理的費(fèi)用下降的速度其實(shí)更快。所以,每一年,你把所有的數(shù)據(jù)都處理的成本,其實(shí)變化沒有很大。

  我們國(guó)家在軟件產(chǎn)業(yè)的發(fā)展上,有彎道超車的機(jī)會(huì)。第一,因?yàn)橹袊?guó)企業(yè)軟件發(fā)展是嚴(yán)重滯后,但這個(gè)滯后其實(shí)是有好處。第二,我們的消費(fèi)互聯(lián)網(wǎng),各種數(shù)據(jù)都證明,我們的互聯(lián)網(wǎng)和智能手機(jī)或者消費(fèi)互聯(lián)網(wǎng)、智能終端已經(jīng)發(fā)展得比美國(guó)還要先進(jìn)了。企業(yè)軟件發(fā)展雖然滯后,但我們則少有遺留信息系統(tǒng)問題。我在美國(guó)見過很多公司,它們?yōu)槭裁床缓米鯝I,不好做大數(shù)據(jù)?因?yàn)檫^去二十年,他們用了很多遺留系統(tǒng),每個(gè)系統(tǒng)獨(dú)立,且一個(gè)系統(tǒng)管一塊,數(shù)據(jù)很難提取,數(shù)據(jù)一致性非常難解決。盡管最后都進(jìn)了大數(shù)據(jù)系統(tǒng),用上AI系統(tǒng)管理,但有很多冗余的、垃圾的無效數(shù)據(jù)。所以,它不能產(chǎn)生真正的AI。但是中國(guó)很多企業(yè)過去像一張白紙一樣,因此中國(guó)的企業(yè)級(jí)軟件服務(wù),非常有可能實(shí)現(xiàn)“彎道超車”。

責(zé)任編輯:陳近梅

分享: