精品无人区无码乱码毛片国产_性做久久久久久免费观看_天堂中文在线资源_7777久久亚洲中文字幕

首頁 企業(yè)國雙科技正文

數(shù)據(jù)觀專訪國雙科技黃勇堅(jiān):大數(shù)據(jù)時(shí)代 基于“視角”才能解決企業(yè)痛點(diǎn)

  2016年12月24-25日,以“數(shù)據(jù)驅(qū)動(dòng),智見未來”為主題的CCF大數(shù)據(jù)與計(jì)算智能大賽決賽暨頒獎(jiǎng)典禮在青島舉行。11個(gè)出題企業(yè)與科研機(jī)構(gòu)分別設(shè)立了11道大賽賽題,最終甄選出55支參賽隊(duì)伍前往青島進(jìn)行最后的激烈比拼。大賽中,數(shù)據(jù)觀記者專訪了北京國雙科技有限公司技術(shù)副總裁黃勇堅(jiān),深入了解此次大賽規(guī)模、參賽選手表現(xiàn)及賽題解讀等。

數(shù)據(jù)觀專訪國雙科技黃勇堅(jiān)

  數(shù)據(jù)觀記者:國雙在本次大賽中扮演一個(gè)什么樣的角色?具體做了些什么?

  黃勇堅(jiān):國雙連續(xù)二年參與CCF大賽,在本次大賽中既是贊助商也是主要出題方之一,2015年國雙出的賽題是《判決文書中的金額項(xiàng)提取》,該賽題獲得了綜合大獎(jiǎng)和組間PK第一名。由于這項(xiàng)活動(dòng)是產(chǎn)學(xué)深度合作很好的模式,賽題研究成果可應(yīng)用于贊助方當(dāng)前的工作項(xiàng)目。國雙司法大數(shù)據(jù)和司法人工智能領(lǐng)域的解決方案和產(chǎn)品中部分已體現(xiàn)相關(guān)應(yīng)用。通過自然語言處理技術(shù),對(duì)公開的判決書進(jìn)行解析,分析文書中的原告、被告、案件事實(shí)、法律依據(jù)、判決結(jié)果、勝訴率、賠償金額等上百種維度和指標(biāo),建立這些維度和指標(biāo)的關(guān)聯(lián),挖掘各類案件發(fā)生的規(guī)律和情況,為法院有效掌握全國司法情況,基于大數(shù)據(jù)作出準(zhǔn)確決策提供了有效的手段。

  2016年,國雙第二次作為出題方發(fā)布了名為《基于視角的領(lǐng)域情感分析》的賽題。

  數(shù)據(jù)觀記者:怎么理解《基于視角的領(lǐng)域情感分析》這個(gè)賽題?

  黃勇堅(jiān):國雙出的賽題主要是針對(duì)國雙客戶在現(xiàn)實(shí)中的真實(shí)痛點(diǎn)而制定的。國雙針對(duì)汽車行業(yè)有專門的汽車解決方案,在國內(nèi)有大量汽車客戶。比如在汽車行業(yè),汽車客戶非常注重在互聯(lián)網(wǎng)上的輿情口碑分析,通常想買車的消費(fèi)者會(huì)在微博、微信或者網(wǎng)站上進(jìn)行發(fā)言和評(píng)論,相互討論汽車的車型、價(jià)格、功能。如“A車比B車好”,對(duì)A而言是正面的,對(duì)B而言是負(fù)面的;“C車內(nèi)部空間大、但油耗也很大”,對(duì)C車的空間這個(gè)屬性而言是正面的,而對(duì)于C車的油耗這個(gè)屬性而言是負(fù)面的。

  市場上很多廠商的解決方案是對(duì)整句話進(jìn)行正負(fù)面的情感判斷,而不是基于特定的視角?!癆車比B車好”,因?yàn)橛幸粋€(gè)“好”字,就會(huì)認(rèn)為整句話都是正面的,根本不區(qū)分說的是A車還是B車,這樣就沒什么商業(yè)意義。為了解決客戶的痛點(diǎn),國雙提出了“基于視角的領(lǐng)域情感分析”,即通過機(jī)器學(xué)習(xí)的方法讓計(jì)算機(jī)自動(dòng)拆解并找到句子中所針對(duì)的每一個(gè)視角,再讓計(jì)算機(jī)判斷每一個(gè)視角的情感,商業(yè)意義大大提升,可以為企業(yè)客戶提供更準(zhǔn)確的信息。

  數(shù)據(jù)觀記者:國雙選擇這個(gè)賽題除了解決企業(yè)真實(shí)痛點(diǎn)外,是否還因?yàn)閲p在這個(gè)領(lǐng)域有領(lǐng)先技術(shù)和研究成果?

  黃勇堅(jiān):自然語言處理是一個(gè)基礎(chǔ)而綜合的研究方向,在學(xué)術(shù)界非常有研究價(jià)值,同時(shí)在商業(yè)上也非常有市場價(jià)值。國雙已經(jīng)在機(jī)器學(xué)習(xí)和人工智能領(lǐng)域作了大量的研發(fā)投入。為此,國雙聯(lián)合國內(nèi)在這些領(lǐng)域有深入研究的高校進(jìn)行產(chǎn)、學(xué)、研合作。國雙與哈工大、中國人民大學(xué)信息學(xué)院均有合作關(guān)系,共同成立聯(lián)合實(shí)驗(yàn)室,共同進(jìn)行大數(shù)據(jù)和自然語言處理方面的人才培養(yǎng)和將學(xué)術(shù)成果商業(yè)化的工作,既解決了企業(yè)實(shí)際的產(chǎn)業(yè)問題,同時(shí)也促進(jìn)了學(xué)術(shù)研究。國雙在這個(gè)領(lǐng)域本來就積累了很多經(jīng)驗(yàn),這次的大賽也讓國雙看到了學(xué)生的創(chuàng)新能力,學(xué)生的力量給企業(yè)帶來了不少新思路和創(chuàng)意,令人振奮。

  數(shù)據(jù)觀記者:在2016年,國雙這個(gè)賽題的研究成果會(huì)被應(yīng)用到哪里?

  黃勇堅(jiān):國雙近期著重于汽車行業(yè),為汽車客戶解決輿情識(shí)別、輿情監(jiān)測、知識(shí)挖掘的問題。我們看到學(xué)生運(yùn)用某個(gè)算法模型解決類似問題。這個(gè)算法的特色是具有很好的可復(fù)制性,因?yàn)樗皇腔谝?guī)則的,而是基于深度學(xué)習(xí)的。這個(gè)算法可應(yīng)用到包括汽車行業(yè)在內(nèi)的各種領(lǐng)域,例如金融領(lǐng)域,特別是上市公司的場景。在互聯(lián)網(wǎng)中存在的海量信息,有些信息可能對(duì)某些上市公司是利好,但相對(duì)的可能對(duì)于某些公司是利空,合理的算法可以憑借基于視角的情感判斷來進(jìn)行分析。

  數(shù)據(jù)觀記者:您怎么評(píng)價(jià)今年大賽和參賽隊(duì)伍的表現(xiàn)?

  黃勇堅(jiān):今年大賽規(guī)模比去年大了很多,參賽選手實(shí)力也越來越強(qiáng),競爭也越來越激烈。相比去年,本次賽題難度有所提高,賽題也增加到11道,整個(gè)大賽都在進(jìn)步。大賽能夠解決企業(yè)實(shí)際應(yīng)用問題,能讓企業(yè)發(fā)現(xiàn)一些優(yōu)秀人才,對(duì)培養(yǎng)中國大數(shù)據(jù)方面的人才非常有幫助。

  同時(shí),對(duì)于本次國雙參賽隊(duì)伍的表現(xiàn)我也很滿意。獲得本組賽題一等獎(jiǎng)的參賽隊(duì)伍,他們研究出的模型是一個(gè)完全基于深度學(xué)習(xí)而沒有依賴具體領(lǐng)域規(guī)則的模型。具有通用性,可以很容易遷移應(yīng)用到其他業(yè)務(wù)領(lǐng)域中。模型能完美和國雙積累下來的很多規(guī)則結(jié)合,有非常良好的落地性和商業(yè)價(jià)值。

  數(shù)據(jù)觀記者:您覺得大賽是否能成為解決企業(yè)數(shù)據(jù)創(chuàng)新和突破的有效手段?

  黃勇堅(jiān):企業(yè)要有數(shù)據(jù)創(chuàng)新和突破首先需要的是人才,最有效的辦法之一就是通過大賽尋找到這樣的人才。

  大賽的機(jī)制是由企業(yè)出題參賽,選手針對(duì)賽題進(jìn)行比賽,這樣能使參賽選手在競賽全程與賽事工程師建立一對(duì)一溝通渠道,這也是企業(yè)直接接觸到人才的渠道。

  競賽選手能在大賽中給予企業(yè)很大驚喜。他們思路非常創(chuàng)新,一些創(chuàng)意點(diǎn)是企業(yè)可能想不到又具有實(shí)際運(yùn)用價(jià)值的。中國發(fā)展大數(shù)據(jù)產(chǎn)業(yè)需要非常多的人才,依靠大賽的規(guī)模和影響力,對(duì)整個(gè)國家培養(yǎng)大數(shù)據(jù)人才非常有幫助。(數(shù)據(jù)觀記者 付嬌)

責(zé)任編輯:陳近梅

分享: