來源:數(shù)據(jù)觀 時間:2018-07-11 16:37:42 作者:魏芳
人工智能到現(xiàn)在已經(jīng)經(jīng)歷了幾十年的發(fā)展,在上世紀五十年代的達特茅斯會議上,“人工智能”一詞被正式提出,這被看作是人工智能正式誕生的標志,同時,人工智能的發(fā)展?jié)摿σ脖患挠韬裢?。但是它的發(fā)展并不是那么順利,經(jīng)歷了幾次高潮到低谷的跌宕起伏。
人工智能再次進入蓬勃發(fā)展時期
近幾年,得益于技術(shù)的進步,人工智能再次達到發(fā)展的高潮。一方面,深度學習技術(shù)的研究成果突破了人工智能的瓶頸,引爆了人工智能的發(fā)展。另一方面,在互聯(lián)網(wǎng)時代下,大數(shù)據(jù)技術(shù)的不斷完善,使數(shù)據(jù)得以迅速積累,為人工智能的研究提供了數(shù)據(jù)基礎。同時計算機算力的不斷提升、硬件費用減少等外在因素也為人工智能的前進提供了便利條件。
我國在人工智能的研究與應用進程中屬于后發(fā)者,起步相對較晚,但在這次發(fā)展浪潮中也取得了豐富的成果和突破性的進展??梢钥吹?,現(xiàn)在人工智能的技術(shù)成果已經(jīng)滲透到企業(yè)和人們生活的方方面面。除了技術(shù)研究的進展,這也有賴于我國自由寬松的發(fā)展環(huán)境和充分的市場需求。
從整體上看,我國正在大力地扶持人工智能產(chǎn)業(yè)的發(fā)展,例如2017年國務院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,將人工智能提升到國家戰(zhàn)略層面,同時各地方政府和相關(guān)部門都相繼出臺政策和規(guī)劃方案,吸引人工智能企業(yè)的入駐,希望借此拉動當?shù)亟?jīng)濟的增長。這為人工智能的發(fā)展提供了良好的政策環(huán)境。
從產(chǎn)業(yè)的市場環(huán)境來說,對企業(yè)而言,智能化意味著效率的提高和利潤的增長;對于個人則意味著便捷、省事和更個性化的服務。而在此基礎上,企業(yè)業(yè)務和人們?nèi)粘I顚χ悄芑某潭热匀辉谔岢鲂碌囊?,這是推動人工智能不斷前進的內(nèi)在動力。
由此應運而生的,是越來越多的初創(chuàng)企業(yè)在孵化,同時也推動著其他領域的企業(yè)向人工智能轉(zhuǎn)型,或者開拓人工智能相關(guān)業(yè)務。達觀數(shù)據(jù)作為一家人工智能企業(yè),專注于文本智能處理,也正是因為上述因素有良好的發(fā)展土壤。
用文本智能處理實現(xiàn)“機器代人”
文本智能處理,也就是自然語言處理,是人工智能的一個分支。它試圖讓機器來理解人類的語言,通過模擬人腦的機制來解釋文本。
在大數(shù)據(jù)時代,這個高速前進的發(fā)展階段,每一個企業(yè)都存在著大量文字文本,尤其是法律行業(yè)、金融機構(gòu)、媒體等行業(yè),需要對文本進行審核、分類、提取關(guān)鍵詞等。
以金融機構(gòu)為例,有大量的合同、文書等文件需要審核其中的流程,判斷其中是否存在問題。比如數(shù)字是否一致?有沒有法律漏洞?有沒有不合企業(yè)規(guī)范、不合金融行業(yè)監(jiān)管要求的地方?經(jīng)過大量訓練后的計算機,則可以完成其中的絕大部分工作,處理完后再交給人去把關(guān)。在這個過程中職員就可以從日常繁瑣的文字工作中解放出來,去做更有意義、更有價值的工作。
當然,這樣的場景絕不僅限于金融行業(yè),包括法律、媒體、快消零售等行業(yè),都存在著類似的重復枯燥的巨量文本文檔處理任務,都需要文本智能處理提供“機器代人”的解決之道。目前,文本的智能處理主要應用在智能問答、機器翻譯、文本分類、文本摘要、標簽提取、情感分析、主題模型等方面。
達觀數(shù)據(jù)瞄準的正是這些潛力場景,為數(shù)字化轉(zhuǎn)型升級期的企業(yè)提供文本挖掘、知識圖譜、搜索引擎和個性化推薦等文本智能處理技術(shù)服務,幫助企業(yè)實現(xiàn)數(shù)據(jù)化、智能化運營。
文本智能處理有廣闊的前景也有挑戰(zhàn)
依靠深度學習等技術(shù),文本智能處理已經(jīng)為很多行業(yè)帶來了明顯效率提升,作為前沿技術(shù)也發(fā)展得很快,但這并不代表已經(jīng)達到了完美的結(jié)果。文本智能處理未來將會有廣闊的發(fā)展前景,但同時也需要正視它目前所面臨的挑戰(zhàn)。
在當前的實際應用中,圖像和語音的分析處理能夠達到更高的精準度,這是因為圖像、語音可以直接轉(zhuǎn)化為計算機可以理解的對象。但是自然語言是人類在認知發(fā)展過程中產(chǎn)生的高層次抽象實體,計算機并不能完全理解其中的含義。雖然從達觀數(shù)據(jù)的業(yè)務經(jīng)驗來看,利用文本智能處理進行合同審核,平均準確率可達到90%以上,甚至一些簡單的人物可以實現(xiàn)100%。當然,這個過程是需要機器的智能識別和人工復核相結(jié)合,所以準確度受到數(shù)據(jù)質(zhì)量的好壞、是否是結(jié)構(gòu)化的數(shù)據(jù)以及審核人員的疲勞度等因素的影響。但是在目前大多數(shù)的應用場景中的精準度還需要提升,這是文本智能處理在業(yè)務層面的挑戰(zhàn)。
在技術(shù)上也存在難度。對文本進行語義理解需要結(jié)合上下文的語境和說話人的情緒。比如在人類的交流中,相同的一個詞或一個句子,用不同的情緒和表達方式說出來,會產(chǎn)生差異極大的含義;而文本處理涉及到的語言也非常多,除了標準語言,還有俗語、俚語以及現(xiàn)在流行的嘻哈語言、網(wǎng)絡語言等,這都給文本的處理增加了難度。同時,人的語言也處在不斷地發(fā)展中,隨著發(fā)展,人的語言的邏輯思維也會發(fā)生改變。文本處理的相關(guān)技術(shù)都是基于已有的數(shù)據(jù)在做訓練,但只要有所變化,就需要按照新的語言規(guī)則去學習。
而在這個領域中,包括達觀數(shù)據(jù)在內(nèi)的企業(yè)都屬于探路者,未來這個行業(yè)會發(fā)展成什么樣子、發(fā)展體量有多大等,這都是不可知的,沒有前人的現(xiàn)成經(jīng)驗可循。而且,現(xiàn)在社會、技術(shù)的發(fā)展速度很快,企業(yè)需要在技術(shù)、產(chǎn)品和服務等方面不斷突破,需要快速對新的發(fā)展和客戶新的需求作出反應,才能跟上社會發(fā)展的步伐,才能在行業(yè)中保持領先性。
這些都將是行業(yè)在前進過程中需要突破的瓶頸。但是,相信隨著技術(shù)的進一步突破,這些難題將不再成為制約行業(yè)發(fā)展的阻礙。
(作者:魏芳,系達觀數(shù)據(jù)副總裁)
責任編輯:陳近梅