來源:數(shù)據(jù)觀 時間:2018-04-16 13:21:23 作者:黃玉葉 編譯
?4月13日,谷歌宣布了其研究部門的兩項最新人工智能(AI)實驗成果,允許網(wǎng)絡用戶涉足語義和自然語言處理。于谷歌而言,公司的主要產(chǎn)品是谷歌搜索引擎,多以文本運行,而這些AI方面的進步也成為了業(yè)務的一部分,并且以此為目標——出品能夠理解并分析人類語言元素的軟件。
?相關網(wǎng)站現(xiàn)在起將提供任意交互式AI語言工具的服務,谷歌稱之為語義采集體驗。AI的主要子領域是“詞向量”,這是一種自然語言的理解,它將“語義相似的短語映射到附近的點上,這是基于概念和語言的等價性、相似性或相關性”?!斑@是一種讓算法能夠根據(jù)實際語言使用的實例來學習單詞之間關系的方法”,著名的未來學家、谷歌研究院的工程總監(jiān)Ray Kurzweil和產(chǎn)品經(jīng)理Rachel Bernstein在一篇博客文章中闡述到。谷歌已經(jīng)在這里的一篇論文中發(fā)表了關于這個主題的研究,并且他們還在TensorFlow平臺上提供了一個預先訓練的模塊供其他研究人員進行實驗。
?此番公布的兩項公開實驗中,第一項叫做“與書對話”。它可以讓你和訓練好的機器學習算法進行對話,該算法可以針對提問從人撰書面文本的相關段落作出表面回答。正如Kurzweil和Bernstein所描述的那樣,與書交談可以讓你“做一個陳述或問一個問題,而這個工具會書中找到句子作為回應,而非依賴于關鍵字匹配?!彼麄冞€補充說到:“從某種意義上說,你是在與書對話。通過書的回應,幫助你確定是否感興趣,是否閱讀它?!?/p>
“與書對話”應用界面
?從我使用web界面的經(jīng)驗來看,它是一款非常整潔、超美觀的產(chǎn)品。假設你問它一個問題——“為什么天空是藍色的?”,你會得到很多不同的答案,而這些答案無一例外都在清晰的文本中顯示出來,這些答案來自于相關主題的書籍,諸如內容為“隨著波長的減少,大氣中的分子在光線散射時會變得更強”。然而,與使用標準谷歌搜索引擎截然不同的是,你操作的時候必須點擊一個鏈接并解析文章或網(wǎng)頁,“與書對話”算法才會為你所用。
?“支撐這項技術的模塊至少經(jīng)歷了10億次對話訓練,比如對句的同時要學會鑒別如何做出最像樣的回復?!盞urzweil和Berstein解釋說,“一旦你提出了問題(或者做了一個陳述),這些工具就會在超過10萬本書的內容中搜索所有語句,找出那些根據(jù)句子層面語義合乎你問題的答案。你所輸入的文字和你所得到的結果二者之間,沒有預先框定的規(guī)則。”
?當然,正如您可能懷疑的那樣,它有局限性。這個工具更適合回答原始的事實性問題,而且在處理復雜的地緣政治問題或現(xiàn)代文化、歷史重要性的話題時表現(xiàn)不佳。但就作為一個簡單的網(wǎng)絡工具,谷歌表示它可以幫助改進諸如Gmail智能回復一類的產(chǎn)品?!芭c書對話”不乏是一種以自然語義來探索網(wǎng)絡的有趣方式,它同時讓我們瞥見到,當人工智能真正成熟到可以處理幾乎所有我們拋出的查詢時,未來的交互界面會是什么樣子。
?谷歌重磅發(fā)布的兩個實驗中的第二個更具互動性——這是一款叫做Semantris的游戲。游戲側重于測試玩家的單詞聯(lián)想能力,其智能程度就像“與書對話”一樣,并根據(jù)你輸入的答案對屏幕上的單詞進行打分。舉個例子,你有一個由10個單詞組成的列表,如果Semantris呈現(xiàn)“bed(床)”這個單詞在列表上面,你可能會輸入“sleep(睡眠)”作為回應。Semantris將對這10個單詞進行排序,并根據(jù)它認為“床”與“睡眠”之間的語義關系與列表中的其他單詞的關系進行比較。
?值得一提的是,很多這類似的谷歌實驗也是公司收集用戶數(shù)據(jù)的方法之一,通過給用戶提供豐富的文字相關信息,來幫助推送它的技術。這似乎是Semantris的案例,但無論如何,游戲是測試你自己能力的一種有趣方式,也順道看看軟件如何智能判斷單詞之間的聯(lián)系。你也可以玩一玩類似Tetris的游戲,通過輸入文字來清除屏幕上的方塊,根據(jù)你自己的假設,去猜想屏幕上彩色方塊上的文字和你要輸入的答案之間有沒有關聯(lián)。
?無可厚非的是,“與書對話”和SEMANTRIS的設計,旨在用來測試軟件的語義理解能力。
?細數(shù)谷歌眾多過往的AI實驗,像最近可以讓用戶訓練自己基本算法的受教機器工具,以及以前那些專注于涂鴉和音樂制作的小程序,這些web游戲和工具都是很有價值的AI互動方式,更容易應用于現(xiàn)實世界當中。AI,正如“機器學習”、“神經(jīng)網(wǎng)絡”這樣的術語一樣,通常對于不知道來龍去脈的人們來說,聽起來是一個抽象概念,又或在某種程度上,它意味著世界上最強大的軟件應用程序和平臺想要混淆掩蓋搜索引擎下那些不可告人的秘密。但是通過這類似的實驗,谷歌以一種對每個人都受益的方式揭開了AI技術的神秘面紗。
?注:本文由數(shù)據(jù)觀編譯自The Verge網(wǎng)站,作者/Nick Statt ,譯者/黃玉葉,圖片來源于原文配圖。轉載請務必注明來源、出處及作者等信息。
責任編輯:陳近梅