來源:雷鋒網 時間:2017-01-24 12:56:09 作者:程弢
日前,國內云服務商騰訊云宣布推出FPGA云服務器,引起了業(yè)界一陣熱議,這是繼國外亞馬遜以及微軟等企業(yè)在數(shù)據(jù)中心做出部署FPGA的嘗試之后,國內首個FPGA云服務器。短短一年的時間,國內外主流云服務企業(yè)紛紛把目光聚焦在了FPGA上,這顯然不是巧合,整個云服務行業(yè)似乎已經對FPGA在高性能計算上的重要性上達成了一致。
本月早些時候微軟亞洲研究院實習生李博杰曾在知乎上介紹了FPGA的技術特點,其優(yōu)勢已是路人皆知。但在FPGA云服務器大規(guī)模應用之前,大家需要思考的是它對產業(yè)鏈的影響是什么,如云服務商該如何部署FPGA云服務器?哪些業(yè)務適合放在FPGA云服務器上?它對開發(fā)者帶來了什么樣的挑戰(zhàn)?帶著這些問題,雷鋒網采訪了騰訊云FPGA團隊。
據(jù)介紹,騰訊云FPGA團隊由騰訊云基礎產品中心、騰訊架構平臺部組成的團隊,該主要負責FPGA云服務器的開發(fā)。
雷鋒網:FPGA云服務器是一個什么樣的概念??
FPGA云服務器
FPGA云服務器,一方面它是屬于異構計算平臺的硬件體系結構,通過并行計算方式,提高服務器計算性能、能效比和計算實時性,對應用實現(xiàn)底層的硬件加速處理;另一方面,通過云服務提供給用戶,用戶可按需付費使用FPGA,極大降低FPGA的使用成本。
以騰訊云為例,騰訊云已經在國內提供了第三方FPGA知識產權市場,通過騰訊云服務市場,F(xiàn)PGA開發(fā)者和使用者可以實現(xiàn)高效交易;對于FPGA使用者而言,可以在此購買已開發(fā)并驗證好的FPGA知識產權功能,可節(jié)約長達數(shù)月的FPGA研發(fā)周期,同時采用按需使用的付費模式,能最大化地幫助使用者節(jié)省硬件投入成本。
雷鋒網:在FPGA云服務器中,CPU會被替代還是“CPU FPGA”的異構計算模式,它的優(yōu)勢是什么?FPGA云服務器并不是要用FPGA替代CPU,而是要將一些CPU做不了的或者不擅長的工作offload到FPGA,讓FPGA和CPU協(xié)同工作,是一個以FPGA為協(xié)處理器的異構計算平臺。
FPGA獨特的架構帶來了其他處理器無法比擬的優(yōu)勢,主要體現(xiàn)在它在吞吐率,延遲,功耗和靈活性4個維度上達到了很好的平衡,不存在短板。
具體來講,F(xiàn)PGA跟CPU相比,吞吐率、延遲及單位功耗計算性能都有明顯的優(yōu)勢;與GPU相比,則因為FPGA很容易做到流水線并行和數(shù)據(jù)并行,因此能同時做到高吞吐和低延時,而GPU幾乎只能做數(shù)據(jù)并行,因此延遲比較大;ASIC則因為它的長開發(fā)周期和低靈活性,很難適應數(shù)據(jù)中心業(yè)務的變化,也很難完成硬件資源在不同業(yè)務中的分配和調度。
另外由于FPGA有高速SERDES等豐富的接口,而且能靈活控制實現(xiàn)的粒度和操作數(shù)據(jù),因此非常適合進行協(xié)議處理和數(shù)據(jù)格式的轉換。比如說FPGA可以很方便的接入以太網數(shù)據(jù),并對以太網包進行用戶自定義的包過濾等處理,而其他處理器卻很難做到。
雷鋒網:騰訊云使用的是哪家的FPGA芯片?如何部署,一臺服務器有多少FPGA?目前騰訊云使用的芯片廠家包括業(yè)界主流的Xilinx和Intel兩大廠商。前期我們推出的FPGA實例是基于Xilinx芯片平臺,基于Intel平臺的服務會盡快推出。
FPGA云服務器為了提高單臺服務器計算密度和加強FPGA之間通信,每臺服務器支持4個FPGA或8個FPGA配置,滿足用戶超大計算需求。一期針對簡單業(yè)務場景,我們提供單機單實例的FPGA云服務器;針對更高性能需求的業(yè)務場景,我們近期也將提供單機多實例的FPGA云服務器。
雷鋒網:什么業(yè)務/應用場景適合使用FPGA云服務器?能否舉例說明?FPGA云化對整個FPGA行業(yè)來講有著革命性的影響,F(xiàn)PGA的云化大大降低了FPGA的使用門檻,完全不需要新的硬件定制,只需要比較少的投入就可以得到較高的收益。會使得之前一些不傾向于使用FPGA或不會使用FPGA的行業(yè)或者業(yè)務場景,現(xiàn)在重新審視是否需要用FPGA的優(yōu)勢來做點什么。
FPGA的優(yōu)勢是計算的高吞吐量、低延時、低功耗。
1.在機器學習領域、金融領域、大數(shù)據(jù)領域、基因檢測領域都存在比較大的數(shù)據(jù)量需要分析計算,這些是FPGA云服務器可以發(fā)揮高吞吐優(yōu)勢的領域。
2.網絡安全領域有更安全、更低延時的需求,這些場景也可以發(fā)揮FPGA低延時的優(yōu)勢。
3.超大規(guī)模圖像處理,這些圖片的處理都使用FPGA來進行處理加速都可以得到滿意的效果。
4. 現(xiàn)在比較熱門的自然語言處理和語音識別這些也都是FPGA可以發(fā)揮優(yōu)勢的場景。
一言以蔽之,F(xiàn)PGA云化之后,F(xiàn)PGA的使用門檻降低,可以極大地拓寬FPGA的使用場景,這些需要我們所有人去進一步探索。
雷鋒網:如何滿足開發(fā)者的需求?IP(Intellectual Property)即知識產權,是在FPGA設計中,使用Verilog等硬件描述語言開發(fā)的功能模塊。一直以來,F(xiàn)PGA行業(yè)內的IP提供者和使用者缺乏一個公開的交易平臺和信用保證機制,IP交易環(huán)節(jié)冗長,價格不透明,很難達成交易。
騰訊云現(xiàn)在的做法是為開發(fā)者提供一個FPGA IP商店——騰訊云服務市場,IP開發(fā)者和IP提供商可以通過該IP商店為其他客戶無償或有償?shù)靥峁〧PGA IP和對應的測試程序。當然,這些IP都是基于騰訊FPGA的標準硬件來開發(fā)定制的,IP的驗證和測試可以很方便地在云平臺上完成,一個IP的交易可以由幾個月縮短到幾分鐘,提高交易效率,也使得IP交易變得更加透明;另外,騰訊云FPGA提供了FPGA的底層硬件支撐平臺,類似操作系統(tǒng)的部分功能,簡化了開發(fā)者對底層通用設備的訪問,比如DDR和PCIE這些通用設備,可以使開發(fā)者更聚焦到業(yè)務功能的開發(fā)。
從這一點來看,F(xiàn)PGA云化意義重大,可以推動整個FPGA行業(yè)的發(fā)展,給FPGA產業(yè)鏈的各方都可以帶來收益。
雷鋒網:與傳統(tǒng)的FPGA解決方案相比,F(xiàn)PGA云服務器的費用有什么變化?整體有哪些區(qū)別??
傳統(tǒng)FPGA 解決方案 :
硬件成本高:高服務器投資運營成本,F(xiàn)PGA 硬件交易價格不透明;
部署難度大:設計并大規(guī)模生產需要解決供應鏈、制造工藝、可靠性測試等多個環(huán)節(jié),需耗費數(shù)月甚至數(shù)年;
運維成本高:為保障服務穩(wěn)定需承受高額的運維IT成本 。
FPGA 云服務器:
使用成本低:您無需預先采購 FPGA 或采購硬件資源來運行 FPGA,騰訊云提供按需售賣的方式提供FPGA云服務器,您可按需購買,無需投入大量資金購置物理服務器;
部署時間短:部署開發(fā)時間從數(shù)年或數(shù)月縮減到數(shù)天;
運維成本低:低服務器運維成本,避免本地數(shù)據(jù)中心開發(fā) FPGA 無差別的繁重工作,助您有效降低基礎設施建設人力和成本投入。
雷鋒網:之前在微信、QQ等業(yè)務上已經有應用,為何選擇在這個時候對外開放?我們目前內部業(yè)務如微信和QQ等在FPGA的成功應用,已經驗證了FPGA在互聯(lián)網業(yè)務中可以起到異構加速的作用。對于行業(yè)來說,云是一種共享服務的思想,用戶不以占有的方式使用硬件和軟件,而是共享復用,因此大大降低了使用成本,提升了資源的使用效率。
FPGA云服務能給行業(yè)生態(tài)鏈各方帶來價值:
芯片原廠:不需要經過層層代理,增加成本,而是可以通過云提供硬件板卡的服務。因為硬件統(tǒng)一采購和維護,也大大提升了穩(wěn)定性和可靠性。
IP提供商:可以把IP放到云平臺的市場中去,最終用戶使用時,通過云平臺完成部署和交付,用戶不需要接觸可執(zhí)行文件(網表文件),因此不存在產權泄露的風險。這將鼓勵IP提供商提供更多的服務方式,可以提供按時長計費,買斷計費,乃至試用版免費等方式,用戶也可以迅速驗證。
設計和開發(fā):云提供框架方式,封裝了常用的系統(tǒng)級操作(DDR內存的訪問、DMA、PCIE設備控制等),可以支持硬件描述語言,也支持OPENCL以及類似C的高級語言。提供通用的驅動和調用庫,不需要用戶編程。對高階用戶而言,也可以使用OPENCL或者硬件描述語言實現(xiàn)自己的功能。
正是云對FPGA行業(yè)的顛覆、革命和價值,所以我們通過云端開放FPGA計算服務,把FPGA作為云端基礎架構的一部分,從硬件層面加速云計算在各個場景中的應用,降低大中小型企業(yè)以及用戶的使用門檻和成本。
雷鋒網:如何看待云服務商開始推FPGA解決方案?騰訊云與其它云服務企業(yè)的方案有何區(qū)別?我們樂于看到更多企業(yè)提供FPGA的云服務,共同加速各行各業(yè)使用FPGA的進程,加快完善FPGA生態(tài)圈。
總結來看,這次FPGA的發(fā)布,騰訊云在業(yè)內有幾點領先的差異化優(yōu)勢:例如,騰訊云的FPGA技術已經在騰訊的QQ、微信業(yè)務中長期部署和驗證。騰訊云通過解決FPGA云服務器的部署、知識產權(IP)提供者分享IP以及應用程序開發(fā)者購買IP三大問題,用于建設與完善FPGA開發(fā)者生態(tài)。
另外值得一提的是,騰訊云和業(yè)界兩大FPGA 廠商(Xilinx 和 Intel)保持著有良好的關系,這也可以方便開發(fā)者選擇自己熟悉的開發(fā)模式,避免切換平臺。
雷鋒網:騰訊云接下來有什么規(guī)劃?接下來,一方面在硬件機型上,我們會推出一臺服務器具有多個FPGA,提供更大的硬件加速性能;另一方面,在軟件層面上,我們進一步完善FPGA開發(fā)框架,該開發(fā)框架支持 C/C 、OpenCL、Verilog/VHDL等開發(fā)語言,F(xiàn)PGA 開發(fā)人員可以選擇自己熟悉的語言方式進行 FPGA 邏輯設計。同時,該開發(fā)框架提供類似操作系統(tǒng)的支持,可以方便訪問DDR、使用DMA完成主機和FPGA之間通訊,開發(fā)者只需關注面向應用的邏輯設計。
雷鋒網:為何FPGA云服務器逐漸受到了主流云服務商的青睞?是人工智能驅動?這會是行業(yè)的必然趨勢?騰訊云包括國內外其他同行都在推FPGA云服務器,這是產業(yè)發(fā)展和市場需求的雙重驅動。
一方面隨著芯片制程逼近理論極限,可以預見通用處理器(CPU)性能再也無法按照摩爾定律進行增長,另一方面移動互聯(lián)網帶來的數(shù)據(jù)增長對計算性能要求超過了按“摩爾定律”增長的速度,比如騰訊內部業(yè)務隨著移動互聯(lián)網的快速增長,例如圖片數(shù)據(jù)體量的急劇膨脹,同時伴隨著對這些數(shù)據(jù)的計算需求也在迅猛上漲。從市場看,人工智能的發(fā)展也對數(shù)據(jù)的計算需求凸顯,也是另一個驅動因素。
騰訊曾在2013年開始考慮如何解決計算需求的增長,而FPGA作為一種可編程的加速硬件彼時進入了大家的視野。騰訊內部已經對FPGA技術展開了多年的研究,可以確定的是,F(xiàn)PGA在數(shù)據(jù)中心里可以提供強大的計算能力和足夠的靈活性應對數(shù)據(jù)中心對硬件加速的挑戰(zhàn),把FPGA的技術積累服務推廣給更多的企業(yè),這也是騰訊云推出國內首款高性能異構計算基礎設施——FPGA云服務器的原因之一。
從全球看,亞馬遜等同行已經使用FPGA在其公有云網絡中進行了諸多積極嘗試,可以看出,F(xiàn)PGA在云服務領域已經勢不可擋。
后記騰訊云FPGA聯(lián)合團隊還告訴雷鋒網,在騰訊云公眾號發(fā)布后的幾小時內,他們收到了數(shù)百名開發(fā)者的試用申請以及一些大客戶的咨詢。雖然,F(xiàn)PGA云服務器對大多數(shù)企業(yè)來說,還是一個相對陌生的概念,但從主流云服務廠商陸續(xù)開放這一服務的趨勢來看,F(xiàn)PGA對數(shù)據(jù)中心將會越來越重要,而未來也會有更多的企業(yè)把業(yè)務部署在FPGA云服務器上。
?點擊進入 騰訊云 在數(shù)據(jù)觀的企業(yè)欄目>>>
責任編輯:陳近梅