智東西(公眾號:zhidxcom)
文 | 心緣
智東西8月10日報道,在今天的華為HAI 2020大會上,華為發布迄今為止業界最豐富的AI全棧軟件平臺,覆蓋從基礎軟件到應用使能,同時展示了最強的AI算力平臺。
這是華為首次全方位披露其昇騰全棧AI基礎軟件能力,異構計算架構CANN、全場景AI計算框架MindSpore、全流程開發工具鏈MindStudio、昇騰應用使能MindX四大核心軟件一并亮相。
這一次,華為AI的主角從頗負盛名的芯片,換成了釋放華為硬件性能的隱藏英雄——軟件。
作為銜接AI技術與行業應用之間的橋梁,昇騰AI全棧軟件平臺是華為實現普惠AI的重要基座,不僅決定AI開發效率,還關乎AI硬件在實際應用中真正能發揮出的最佳算力。
華為的昇騰AI全棧軟件平臺,究竟強在何處?
通過華為昇騰AI全棧軟件平臺全景圖,我們可以領略到華為在AI布局方面的嚴密與穩重,同時對華為的AI實力和優勢有了更清晰全面的認知。
基于充分結合的軟硬件基礎設施,華為昇騰計算產業生態正快速擴容,和更多合作伙伴一同推動AI計算產業的發展。
在持續升溫的AI計算競賽中,華為已然準備就緒,并率先沖在了推進智能化進程的最前排。
一、昇騰計算軟件全景圖:4大軟件產品構筑8大競爭力
“硬件是AI的基礎,軟件才是AI的未來。”
會上,華為昇騰計算業務總裁許映童首次揭曉昇騰AI全棧軟件平臺全景圖,他提到,在AI領域,華為70%的研發人員投入于軟件研發,面向不同開發者,推出三層的開發模型。
在Atlas硬件的基礎上,針對專業開發者、入門級開發者及業務開發者的不同開發需求,華為推出三大軟件平臺CANN、MindSpore、MindX,以及覆蓋算子開發、模型開發、應用開發的全流程開發工具鏈MindStudio。
其中,異構計算架構CANN是支持全場景AI開發的芯片底層基礎軟件,也是獲取華為昇騰計算資源避不開的入口,它具備軟硬件解耦的特征,后向兼容全系列華為芯片。
MindSpore是全場景AI計算框架,目前已覆蓋逾1.6萬用戶,與33所高校開展AI課程、研究合作,提供20多種主流模型,覆蓋150多種應用。下個月,華為將在HC大會上推出MindSpore 1.0版本以及為網絡模型挑戰賽頒獎。
MindX是昇騰應用使能平臺,通過“2+1+X”助力AI計算融入千行百業,2是深度學習平臺MindX DL和智能邊緣平臺MindX Edge,1是優選模型庫ModelZoo,X則是使能各行業的SDK。值得期待的是,面向視覺和制造的兩個行業SDK將在2020年10月正式對外上線。
“AI的應用程序需要跑在多類型通用CPU,數十個版本的操作系統,運行在從穿戴設備,到大規模集群的各種設備,算力和存在差異數百萬倍,對軟件的適應性和可裁剪、可伸縮性提出了極高的要求。”
許映童說:“而部署的應用場景包括了港口、道路、沙漠等各種復雜場景,設備的供電、環境適應性、網絡可連接性等等均是巨大的挑戰。”
華為昇騰計算業務總裁許映童
這些挑戰使得AI融入實際應用的門檻非常高,在此背景下,華為提出以開發者為中心,通過全棧軟件,把AI算力釋放出來,服務于行業應用和開發。
基于Atlas硬件與昇騰AI全棧軟件平臺的組合拳,華為昇騰計算已構筑8大競爭力。
(1)高性價比:據華為實測,華為AI推理卡Atlas 300I的推理性能、華為最高算力密度服務器Atlas 800的訓練性能均超過業界領先競品。
(2)統一API:CANN通過昇騰統一編程接口AscendCL API,支持端邊云全場景協同。
(3)開放架構:支持TensorFlow、PyTorch等主流AI框架,并適配客戶自研框架。
(4)使能行業:MindX提供多個行業SDK、優選模型庫、深度學習平臺及智能邊緣平臺,其中優選模型庫中提供的預訓練高性能模型到今年底預計有超過60個,可大大降低AI應用門檻。
(5)邊云協同:中心訓練+邊云推理,一站式開發,統一模型部署及更新,模型保護/加密。
(6)最優集群:昇騰集群線性度較業界領先。
(7)開發工具:面向不同類型開發者,構筑貫穿整個開發流程的工具鏈MindStudio。
(8)統一運維:基于FD/SmartKit構筑智能運維。
二、異構計算架構CANN 3.0詳解:專為AI設計,端邊云全場景協同
市面上的AI芯片層出不窮,那么華為的獨到優勢有什么?
回答這個問題,就避不開華為昇騰的一大秘密武器——CANN。
如今,華為的產品線已覆蓋云、管、端、芯,鮮少有公司具備如此龐大而全面的產品矩陣。如果每類芯片各做一套編程語言,那么對開發者而言,要學習的內容會非常繁瑣耗時。
在這一背景下,為AI設計的異構計算架構CANN起到了極為關鍵的作用。
華為投入逾千人的研發團隊專攻CANN研發,歷經三年迭代,形成了端邊云協同的統一編程架構CANN 3.0。
具體而言,CANN 3.0有三大創新特性:端邊云全場景協同、AscendCL使能高效開發、釋放硬件澎湃算力。
1、支持軟硬件解耦,端邊云全場景協同
CANN 3.0具有極強的伸縮性和可適應性,下接異構芯片,上承AI框架,只需編寫一套應用代碼,即可兼容覆蓋端邊云的10+種設備形態、14種操作系統、多種主流AI框架。
華為海思的麒麟芯片、小海思的Hi3559A等芯片、Atlas全系列硬件以及華為云,均使用CANN來實現底層AI芯片使能,即一次開發,全場景適用。
CANN 3.0的核心功能,恰恰是要真正做大AI計算“產業蛋糕”所不可或缺的“軟”實力。
2、統一API、兩種算子開發方式、四大開放性設計
CANN 3.0擁有昇騰統一編程接口AscendCL API、兩種TBE算子開發模式,以及Plugin適配、圖融合優化接口、Ascend-IR接口、預置算子庫源碼開放這四大開放性設計。
異構計算架構CANN 3.0
神經網絡是以算子來組成不同應用功能的網絡結構。這些不同的模塊全部對外開放,支持第三方框架、自定義算子融合、自定義模型、自定義修改算子,端到端覆蓋全場景AI應用開發。
所有底層資源均通過專為深度學習設計和優化的昇騰統一編程接口AscendCL來對外開放。
AscendCL將算子調用API歸一化,支持全系列昇騰芯片,一套應用代碼可以在不同芯片上運行,從而有效簡化編程難度,為神經網絡提供高效算力支撐。
此外,AscendCL還保持后向兼容,現在編寫的代碼,也支持在未來推出的華為昇騰芯片上運行,確保應用軟件可用性。
考慮到不同開發者的需求差異,CANN 3.0提供DSL和TIK兩種張量加速引擎(TBE)算子開發方式,以兼顧對效率和靈活性的不同需求。
其中,TBE-DSL面向入門開發者,可自動實現數據切分和調度,可覆蓋70%的算子,將算子開發時間降低較業界降低70%,使開發者只需關注計算實現表達。
TBE-TIK則面向高級開發者,提供指令級編程和調優過程,可覆蓋全部算子,需由開發者手工完成指令集調用過程,可兼具靈活性和高性能。
3、親和昇騰的圖編譯技術,1000+高性能算子庫支持
CANN 3.0還具備親和昇騰的圖編譯技術,可有效提升圖優化效率,最大化發揮芯片算力。
神經網絡可看作一張張的圖,過去大部分圖在host CPU執行,如今昇騰的圖編譯器,實現整圖下沉執行,圖和算子均可在device側執行,減少了芯片與host CPU的交互時間,從而更充分地發揮昇騰芯片的算力。
圖拆分和融合方面,通過自動算子融合等技術,將大量節點自動拆分、融合,以減少計算節點和計算時間,持續保持計算資源的高強度運行。
數據Pipeline智能優化極大提升數據資源處理效率,通過計算數據智能切分與智能分配流水機制,實現單指令計算單元的最高使用率,并持續保持計算資源高強度運行。
目前CANN 3.0提供有1000+深度優化的硬件親和算子,支持多框架共用,且自適應全系列昇騰芯片,可實現最佳運行性能。
自家的軟件,最懂如何挖掘自家硬件的性能。
基于高度適配的軟硬件組合,華為Atlas硬件在主流推理和訓練模型的性能均為業界領先。
在主流推理場景,據華為實測,AI推理卡Atlas 300I性能超過業界主流推理卡。特別是在高清視頻場景中,單張Atlas 300I推理卡可同時處理80路1080p、25FPS的高清視頻,是業界主流推理卡可同時處理路數的2倍。
對于有大量視頻分析需求的企業,可同時處理的視頻路數越多,整體硬件成本下降的越快。曠視、格靈深瞳等企業正基于華為AI推理卡打造高路數視頻分析解決方案。
華為實測數據顯示,在主流模型訓練場景,華為最高算力密度服務器Atlas 800在多種模型的實測性能超過業界主流新品訓練服務器,平均實測性能約為業界主流上一代訓練服務器的2.5倍。
除了計算卡外,軟件能力也充分釋放了華為AI集群的總體性能。
線性度是指多個機器同時處理運算時,受機器間通信等能力影響,最終實際發揮性能資源的利用率。經由L2網絡與CANN層算法的聯合優化,昇騰芯片的線性度超過業界領先水平。
三、開發工具全家桶MindStudio 2.0:即裝即用,高度智能
工欲善其事,必先利其器,全流程開發工具鏈MindStudio即是華為提供的AI開發“利器”。
MindStudio 2.0提供了一套簡單易用的一站式開發工具,可高效完成端到端全場景開發,讓開發者從算子開發、模型訓練、模型推理、應用開發到應用部署的全流程一套工具全部搞定,無需在不同工具上完成,有效降低開發門檻。
MindStudio可一鍵式完成安裝部署、可視化模型開發和智能調優功能大大提高模型開發效率,算子開發方面則更加高效。
總體來看, MindStudio 2.0能帶給開發者即裝即用、沉浸體驗、智能準確三個優勢。
(1)即裝即用:一鍵式自動化環境準備部署,三步完成軟硬件安裝,所有工具均提供插件形式,并基于開發場景提供各個環節的場景化指導文檔,還為配置參數、專業術語等難理解詞匯提供實時注釋、鏈接和參考。
(2)沉浸體驗:圍繞開發流程提供一站式導視系統,AI幫助一鍵補全算子開發的語法,關聯文件自動高亮,針對不同開發對象自適應提供對應AI工具的快捷功能,減少開發過程中的操作步驟,并提供無邊界UI設計,打造沉浸式開發體驗。
(3)智能準確:基于用戶認知提供硬件運行單元級別可視化的調優分析報告,基于不同維度提供多樣化的模型精度對比結果。
除了提高開發效率外,華為昇騰還提供了用于優化模型訓練、推理性能的工具,這些工具調用了CANN底層的能力來做親和網絡。
例如,昇騰訓練加速工具利用獨有的Less BN(智能識別網絡中不必要的BN算子)和隨機凍結算法大幅提升模型訓練效率,可將ResNet模型的訓練吞吐量提高25.6%;昇騰模型壓縮工具利用獨有的智能算法加速推理進程,可將Yolov3模型推理速度提高47.2%。
結語:普惠AI的先行者
如果我們對華為AI布局的認知僅限于沖鋒在前的AI硬件產品,那就低估了華為的AI實力。
從華為整體的昇騰計算產業來看,華為的全棧全場景AI解決方案正日臻完善。從底層IP核、芯片、硬件、芯片使能軟件、開源AI框架等基礎設施,到貼近應用的軟件平臺和行業SDK,華為充分照顧到不同AI開發訴求。
華為正遵循“硬件開放,軟件開源,使能合作伙伴”策略,將昇騰AI定位為AI基礎設施提供者和千行百業使能者,積極構建開放的生態。
華為還是那個“上不做應用、下不碰數據”的“黑土地”耕耘者,而華為昇騰計算的技術種子正由越來越多的生態伙伴們播撒到千行百業。
“極簡易用,讓AI計算無處不在,極致性能,讓AI計算觸手可及”的AI戰略,不止是面向行業客戶,也在賦能廣大的獨立軟件開發商和AI開發者。
在華為昇騰AI計算業務的計劃中,未來三年將發展100萬名開發者。
為了達成這一目標,華為昇騰已經面向高校、開發人員、初創企業等推出了合作伙伴計劃,并提供從學習、產品構建到產品上市、銷售的全方位激勵機制,為跨越AI技術與行業應用的鴻溝積極貢獻力量。
截至今日,華為已聯合超過60家高校開設昇騰課程,有100多家獨立軟件開發商(ISV)完成昇騰認證,已孵化120多起落地解決方案,培養了超過4萬名開發者。
在這生機盎然的信息時代轉折時刻,我們正見證著AI不著痕跡地改變世界。
而華為昇騰計算作為其中頗具戰斗力的實力玩家,正以廣而深的生態布局,拉動我國AI計算產業以更強的驅動力走向未來。
本文為企業推廣,本網站不做任何建議,僅提供參考,作為信息展示!
推薦閱讀:河工網
網友評論
請登錄后進行評論|
0條評論
請文明發言,還可以輸入140字
您的評論已經發表成功,請等候審核
小提示:您要為您發表的言論后果負責,請各位遵守法紀注意語言文明