今日,華為在深圳舉辦2019全球數據基礎設施論壇,面向鯤鵬計算產業,宣布全面啟動數據基礎設施戰略,并開源數據虛擬化引擎HetuEngine(河圖引擎),希望讓伙伴像使用“數據庫”一樣使用“大數據”,讓數據治理、使用更簡單。
據了解,這是繼今年9月基于“鯤鵬+昇騰”雙引擎全面啟航計算戰略后,華為從數據角度對計算戰略的再度闡述。
在論壇現場,華為Cloud & AI產品與服務總裁侯金龍在題為《打造“融合、智能、開放”數據基礎設施,攜手邁入智能時代》主題演講中表示:“隨著5G、AI、云等技術的深度應用與融合,劇增的數據正在改變我們的生產和生活,但也帶來找數難、取數難、用數難等挑戰。華為面向鯤鵬計算產業,全面啟動數據基礎設施戰略,提供融合、智能、開放的數據基礎設施,對數據的采、存、算、管、用實施端到端的整合和優化,致力于讓數據在全生命周期內好用,數據的每比特價值最大,每比特成本最優,讓合作伙伴像使用‘數據庫’一樣使用‘大數據’。”
華為Cloud & AI產品與服務總裁侯金龍在大會上發表主題演講
打造融合、智能、開放數據基礎設施
華為數據基礎設施包括數據存儲、數據處理、數據管理系統、數據虛擬化引擎等,它包含以下三大特征:
融合:基于在存儲、數據庫、大數據等技術領域的突破,打破“存儲內部系統墻”、“數據庫與存儲鏈路墻”、“大數據與存儲配置墻”、“數據庫與大數據協同墻”四堵墻。這四堵墻的打破,讓數據融合更徹底,幫助客戶實現TCO降低30%以上、據訪問和處理性能提升2倍、分析效率提升100%。
智能:基于AI芯片、存儲和華為云的三層架構,通過云上云下結合,云上訓練和云下推理,讓系統越用越快、越用越省。其中,依托昇騰處理器的AI能力,自動學習和識別IO流,提升Cache預取命中率,系統整體性能提升20%;依托鯤鵬處理器的多核算力,根據不同的數據類型,實時優化數據縮減算法,TCO降低25%;結合華為云自身運大規模維運營經驗,當前可以實現提前14天預測硬盤故障,提前60天預測性能瓶頸,提前365天預測容量不足,其中30%的故障可以自我修復。
開放:針對找數難、取數難、用數難的問題,推出數據虛擬化引擎HetuEngine,屏蔽數據類型差異、地域差異、語法差異,讓數據治理、使用簡單。HetuEngine擁有“一個入口、一個目錄、一份數據、統一安全”四大核心能力,通過屏蔽數據基礎設施的復雜度,讓伙伴像使用“數據庫”一樣使用“大數據”,復用現有的生態、工具和技能,提升開發效率2到10倍。
在本次大會上,華為正式宣布開源HetuEngine。開源版本的河圖引擎叫openHetu,將于2020年6月上線。華為將開源內核,開發者可以基于開源代碼進行定制,包括數據源擴展、SQL執行策略等,實現應用快速對接,提升開發效率。
華為Cloud & AI產品與服務總裁侯金龍宣布開源數據虛擬化引擎HetuEngine