隨著大數據在越來越多的企業當中落地,企業要開展大數據相關的業務,那么首先要搭建起自身的數據平臺。而企業搭建大數據平臺,往往需要結合成本、業務、人員等各方面的因素,來規劃數據平臺建設方案。今天我們就來聊聊數據平臺建設的幾種方案。
數據平臺其實在企業當中一直都是存在的,但是進入到數據爆發式增長的大數據時代,傳統的企業級數據庫,在滿足數據管理應用上,并不能完全滿足各項需求。
對于企業而言,基于大數據背景下的企業數據管理應用,也需要更加符合需求的數據平臺建設方案。
主流數據平臺建設方案
從市場主流選擇來看,企業數據平臺建設方案,目前大致有以下幾種:
1、常規數據倉庫
數據倉庫的重點,是對數據進行整合,同時也是對業務邏輯的一個梳理。數據倉庫雖然也可以打包成SAAS那種Cube一類的東西來提升數據的讀取性能,但是數據倉庫的作用,更多的是為了解決公司的業務問題。
2、敏捷型數據集市
數據集市也是常見的一種方案,底層的數據產品與分析層綁定,使得應用層可以直接對底層數據產品中的數據進行拖拽式分析。數據集市,主要的優勢在于對業務數據進行簡單的、快速的整合,實現敏捷建模,并且大幅提升數據的處理速度。
3、MPP(大規模并行處理)架構
進入大數據時代以來,傳統的主機計算模式已經不能滿足需求了,分布式存儲和分布式計算才是王道。大家所熟悉的Hadoop MapReduce框架以及MPP計算框架,都是基于這一背景產生。
MPP架構的代表產品,就是Greenplum。Greenplum的數據庫引擎是基于Postgresql的,并且通過Interconnnect神器實現了對同一個集群中多個Postgresql實例的高效協同和并行計算。
4、Hadoop分布式系統架構
當然,大規模分布式系統架構,Hadoop依然站在不可代替的關鍵位置上。雅虎、Facebook、百度、淘寶等國內外大企,最初都是基于Hadoop來展開的。
Hadoop生態體系龐大,企業基于Hadoop所能實現的需求,也不僅限于數據分析,也包括機器學習、數據挖掘、實時系統等。企業搭建大數據系統平臺,Hadoop的大數據處理能力、高可靠性、高容錯性、開源性以及低成本,都使得它成為首選。
關于大數據平臺架構,數據平臺建設的幾種方案,以上就為大家做了一個簡單的介紹了。企業基于大數據平臺建設的需求,對于專業人才的需求度也正在增加,具備過硬技術實力的大數據人才,將受到更高程度的青睞。
原文鏈接:http://www.dtinone.net/news/2087.html