本文總結(jié)推薦22個免費(fèi)的數(shù)據(jù)可視化和分析工具。列表如下:
數(shù)據(jù)清理(Data cleaning)
當(dāng)你分析和可視化數(shù)據(jù)前,常需要“清理”工作。比如一些輸入性列表“New York City” ,同時其他人會說”New York, NY” 。因此你需要標(biāo)準(zhǔn)化這些工作,使看到統(tǒng)一的樣式。下面的兩個工具被用來幫助使數(shù)據(jù)處于***的狀態(tài)。
1、DataWrangler
斯坦福大學(xué)可視化組(SUVG)設(shè)計(jì)的基于web的服務(wù),以你剛來清理和重列數(shù)據(jù)。點(diǎn)擊一個行或列,DataWrangler 會彈出建議變化。比如如果你點(diǎn)擊了一個空行,一些建議彈出,刪除或刪除空行的提示。它的文本編輯很cooool。
2、Google Refine
Google Refine。用戶在電腦上運(yùn)行這個應(yīng)用程序后就可以通過瀏覽器訪問之。這個東西的主要功能是幫用戶整理數(shù)據(jù),接下來的演示視頻效果非常好:用戶下載了一個 CSV 文件,但是同一個欄中的同一個屬性有多種寫法:全稱,縮寫,后面加了空格的,單數(shù)復(fù)數(shù)格式不一的。。。但是這些其實(shí)都代表了同一個屬性,Google Refine 的作用就是幫你把這些不規(guī)范的寫法迅速統(tǒng)一起來。
統(tǒng)計(jì)分析(Statistical analysis)
有時,你需要你的數(shù)據(jù)的圖形化的表達(dá)。
3、R 項(xiàng)目
R語言是主要用于統(tǒng)計(jì)分析、繪圖的語言和操作環(huán)境。雖然R主要用于統(tǒng)計(jì)分析或者開發(fā)統(tǒng)計(jì)相關(guān)的軟體,但也有人用作矩陣計(jì)算。其分析速度可比美GNU Octave甚至商業(yè)軟件MATLAB。
可視化應(yīng)用與服務(wù)(Visualization applications and services)
這些工具提供了不同的可視化選項(xiàng),針對不同的應(yīng)用場景。
4、Google Fusion Tables
Google Fusion Tables 被認(rèn)為是云計(jì)算數(shù)據(jù)庫的雛形。還能夠方便合作者在同一個服務(wù)器上分享備份,email和上傳數(shù)據(jù),快速同步不同版本數(shù)據(jù),F(xiàn)usion Tables可以上傳100MB的表格文件,同時支持CSV和XLS格式,當(dāng)然也可以把Google Docs里的表格導(dǎo)入進(jìn)來使用。對于大規(guī)模的數(shù)據(jù),可以用Google Fusion Tables創(chuàng)造過濾器來顯示你關(guān)心的數(shù)據(jù),處理完畢后可以導(dǎo)出為csv文件。
Google Fusion Tables的處理大數(shù)據(jù)量的強(qiáng)大能力,以及能夠自由添加不同的空間視圖的功能,也許會讓 Oracle,IBM, Microsoft傳統(tǒng)數(shù)據(jù)庫廠商感到擔(dān)心,Google未來會強(qiáng)力介入數(shù)據(jù)庫市場。
5、Impure
Impure,允許點(diǎn)擊、拖曳來連接模塊,由西班牙分析公司Bestiario 創(chuàng)建。
6、Tableau Public
7、Many Eyes
8、VIDI
9、Zoho Reports
10、Choosel
11、Exhibit
12、Google Chart Tools
13、JavaScript InfoVis Toolkit
14、Protovis
15、Quantum GIS (QGIS)
16、OpenHeatMap
17、OpenLayers
18、OpenStreetMap
19、TimeFlow
20、IBM Word-Cloud Generator
21、Gephi
22、NodeXL