這是數(shù)據(jù)可視化(全彩) 陳為下載,本書從研究者的角度,介紹數(shù)據(jù)可視化的定義、方法、效用和工具,既可作為初學(xué)者的領(lǐng)路手冊,也可用于可視化研究和可視化工具使用的參考指南。
數(shù)據(jù)可視化(全彩) 陳為是在確定數(shù)據(jù)可視化為自己研究主題之初,我經(jīng)常上網(wǎng)搜尋相關(guān)資料。但是初期的收集經(jīng)常是雜亂無章,缺乏系統(tǒng)規(guī)劃的。以至于我產(chǎn)生了三個困擾我的問題、
1. 信息可視化與數(shù)據(jù)可視化,到底有什么區(qū)別?或者說infographics 與visualization之間有何區(qū)別?
2.data visualization就是數(shù)據(jù)挖掘之后的用于顯示結(jié)果的統(tǒng)計圖嗎?
3.曾經(jīng)在知乎上看見某資深程序員直言,數(shù)據(jù)可視化在國內(nèi)除了折騰一下社交網(wǎng)絡(luò)外,沒什么好做的,是這樣嗎?
今年4月以來,我終于有時間仔細(xì)研究相關(guān)問題。閱讀大量文獻(xiàn)資料,尤其是購買了幾本專著,如《數(shù)據(jù)之美》、《可視化數(shù)據(jù)》、《數(shù)據(jù)可視化之美》、《鮮活的數(shù)據(jù)》、《數(shù)據(jù)可視化實(shí)戰(zhàn):使用D3設(shè)計交互式圖表》以及一系列數(shù)據(jù)挖掘相關(guān)的案例及算法書。但最給我有開闊視野、醍醐灌頂之功效的書,還是這本浙大陳為教授等人編著的大數(shù)據(jù)叢書:數(shù)據(jù)可視化。本來國內(nèi)可視化領(lǐng)域的專著就極少,市面上基本是國外翻譯書的天下。而我得說這是我目前看過的,最系統(tǒng),最專業(yè)的,涵蓋全面的教材。首先,分類明確,結(jié)構(gòu)清晰;其次用例翔實(shí),資料豐富,2013年編著所以資料很新,且每章都有參考文獻(xiàn),最后還有一大堆資料連接,簡直是論文寶典;最后,全彩印刷,效果一級棒。之前困擾我的問題。
1. 最好的理解是,數(shù)據(jù)可視化包含信息可視化。信息可視化是數(shù)據(jù)可視化的一個研究分支。可視化是普適性的,而信息圖是具體的?梢暬遣灰?yàn)閮?nèi)容而改變的,而信息圖則和內(nèi)容本身有著緊密的聯(lián)系。于是乎,數(shù)據(jù)可視化被劃分了三個分支,分別是科學(xué)可視化,信息可視化,可視分析學(xué)。這種分類也被諸多權(quán)威人士所認(rèn)可,恰好對應(yīng)著三個國際會議:IEEE conference on scientific visualization (SciVis),IEEE conference on Information visualization(infoVis),IEEE conference on visual analyticsscience and technology(VAST).
2.本來數(shù)據(jù)挖掘與可視化就是密不可分的。智能數(shù)據(jù)分析所產(chǎn)生的的知識與人類所掌握的知識正是導(dǎo)致新的知識發(fā)現(xiàn)的根源。而表達(dá)、分析與檢驗(yàn)這些差異必須用到人腦智能,必經(jīng)之路是用視覺感知為通道。故而這里涉及到數(shù)據(jù)可視化的另一個分支:可視分析學(xué)(Visual Analytics)。不論從何種數(shù)據(jù)分析-可視化模型,都在可視化與數(shù)據(jù)挖掘之間構(gòu)造了一個循環(huán)——互相影響的螺旋形上升的循環(huán),最終目的是在其中獲取知識。故而數(shù)據(jù)可視化絕不僅僅是用于顯示結(jié)果的統(tǒng)計圖,而是結(jié)合在整合數(shù)據(jù)分析過程中的不斷迭代的一份子,是與用戶交互的必經(jīng)之路。并且其形式遠(yuǎn)超基本統(tǒng)計圖型。
3. 顯然社交網(wǎng)絡(luò)只是一個數(shù)據(jù)可視化可以結(jié)合的研究點(diǎn)。事實(shí)上數(shù)據(jù)可視化是普適的,幾乎可以跟任何學(xué)科集合。簡單的羅列我感興趣的方面:文本分析,地理信息位置,數(shù)字生活可視化。