作者介紹
彭其捷鑽研網路服務多年,出版過 3 本 UX 使用者經驗專書,曾大量接觸設計、工程,使用者體驗等相關工作,近年因大數據 & 物聯網概念蓬勃發展,觀察到越來越多數據導向的服務興起。然而,艱澀的數據需要良好的設計輔助,才能創造良好的閱讀體驗,其中特別依賴資料視覺化的相關能力。因此,本專欄特別針對各類網路服務的資料呈現提出美學觀點,分享一些國內外資料視覺化的概念、工具與案例。
系列文章介紹
FINDIT 的目標是『發現趨勢,看見未來』,事實上,眾多的趨勢就隱藏在眾多的數據當中,等待著人們去發現、去解讀。透過『資料視覺化』的輔助,能夠把冷冰冰的數據圖像化,協助人們掌握趨勢,更能夠協助新創企業在創新創業過程中找出正確方向,或是幫助投資人找到潛在投資標的,是一項強大的武器。
本系列文章將從資料視覺化的概念開始著手,之後會陸續分享視覺化的經典案例,相關工具介紹等等,希望讀者們能夠在大數據時代,透過視覺化的輔助,說出好的故事。
大數據:未來的新石油
大數據逐漸成為重要的戰略資產,數據即戰力,不論是政府單位、傳統大企業、新創企業等,目前都大量依賴數據的解讀,來推導各類決策,數據力已經能夠代表一個單位的策略能力指標,橫跨政治層面、商業層面、媒體層面等等。
美國歐巴馬政府在2012年時,甚至宣告大數據乃『未來新石油』,拉高了大數據議題的戰略性地位,大數據已經成為國家競爭力的一環,與國家的安全性與趨勢習習相關。
資料量的爆炸
大數據影響力提升的另一個原因,在於各類現代化網路服務的興起,越來越多的資料被創造或是收集,不管是與人有關的數據(社交數據、消費數據等),或是機器產生的數據(工廠數據、系統數據)等等,而智慧型手機的普及,更帶來了數據量的顯著提升,也導致了數據分析進入了不同時代的分水嶺,從儲存設備到數據解讀的技巧,都帶來了全新的挑戰。
有一種說法,全世界 90% 的數據都是近幾年產生的,且還在持續指數型成長當中。根據思科(Cisco)的研究,全世界的資料量已經到達ZB的層級(10億TB),而且還以每個月 100EP(0.1 ZB) 以上的速度指數成長當中。
圖1:資料量爆炸,且成長速度越來越快
資訊降維
資料量爆炸,海量的數據海讓我們迷惘,深怕錯過了重要數據,行駛錯誤的方向。因此,人們開始培養『資訊降維』的技術,『資訊降維』的概念指的是將數據進行整理,去掉所謂的噪音,留下有價值的資料,把重要的資訊過濾出來放在同張圖表當中,讓我們能夠更專心解讀其意義,避免受到不必要的干擾。資訊降維的概念,強迫我們過濾業務所需數據,讓我們可以再思考數據當中的關鍵資料,並做進一步分析。
圖2:『資訊降維』的程序,我們能過濾出重點數據
資料視覺化:大數據的燈塔
將資訊降維最常見的技巧,就是將資料進行視覺化作業,大數據時代,現在的人們除了加強資訊技術的處理效率之外,另外一個重點目標,就在於讓別人看懂這些碎片化的數據,節省大家時間,資料視覺化就好像是大數據的燈塔,在資料迷霧當中指引著人們的方向。
圖3:資料視覺化能夠把碎片化的資料進行統合
不過資料視覺化並不是全新的概念,傳統的作法大多是透過 Excel 來達成,但過去視覺化大多只是知識解讀的手法而已,並沒有佔有重要的地位。然而,現今資料視覺化卻是重要的技能,舉例來說,員工想要報告業務決策時、企業想要申請提案時、研究人員想要報告趨勢時,資料視覺化都是必備的技能。
對於資料視覺化的強大需求,也催生了一些世界級的產品像是 Tableau、PowerBI 等等,許多公司積極安排員工進行教育訓練,務必讓員工學習更好的視覺化工具,以便跟上世界的腳步,做出更好的決策。
新創事業與資料視覺化
新的時代,講究數據為王,許多新創題目也都與數據關係密切,舉凡如物聯網、健康照護、甚至是線上學習、Fintech、比特幣、政府數據等等,資料無所不在。
例如:芬蘭物聯網新創公司Cyberlightning就將能源資訊,透過視覺化並結合地圖資訊,清楚的將相關數據報告進行呈現,讓一般人更好吸收。
圖4:Web端技術的改善,讓許多資料可以自由的透過網路視覺化呈現
對於新創事業來說,視覺化技術也能夠幫忙把業務數據故事說得更清楚。無論是在執行募資簡報時,或是盤點公司各類數字時,視覺化的能力讓我們更容易看出問題的本質,減少資訊吸收的壓力,讓新創事業更蓬勃成長。
資料視覺化的優點
原本就已經有意義的數據,為什麼我們還要辛苦轉換成各式各樣的數據圖表呢?資料視覺化到底有什麼好處呢?以下分享一些視覺化優點介紹:
視覺化讓我們更容易理解數據
人體五官與大腦辨識處理的能力是有限的,但大數據的特性就在於超大量、多元性、動態變化等等,常常不小心就超過人類可消化的複雜度等級。不過,人類的所有感覺器官中,『視覺』對於複雜資訊的反應能力是最好的,我們生活當中無時無刻,都透過視覺取得大量的資訊,所以同樣一批資料,透過視覺圖表呈現,將大為降低解讀的複雜度。
例如:網頁伺服器的存取記錄,在尚未視覺化的log階段,是非常難以理解的,但將同樣的數據視覺化之後,即使是一般人也能掌握這些數據,甚至解讀背後的意義,推導出後續的業務邏輯,大為提升人們對資料的理解力。
圖5:左邊是一般網頁log的記錄表,尚未視覺化之前並不容易閱讀,右邊則是google將其資料視覺化的結果
視覺化可提升決策的信心,降低決策門檻
數據本身具有模糊性,不同人看同一批數據可能產生不同的解讀,傳統的數據大多透過表格進行呈現,但數據量只要稍微大一點,就不容易進行閱讀,甚至容易誤判,當決策人員需要更多的經驗來進行判斷,就可能錯失決策時機。當大量的數據成為組織的戰略性資產時,如何分析數據便成為關鍵。因此,對於企業來說,如果資料能夠妥善的視覺化,必然可協助人們做出更好的決策,提升決策的信心。
此外,視覺化也能夠降低決策門檻,例如台北市政府就提出『開放政府』的口號,將各類政府數據視覺化,讓一般民眾也能參與決策,g0v 中央政府總預算(http://budget.g0v.tw/budget)網站,就用視覺泡泡圖,揭露了政府預算的秘密。
圖6:g0v 中央政府總預算,資料視覺化降低資料的門檻,邀請人民共同決策
視覺化可輔助溝通效率
在溝通商業問題時,如果只透過口語或數字,常常會因為不同人的溝通邏輯差異,導致誤會。為了降低主觀性的錯誤決策,我們可以準備一張紙跟一隻筆,各自把想法畫在紙上,就能快速統合不同人的認知。這就是視覺化溝通的威力,可以把分散在各地的碎片化資訊與想法,整理出乾淨的視覺脈絡,並且用 10 倍速的方式統合不同人的認知,快速提升溝通成效。
然而,因為視覺化技術的發展,許多人喜歡把圖表弄的很複雜,其實違背了視覺化的初衷,也就是『清楚比漂亮更重要』。與其繪製超華麗的花瓣圖、資訊圖表,如果你並不有很多時間去說明你的圖表(例如簡報時),使用常見的圖表也是不錯的策略,避免過度設計,因為許多業務問題本身即可透過常見視覺圖表(例如長條圖、圓餅圖等等)就可說明清楚,而圖表閱讀者也不需要花費腦力來理解新的閱讀邏輯,更容易用過去的經驗來進行判讀。
圖7:有時候標準的統計圖表,反正更容易快速吸收
視覺化讓人更願意吸收資料
維也納社會與經濟博物館計劃主持人奧特.聶瑞說了一句名言:
『與其忘記精準的數字,不如記得簡化的圖像』
我們在傳遞訊息的時候,最大的目標在於讓對方清楚收到想法,然而,如果我們直接將完整的數據集內容提供給對方,有可能導致對方吸收資訊意願的降低。所以,我們可以搖身一變成為數據說書人,結合資料視覺化技能的輔助,讓分析的過程變得更有趣,讓報告更有視覺吸引力,讓更多人對內容主題感興趣,並成功傳遞資訊的價值。
以下是 The New York Times 針對從 1900 歷年來三振出局數據所製作的資料視覺化圖表,透過圖表我們清楚的觀察到相關數據的改變,或是在 2012 年達到最大值等等。如果同樣的數據改成用表格呈現,人們閱讀的意願將會降低。
圖8:大聯盟各隊平均一場比賽的三振數[1]
好的資料視覺化能夠吸引人閱讀,透過顏色、形狀、對比的視覺暗喻,能夠讓人覺得這些資料不再冷冰冰,而是能夠跟人親近的分析結果,讓我們的數據意涵更容易傳遞。
如何執行一個漂亮的資料視覺化作業?
為了完成一次成功的資料視覺化工作,除了準備好乾淨的資料之外,還有其他許多需要掌握的細節,以下分別進行介紹:
優先確認視覺化目標
我們在進行視覺化作業之前,最好能先確認視覺化最後的目標為何,想要給誰看?這些人想要看到的是什麼?怎樣呈現能夠把故事說得最清楚?
透過以上的需求分析,我們才可分辨我們應該挑選的資料屬性,或是使用的圖表類型等等。不過許多時候初期很難定義出視覺化情境,但我們應該保持好奇心,提出更多的問題,所有的問答都可能用來協助判斷後續圖表的選用。
視覺化需求分析後,我們應該要能得到類似這樣的期待:『希望能夠看到 XX 年度 XX 類別的數據變化』、『 希望能夠透過視覺化結果發現 XX 數據異常的圖表樣式』、『希望能夠取得一個能夠代表總體數據變化的圖表,不一定要精確』。更進一步我們也可配合紙筆輔助,手繪草圖來確認雙方視覺化規格認知。
圖9:除了視覺化訪談之外,我們也可用鉛筆簡單勾勒出視覺化樣式
挑選合適的工具
我們常常在網路上看到各類優秀的視覺化圖表,然而,為了做出最後美麗的圖表,除了前期的資料收集、資料整理之外,在實際撰寫視覺化程式的時候,並不建議『從頭開始撰寫』,原因是我們並不需要重新撰寫像是:顏色調配的程式、線條繪製的程式、圖形變化的程式等等,這時候可以選擇直接現有的視覺化程式庫,整合資料與邏輯並做出美麗的圖表,把精力放在把議題表達清楚。
其實一般人已經很常透過 Excel 執行各類視覺化作業,並輸出各類統計圖表。然而,Excel 圖表不容易整合到網路上面產生互動,也不容易與其他程式碼進行溝通,替代作法是新一代的視覺化程式庫,例如 D3.js、Tableau、HiChartjs、Google Chart API,Flot 等等工具,能夠協助我們產出更多視覺圖表。
圖10:使用工具進行輔助,能夠更快完成資料視覺化工作,也更多變
選擇正確的視覺化圖表
除了使用順手的工具之外,我們也需要謹慎挑選視覺圖表!視覺圖表的種類非常多,且每個圖表都有他的個性與角色,例如 Data Visualization Catalogue(http://www.datavizcatalogue.com/index.html)網站上就列出了數十種的圖表類型:
圖11:Data visualization catalogue 網站整理了許多類型視覺圖表
事實上,我們很容易選擇到不適合的視覺圖表,例如應該用線圖呈現的數據,卻選擇了熱度圖,或是應該用雷達圖的需求,卻使用了泡泡圖等等。這主要是因為許多人單從美學觀點、資訊觀點等等進行資訊圖表的繪製,這種觀念其實是不正確的。我們應該先分析使用者真正想要看到的資訊,再透過視覺規格的確認,來挑選真正合適的視覺圖表。vizualism.nl http://vizualism.nl/) 網站,就提供了一張視覺維度圖,讓我們可以從 WHO / WHERE / WHEN / WHAT / WHY / HOW 等面向來挑選合適的圖表。
圖12:vizualism.nl網站提供的視覺對照表
視覺化可多方嘗試不同資料維度
同樣一批資料,不同的視覺化維度可能產生截然不同的結果。以時間資料為例,切換年度、月份、分鐘等單位進行分析,甚至秒數為單位進行分析,都是不同的結果。又或者我們也可挑選不同欄位交互組合,也有可能創造出自己都沒想到的絕妙結果。
不過如果如果每批資料都需要重新寫程式產生,是相當耗時費力的,這時我們能夠透過一些好用的視覺化軟體,例如 Tableau,只要準備好資料,定義好資料類型,同樣一批數據我們能夠透過軟體介面快速試驗,並切換不同數據圖表結果,嘗試越來越多次後,量變產生質變,常常能夠找到更滿足業務數據期待的視覺化結果。
圖13:好的軟體工具讓我們更快切換不同圖表,例如 Tableau 提供了『智能顯示』視窗,讓我們可以快速切換圖表,且不需要重新寫程式
結論
面對大數據熱潮,許多人都希望能夠自在把玩這些數據,而不是被爆炸的數據量推著走。為了達到這項目標,其中一項秘訣就是把資料進行視覺化,將資訊進行降維,進一步萃取出知識。然而,我們不應該為了視覺化而視覺化,當有些資訊可以直接用表格清楚呈現時,或是資料還沒有整理乾淨時,貿然執行視覺化作業,有時候反而會有反效果。
本系列文章,未來會持續帶來更多資料視覺化的相關知識,在許多領域都適用,希望讀者們都能透過視覺化技巧的輔助,一起『發現趨勢,看見未來』!
[1][1]
[2][2] https://zh.wikipedia.org/wiki/%E6%B3%BD%E5%AD%97%E8%8A%82