You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/hk/3-Data-Visualization/13-meaningful-visualizations
leestott 1315f4d10d
🌐 Update translations via Co-op Translator
2 weeks ago
..
solution 🌐 Update translations via Co-op Translator 4 weeks ago
starter 🌐 Update translations via Co-op Translator 4 weeks ago
README.md 🌐 Update translations via Co-op Translator 2 weeks ago
assignment.md 🌐 Update translations via Co-op Translator 4 weeks ago
correlation-analysis.ipynb 🌐 Update translations via Co-op Translator 2 weeks ago

README.md

製作有意義的視覺化圖表

由 (@sketchthedocs) 繪製的速記筆記
有意義的視覺化圖表 - @nitya 繪製的速記筆記

「如果你對數據折磨得夠久,它會承認任何事情」-- Ronald Coase

作為一名數據科學家,基本技能之一就是能夠創建有意義的數據視覺化,幫助回答你可能提出的問題。在進行數據視覺化之前,你需要確保數據已經像之前課程中所教的那樣進行清理和準備。之後,你就可以開始決定如何最好地呈現數據。

在本課中,你將學習:

  1. 如何選擇合適的圖表類型
  2. 如何避免誤導性的圖表
  3. 如何使用顏色
  4. 如何設計圖表以提高可讀性
  5. 如何構建動畫或3D圖表解決方案
  6. 如何創建創意視覺化

課前測驗

選擇合適的圖表類型

在之前的課程中,你已經嘗試使用 Matplotlib 和 Seaborn 創建各種有趣的數據視覺化圖表。通常,你可以使用以下表格選擇合適的圖表類型來回答你的問題:

你的需求: 你應該使用:
展示隨時間變化的數據趨勢 折線圖
比較類別 柱狀圖、餅圖
比較總量 餅圖、堆疊柱狀圖
展示關係 散點圖、折線圖、分面圖、雙折線圖
展示分佈 散點圖、直方圖、箱型圖
展示比例 餅圖、甜甜圈圖、華夫圖

根據數據的組成,你可能需要將其從文本轉換為數字,以支持某些圖表類型。

避免誤導

即使數據科學家謹慎選擇了合適的圖表類型,仍然有許多方法可以以誤導的方式展示數據,通常是為了證明某個觀點,卻犧牲了數據的真實性。有許多誤導性圖表和信息圖的例子!

Alberto Cairo 的《How Charts Lie》

🎥 點擊上方圖片觀看有關誤導性圖表的會議演講

這張圖表反轉了 X 軸,根據日期顯示了與事實相反的內容:

糟糕的圖表 1

這張圖表 更加誤導,因為視覺上吸引人注意的是右側,讓人誤以為隨著時間推移,各縣的 COVID 病例數量下降。事實上,如果仔細查看日期,你會發現日期被重新排列以製造這種下降趨勢。

糟糕的圖表 2

這個臭名昭著的例子使用顏色和反轉的 Y 軸來誤導:原本應該得出槍支死亡率在槍支友好立法通過後激增的結論,卻讓人誤以為情況正好相反:

糟糕的圖表 3

這張奇怪的圖表展示了比例如何被操控,效果令人捧腹:

糟糕的圖表 4

比較不可比的事物是另一種不正當的手段。有一個精彩的網站專門展示「虛假的相關性」,例如緬因州的離婚率與人造奶油的消耗量之間的「事實」相關性。一個 Reddit 群組也收集了糟糕的數據使用

了解眼睛如何容易被誤導性圖表欺騙是很重要的。即使數據科學家的意圖是好的,選擇不合適的圖表類型,例如顯示過多類別的餅圖,也可能具有誤導性。

顏色

你在上面「佛羅里達槍支暴力」的圖表中看到,顏色可以為圖表提供額外的意義層次,尤其是那些未使用 Matplotlib 和 Seaborn 等庫設計的圖表,這些庫自帶各種經過驗證的顏色庫和調色板。如果你手動製作圖表,可以稍微研究一下顏色理論

在設計圖表時,請注意可訪問性是視覺化的重要方面。一些用戶可能是色盲——你的圖表是否能為視覺障礙用戶良好顯示?

選擇圖表顏色時要小心,因為顏色可能傳達你未曾預料的含義。上面「身高」圖表中的「粉紅女士」傳達了一種明顯的「女性化」含義,這增加了圖表本身的怪異感。

雖然顏色的含義可能因地區而異,並且通常根據色調而改變,但一般來說,顏色的含義包括:

顏色 含義
紅色 力量
藍色 信任、忠誠
黃色 快樂、警告
綠色 生態、幸運、嫉妒
紫色 快樂
橙色 活力

如果你需要使用自定義顏色構建圖表,請確保你的圖表既可訪問又符合你想要傳達的含義。

設計圖表以提高可讀性

如果圖表不可讀那就沒有意義花點時間考慮調整圖表的寬度和高度使其能與數據良好匹配。如果需要顯示一個變量例如所有50個州請盡可能垂直顯示在 Y 軸上,以避免水平滾動的圖表。

標記你的軸,必要時提供圖例,並提供工具提示以更好地理解數據。

如果你的數據在 X 軸上是文本且冗長,可以將文本角度調整以提高可讀性。Matplotlib 提供了 3D 繪圖功能,如果你的數據支持它。使用 mpl_toolkits.mplot3d 可以生成更高級的數據視覺化。

3D 圖表

動畫和3D圖表顯示

如今一些最好的數據視覺化是動畫的。Shirley Wu 使用 D3 創作了令人驚嘆的作品,例如「電影花朵每朵花都是一部電影的視覺化。另一個例子是《衛報》的「Bussed Out」這是一個結合 Greensock 和 D3 的互動體驗,並採用滾動敘事文章格式,展示紐約市如何通過將無家可歸者送出城市來處理其無家可歸問題。

Bussed Out

「Bussed Out: How America Moves its Homeless」來自衛報。視覺化由 Nadieh Bremer 和 Shirley Wu 創作

雖然本課程不足以深入教授這些強大的視覺化庫,但你可以嘗試在 Vue.js 應用中使用 D3展示一本書《危險關係》的動畫社交網絡視覺化。

《Les Liaisons Dangereuses》危險關係是一部書信體小說或以信件形式呈現的小說。由 Choderlos de Laclos 於1782年撰寫講述了18世紀法國貴族中兩位主角 Vicomte de Valmont 和 Marquise de Merteuil 的惡毒、道德敗壞的社交操縱。他們最終都遭遇了悲劇,但在此之前造成了巨大的社會損害。小說以一系列信件展開,這些信件寫給他們圈子中的各種人,策劃復仇或僅僅是製造麻煩。創建這些信件的視覺化,探索敘事中的主要角色。

你將完成一個網頁應用,顯示這個社交網絡的動畫視圖。它使用了一個庫,該庫旨在使用 Vue.js 和 D3 創建網絡視覺化。當應用運行時,你可以在屏幕上拖動節點來重新排列數據。

危險關係

項目:使用 D3.js 構建一個展示網絡的圖表

本課程文件夾包含一個 solution 文件夾,你可以在其中找到完整的項目作為參考。

  1. 按照起始文件夾根目錄中的 README.md 文件中的指示操作。確保你的機器上已安裝 NPM 和 Node.js並運行項目依賴。

  2. 打開 starter/src 文件夾。你會發現一個 assets 文件夾,其中有一個 .json 文件包含小說中的所有信件編號並附有「to」和「from」標註。

  3. 完成 components/Nodes.vue 中的代碼以啟用視覺化。找到名為 createLinks() 的方法,並添加以下嵌套循環。

循環遍歷 .json 對象以捕獲信件的「to」和「from」數據並構建 links 對象,以便視覺化庫可以使用:

//loop through letters
      let f = 0;
      let t = 0;
      for (var i = 0; i < letters.length; i++) {
          for (var j = 0; j < characters.length; j++) {
              
            if (characters[j] == letters[i].from) {
              f = j;
            }
            if (characters[j] == letters[i].to) {
              t = j;
            }
        }
        this.links.push({ sid: f, tid: t });
      }

從終端運行你的應用npm run serve享受視覺化效果

🚀 挑戰

在互聯網上探索誤導性視覺化。作者如何欺騙用戶,這是故意的嗎?嘗試修正這些視覺化,展示它們應有的樣子。

課後測驗

回顧與自學

以下是一些有關誤導性數據視覺化的文章:

https://gizmodo.com/how-to-lie-with-data-visualization-1563576606

http://ixd.prattsi.org/2017/12/visual-lies-usability-in-deceptive-data-visualizations/

看看這些有趣的歷史資產和文物視覺化:

https://handbook.pubpub.org/

閱讀這篇文章,了解動畫如何提升你的視覺化效果:

https://medium.com/@EvanSinar/use-animation-to-supercharge-data-visualization-cd905a882ad4

作業

創建你自己的自定義視覺化


免責聲明
此文件已使用人工智能翻譯服務 Co-op Translator 翻譯。我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。應以原始語言的文件作為權威來源。對於關鍵資訊,建議使用專業的人工作翻譯。我們對因使用此翻譯而引起的任何誤解或錯誤解讀概不負責。