2023年5月22日 星期一

讓資料視覺化告訴你何謂 mal-information

這是舊聞,不過很適合拿來當媒體識讀的教材。 2022 年 11/23 左右, 正值台灣武肺疫情高峰期間, 突然出現大量 「近二週致死率全球第三高」 的新聞。 這是 mal-information 的例子: 可能是事實, 但有惡意誤導的意圖。

  1. 按照 這裡 的指示取得疫情開始至 2023 年 3 月的資料檔 owid-covid-data-old.csv 。
  2. 只保留有興趣的欄位: cut -d, -f 1-4,9-10,15-16 owid-covid-data-old.csv > covid-deaths-pm.csv
  3. python3 filter.py covid-deaths-pm.csv > G20-covid-deaths-pm.csv 這個程式會讀取 G20.csv, 然後逐列處理 covid-deaths-pm.csv, 只留下 G20.csv 裡面列出的國家, 並且加上中文國名、 又把缺值的欄位都補 0, 最後得到 G20-covid-deaths-pm.csv
  4. rawgraphs 頁面, 上傳 G20-covid-deaths-pm.csv 並且選擇 "line chart"。
  5. 在 "mapping" 那一部分, 選擇以 date 為 X Axis、 以 new_deaths_smoothed_per_million 為 Y Axis、 以 zh_name 為 lines、 以 zh_name 為 color。
  6. 在 "customize" 那一部分, 點 colors 的加號, 幫台灣選一個顏色。
  7. 最後 "Export" 匯出, 再用 inkscape 編輯, 加上箭頭, 就成右圖。

2022/11/23 的這些報導, 它是 「基於現實,用於對個人、組織或國家造成傷害」 的資訊, 也就是 (truthful) mal-information 的例子。 當時宣稱 「近二週致死率全球第三高」, 這可能是事實, 但很明顯並沒有意義, 因為每個國家的高峰時間不一樣。 真正要做有意義的比較, 應該比較所有國家的高峰, 像是我這篇: 陳時中團隊的 covid 19 防疫成績。 至於 黃珊珊所散佈的 「武肺疫情在台灣致死率全世界第一」, 則是 「內容有誤,且具目的性為了傷害特定對象」 的 disinformation。 詳見 假新聞(Fake News)/不實訊息(Disinformation)/錯誤資訊(Misinformation)/惡意訊息(Mal-information) 的名詞解釋。

Rawgraphs 的更詳細介紹, 請見 這篇

沒有留言:

張貼留言

因為垃圾留言太多,現在改為審核後才發佈,請耐心等候一兩天。