2023年4月28日 星期五

「電力能源來源分類」資料整理與驗證

電力能源來源分類 右圖是我看著 electricity-mix.csv (製作過程) 整理出來的 「電力能源來源分類」 猜測。 這種樹狀的階層式結構 (hierarchy) 感覺很好拿來畫 treemap 之類的圖形。 (另文詳)

為了驗證這些猜測:

  1. 先撈出美國的資料: ( head -n 1 electricity-mix.csv ; grep '^USA,' electricity-mix.csv ) > usa.csv
  2. 用 libreoffice 打開 usa.csv
  3. 「檢視」... 「凍結第一列」、
  4. 選取整張試算表、 把所有欄位同步變窄、 選取第一列、 文字折行, 這樣比較方便讀標題文字。
  5. 刪掉不相關的欄位 (例如所有的 per capita 欄位)、 編輯簡化標題列、 根據猜測的分類調整欄位順序, 把相關的放在鄰近位置。
  6. 新增一些檢查欄位。 例如猜測 fossil = coal + oid + gas 那就新增一個檢查欄位, 計算: (coal + oid + gas) / fossil 並且採用百分比數字格式顯示。

於是得到 usa-check.ods。 自從 2000 年以後的資料驗算都正確; 較早的資料不知道什麼原因, 數值兜不攏。 那就算了, 反正我只想畫圖, 又不是真的關心能源政策 :-) 回到原始 (涵蓋全球兩百多國家與地區) 的資料, 按照驗證成功的猜測整理資料, 只留下樹狀結構 leaves (external nodes) 那些部分的欄位, 最後得到 electricity-mix-leaves.csv , 就可以拿來畫圖了!

沒有留言:

張貼留言

因為垃圾留言太多,現在改為審核後才發佈,請耐心等候一兩天。