玩具烏托邦: AI/機器學習

顯示具有 AI/機器學習 標籤的文章。顯示所有文章

2025年9月11日星期四

NotebookLM：「太長太多了，讀不完」的好幫手

某個主題的文件 TL;DR (太長太多了，讀不完) 嗎? 那就讓 NotebookLM (<==請先讀簡介文) 來幫忙吧! 這裡分享我的一個粗淺心得範例：微軟強推 edge ，採用了哪些暗黑模式?

首先確認「設定」=>「輸出語言」是中文 (或是你要的語言)。

閱讀全文...

2024年7月23日星期二

物理量因次關係圖

物理量因次關係圖想要複習大學普通物理，於是製作了這張圖。 [dot 原始碼] 「電容」放不進這張圖裡，要改成它的倒數「倒電容」 elastance 才放得進來。

閱讀全文...

2024年1月30日星期二

我比較喜歡閱讀；不太喜歡看影片/聽podcast。找到 summarize.tech 這個網站不錯，餵它一部英文 youtube 影片連結，就幫你產生文字摘要。但是它好像只吃有附字幕檔的影片。那如果是其他語言呢？我試了一部自動產生字幕的西班牙文影片，它會產生英文的文字摘要。那如果是用 video downloadhelp 抓回來的影片呢？如果想離線使用呢？那就安裝 vosk，在自己的電腦上離線產生各種語言的字幕檔吧！

閱讀全文...

2023年12月30日星期六

用亞馬遜的 ec2 雲端主機自架 stable diffusion

在 Amazon 的 AWS 上面重新安裝一次 (其實是好幾次) stable diffusion。這次用比較簡單的做法。反正 SD 自己會建立所需要的 python 環境，所以其實不需要用 CloudFormation，也不需要特別找 "deep learning" 類型的 AMI (Amazon Machine Image)。直接從比較簡單的建立一個 ec2 instance 開始。建立過程當中，我做以下的選擇與設定：

閱讀全文...

2023年12月23日星期六

自架 aws 雲端主機上的 stable diffusion

[2023/12/30] 改推另一篇：用亞馬遜的 ec2 雲端主機自架 stable diffusion

終於架好自己的 stable diffusion！簡單筆記一下參考的連結。因為我有 aws 的優惠，所以基本上就照著這篇做：用 AWS CloudFormation 架設 AUTOMATIC1111 版的 SD。我這篇的篇名應該加上「補遺」才對，因為重點根本都在 koding work 的文章裡面，請大家自己去讀 :-)

閱讀全文...

2023年6月3日星期六

ChatGPT：正確與錯誤的使用示範

使用 ChatGPT 之前需要有的兩個最基本觀念： (1) 它被賦予的任務是產生文字，而不是陳述事實。 (2) 相對於整個網際網路查得到的資訊，它的知識是滄海一粟。

閱讀全文...

2022年7月4日星期一

UMAP 筆記

Uniform Manifold Approximation and Projection (UMAP) 是一個用來降低資料維度的演算法。如果你把它想成是一個副程式，它所接收的主要輸入參數以及輸出的資料跟 t-SNE 一模一樣：輸入一張很大的試算表 (例如幾百或幾千個數字欄位、幾萬甚至幾十萬列)，它可以產生一張新的試算表，裡面只剩少少幾個數字欄位 (個數由你指定), 這些新欄位的值可以說是原始許多欄位的 "摘要"，如果欄位數夠少 (例如剩下 2 或 3)，你甚至可以把資料畫在螢幕上或呈現在3度空間中，或許用肉眼就可以觀察出幾萬/幾十萬個點如何分佈在幾個明顯的群 (cluster) 當中。我在 t-SNE 幫你看見高維度數值資料以及撞臉偵測器兩篇文章當中有實作兩個例子，可以直接在網頁上玩玩看。 UMAP 比 t-SNE 的速度更快、效果更好。我還沒寫程式，先筆記一下搜尋到的連結。

閱讀全文...

2021年4月4日星期日

機器學習之 ROCm 驅動 Radeon RX580 GPU

買了一張 Sapphire Nitro+ Radeon RX580 的二手顯卡，終於第一次成功在自己的電腦上跑 gpu 版的 tensorflow，開心！

想在自己的電腦上玩機器學習，最熱門的做法當然是買 nVidia 的顯卡。可是我有好、幾、次不愉快的 nVidia 經驗，所以這次改買 AMD 的 radeon 系列顯卡。先買了一張二手 RX VEGA 64，完全不會動 :-( 最後改買這張二手 rx580 才終於成功。

閱讀全文...

2019年10月12日星期六

Keras MobileNet 版的圖片辨識遷移學習

這學期的 AI 課程改用 google colab。因為它對 caffe 的支援不佳，所以先前用 caffe 做遷移學習的範例不能拿來上課了。還好搜尋到很棒的一篇教學文 Transfer Learning using Mobilenet and Keras 以及伴隨的 github 專案 ferhat00/Deep-Learning，於是改寫一下重新上架成為： ckhung/keras-mobilenet。圖像辨識的整個流程變得超級簡單！

先下載 ckhung/keras-mobilenet 及訓練資料集 dog_behaviors.zip，再上傳到你的 google drive。假設你已玩過 google colab，那麼從 google drive 裡面打開 km-transfer.ipynb 應該就會自動進入 colab。接下來就照著 km-transfer.ipynb 做囉！

google 圖片搜尋批次下載

google 圖片搜尋「dog drinking」玩機器學習時，需要有大量的訓練資料。以圖片辨識來說， google 圖片搜尋是最佳幫手。但是要手動把搜尋結果一張一張存檔，很累呀！這時可以用 github 上 (有五、六千顆星) 的 google-images-download 來批次下載。

閱讀全文...

2019年8月3日星期六

簡單語音指令辨識

完整的自然語言語音辨識很複雜；但在很多應用場合中，如果可以讓用戶以十來個簡單語音指令控制電器/電腦/apps，就已經很方便了，而想要訓練這樣的類神經網路，門檻當然比完整的語音辨識低很多。 Simple Audio Recognition (以下簡稱 SAR 一文) 所介紹的 tensorflow 原始碼當中的 speech_commands 範例，就是這樣的工具。餵一段一秒鐘的聲音，它會判斷這是 "yes", "no", "up"、 "down"、 "left"、 "right"、 "on"、 "off"、 "stop"、 "go" 當中的哪一個語音命令，或是未知的聲音 (UNKNOWN) 或是無聲 (SILENCE) (其實可能是很小聲的背景噪音)。假設讀者已經先照著貴哥的 colab 初學筆記認識了 colab 的基本操作，今天這篇文章將接續著帶大家用 colab 把 speech_commands 的操作流程幾乎走一遍。

閱讀全文...

2019年7月13日星期六

貴哥的 colab 初學筆記

Google colaboratory 提供短暫 (數小時) 的免費雲端 GPU 算力，真是深度學習初學者的福音啊！前提是你要有 google drive 的帳號，並且略會操作 Jupyter Notebook。網路上已有很多入門教學文；貴哥一看到有 shell 可用，忍不住就好奇多探索一些，於是也寫一篇自己的初學筆記。基於「站在巨人肩膀上」的原則，比較多人介紹的基本操作就只簡單帶過，細節可參考台大機械所 Wei-Hsiang Wang 的 Colab 基本操作筆記 (中文) 及 fuat 的 Google Colab Free GPU Tutorial (英文)

閱讀全文...

2018年12月11日星期二

拿公投統計資料學 pandas

以前我都用 perl 處理文字資料，例如 regexp 跟 csv 句型都很好用。但是現在大家都用 python，我當然也要跟著趕一下流行啊～～處理試算表類型的資料時， python 程式設計師最常用 pandas 函式庫。它也是玩機器學習或資料科學一定要學東西。繪圖的話， matplotlib 跟 plotly 都很好用。就讓我們拿中華臺北人很有感的十項案公投結果統計資料來當 pandas / matplotlib / plotly 的入門範例吧！

閱讀全文...

2018年10月17日星期三

YOLO 自動框出相片裡的人/動物/生活用品

yolo3 測試結果：街道圖/動物圖/餐桌圖今天介紹的這個神奇好物，看圖就知道了。我偷懶把三張圖擠在一起。底層是繁忙的街道圖；左上是森林裡幾隻吃素的 (絕對不包含韓國瑜)；右上是巴黎鐵塔餐廳的一張餐桌。神奇的 YOLO 技術把圖裡的人/動物/物件都標示出來了，而且，在 cpu-only 的電腦上，每張圖只花幾秒鐘！

閱讀全文...

2018年9月29日星期六

快速畫風移轉：你的圖片/相片/影片，以名畫家的動漫風格重現！

兩年前的此時，畫風轉移魔法引發熱烈討論。我有自己架起來玩過，很好玩，但光是轉一張圖就要好幾個小時。這兩年來，不斷有人提出改良版的演算法。目前最佳的版本稱為 fast style transfer，如果不計算預先訓練畫風的時間，只計算轉移的時間，速度超快。即使是在我的 2014 年老電腦上只用 CPU (Intel Pentium G2030 @ 3.00GHz) 也能處理影片。下圖每塊 212x120 的 13 秒影片各約耗時 3.5 到 4 分鐘。

閱讀全文...

2018年8月1日星期三

自架臉部表情判讀服務

臉部表情判讀示範 -- 「驚訝」請看一下原始網站：我把這個判讀臉部表情 (及性別) 的程式複製回來並小改一下，然後打包成 face_classification docker 讓大家玩。情緒判斷還蠻有一點像的；可是鬍子先生為什麼竟然被判斷成女性呢？

閱讀全文...

2018年7月26日星期四

躲在 apache2 後面的 flask 範例，含上傳檔案

flask 躲在 apache 後面，銜接 ML/DL/AI 引擎 github 上面很多 ML/DL/AI 程式都以 python 撰寫，可以從命令列執行。但如果想要佈署，例如想讓樹莓派可以把野外蒐集到的畫面或聲音傳回伺服器用 AI 程式判讀/分類，那該怎麼辦呢？常見的方法是用 flask 架一個簡單的 web server。 Flask 是 python 的一個模組，所以從那裡要接上 python 所寫的 ML/DL/AI 引擎很方便。 Flask 單獨作為 web server 的方法很簡單，請見中文教學或官網。但若你的伺服器已有 apache2，要怎樣才能把 flask 接上去呢？

閱讀全文...

2018年4月10日星期二

到 floydhub 租用雲端 GPU 玩人工智慧

想玩一點 AI，又不想自己直接面對封閉的 nVidia 顯卡驅動程式嗎？如果你的訓練資料沒有隱私或機密的問題，那就上雲端租用 GPU 吧。我採用的是 floydhub。根據這一篇比較文， floydhub 的效能比 AWS 跟 paperspace 略遜一籌；不過他們以軟體環境取勝：有許多現成的深度學習 docker 環境可選。而且當初我起步機器學習，就是靠他們做的一些 docker images，所以就寫介紹文來回饋囉。

閱讀全文...

2017年12月30日星期六

ImageMagick mask ：批次遮罩疊圖 (例如局部著色)

遮罩疊圖的各階段圖片先前曾經在 gimp 裡面採用遮罩機制幫相片只保留主角的顏色。遮罩疊圖不僅限用於著色。凡是需要「把一張圖的一部分疊到另一張底圖之上」的動作都適用。如果有很多張圖要用相同的方式處理，改用 ImageMagick 指令會比用 gimp 快。最麻煩的部分是：每張圖的遮罩很難自動產生。不過現在 AI 那麼厲害，很快地就會出現各種類似街道圖片 semantic segmentation 語義分割的類神經網路，到時候這篇所介紹的技巧就會很有用了：我們要解說如何用 ImageMagick 命令列把一張原圖及它的語義分割成果圖轉換成局部著色的圖。我已更新範例圖檔，裡面包含九張原圖 (orig/*) 跟九張語義分割成果圖 (result/*) 所以你不需要架設 docker 等等，只要有安裝 ImageMagick 就可以跟著實作。

閱讀全文...

2017年12月24日星期日

街道圖片 semantic segmentation 語義分割實作

街道圖片語義分割結果 (只有「人」的部分著色)

所謂 (圖片的) semantic segmentation 語義分割是指「如何辨識一張圖片當中哪些 pixels 構成了人、哪些 pixels 構成了車子、 ... 等等」這個問題。理論的部分 ( 知乎簡中原文、 itread01 內容農場正體中文) 我也沒研究，呵呵，直接省略。幾個月前上網找到 (僅適用於分析街道圖片的) ENet Semantic Segmentation 實作，斷斷續續花了幾個週末建立映射、撰寫 Dockerfile、修改外包裝 python 程式，這個週末終於把可用的版本上傳到 Dockerhub 的 ckhung/enet 去。嗯，效果不太好... 大家將就玩玩看吧!

閱讀全文...

訂閱：文章 (Atom)

2025年9月11日 星期四

2024年7月23日 星期二

2024年1月30日 星期二

2023年12月30日 星期六

2023年12月23日 星期六

2023年6月3日 星期六

2022年7月4日 星期一

2021年4月4日 星期日

2019年10月12日 星期六

2019年8月3日 星期六

2019年7月13日 星期六

2018年12月11日 星期二

2018年10月17日 星期三

2018年9月29日 星期六

2018年8月1日 星期三

2018年7月26日 星期四

2018年4月10日 星期二

2017年12月30日 星期六

2017年12月24日 星期日

你選擇反共護台，或是成為器官供體?

訂閱

近期文章

所有文章

留言

固定讀者

資訊人權貴ㄓ疑

英文閱讀噗摘要

標籤

linux 好站

關於格主

最近30天流量

License

2025年9月11日星期四

2024年7月23日星期二

2024年1月30日星期二

2023年12月30日星期六

2023年12月23日星期六

2023年6月3日星期六

2022年7月4日星期一

2021年4月4日星期日

2019年10月12日星期六

2019年8月3日星期六

2019年7月13日星期六

2018年12月11日星期二

2018年10月17日星期三

2018年9月29日星期六

2018年8月1日星期三

2018年7月26日星期四

2018年4月10日星期二

2017年12月30日星期六

2017年12月24日星期日