2026年1月4日 星期日

gemini 的 gem 新手小作: 懶人的媒體識讀助理

建立 TL;DR gem 進入 gem 功能 這幾天開始學 gemini 的 gem。 筆記一下心得。

一、 試車

  1. (非必須) 建議先設定好自己的 saved-info
  2. 點選左側主選單的 「Gem」 再點 「我的 Gem」 右側的 「新增 Gem」。
  3. 打開我設計好的 tldr-gem.md, 把 「名稱」、 「說明」 以及一大段提示詞分別複製貼進去, 然後按 「儲存」, 這個就可以用了。 會出現在左側主選單。
  4. 你可以編輯, 改成自己想要的樣子。 (提示詞寫好之後, 我自己都會另外備份。) 也可以點提示詞輸入框最下面的 "魔術筆" 讓 gemini 幫你潤稿。 事實上, 上面那個內容就是 gemini 幫我潤稿過的, 英文標題分段也是它加的。

TL;DR (too long, didn't read) 是一個隨時不忘查驗事實的懶人閱聽助理。 推薦這幾則影片 邀請大家分別測試看看:

  1. 一场反复迟到的认知哥白尼革命
  2. 大法官判決憲訴法違憲,理由是什麼?立法院該怎麼立法才算符合憲法?
  3. 4D rotational symmetry hidden in Newtonian gravity

也把我這篇餵給它測試看看吧!

我用 gemini 測試時, 若選用 「快捷」 (flash) 引擎, 它提供的網址經常會加上 "https://www.google.com/search?q=" 的前綴。 它提供的標題可能也是假的, 經常搜尋不到文章 :-( 不過至少可以提醒你有哪些關鍵詞值得搜尋。

二、 翻車測試

接下來就叫 gemini 來寫一篇文章交給 gemini 自己摘要與除錯吧:

請寫一篇「媒體識讀」這個領域的簡介,列出並介紹幾大子題。 盡量採用本領域的專有名詞,且第一次出現時用粗體字呈現。

它寫好之後, 再叫它轉成 html 格式, 於是得到 這個內容

把這個網址餵給 TL;DR gem, 會發現它竟然 (在它自己心中) 很認真地瞎掰了一篇文章出來評論🤣 。 它好像是從網址當中尋求鬼扯的靈感, 例如把網址當中的 "ml" (本來是 "media literacy" 的意思) 當成 "machine learning"? 如果換成這個網址 "https://frdm.cyut.edu.tw/~ckhung/b/phy/lorentz.en.php" 它就突然回神了, 按照指令要求, 回覆使用者 「無法讀取網頁」。 目前還搞不清楚何時會正常回報「失敗」, 何時會瞎掰。 可以確定的是: google 自家的產品, 例如 google drive 裡面的各種檔案, 就一定讀得到。 維基百科、 github 等等知名知識型的網站也 ok。

既然 gemini 沒辦法讀網頁, 就剪貼給它讀。 從它吐出來的結果顯示: 因為特別對這個 gem 指定要有 「爭議與查核」 一節, 所以 gemini 似乎蠻熱衷挑毛病, 即使是上面高品質的科普影片, 它也要雞蛋裡挑骨頭。 所以, 這個 gem 還有兩個很重要的功能:

  1. 過去有著過度相信 AI 傾向的讀者, 從現在起, 可以養成 「用 AI 檢查 AI」 的習慣, 直到你對 AI 的輸出永遠抱著健康的懷疑為止。 當 AI 不斷打臉自己的時候, 你還要無條件相信他嗎? (還有,習慣性打臉自己的網紅也是啊...)
  2. 還有, 如果你有意識到一直被AI拍馬屁灌迷湯好像不太健康, 也可以用這個 gem 評論自己的文章, 幫自己澆澆冷水。

三、 何時用 gem?

想像一位聰明但健忘的助理 (gemini), 前面講過的話, 半小時後就忘了。 (超出他的 context window 上下文窗口) 對話中上傳的檔案更會大量消耗他的記憶空間。 Saved-info 就像是一張黏在他手上的超級重要事項便條紙📝, 他每次回答前都會仔細看一遍。

而 gem 就像是執行某項任務時的一個專用公事包💼 , 除了任務說明之外, 在製定 gem 時上傳的檔案會被 gemini 採用 RAG 技術 (下詳) 做特殊處理, 不會佔用助理的記憶空間。 例如本校的各種獎學金申請規定、 本公司的所有人事法規、 本賣場的貨架地圖與上架規定、 或某個 github 專案的程式碼風格規約等等, 總之就是提供他 「執行此項任務時所需的所有文件」, 讓他可以隨時查看這些資料, 不需要記憶。 這也就是 Retrieval-Augmented Generation 檢索增強生成 技術, 像是幫 AI 準備的課本, 讓它在回答這個 (你關心的) 特定領域主題時可以精準、 不幻想, 又不需要你花力氣訓練它。 (可惜我這個例子沒用到這部分。)

那跟 NotebookLM 有什麼不同呢? NotebookLM 比較適合「聚焦一個主題,有多份參考文件」的深入研究場合。 它可以吃的文件數 (50) 遠多於 gem (10), 也可以產生各種形式的輸出 (例如 podcast)。

快寫完才發現這篇, 大推: 【AI 工具全攻略】一次搞懂 ChatGPT, Gemini Gem, NotebookLM 有什麼不同?

沒有留言:

張貼留言

因為垃圾留言太多,現在改為審核後才發佈,請耐心等候一兩天。