玩具烏托邦: 把買 GPU 的錢省下來租雲端服務：建立 aws bedrock 模型與價格清單

想玩龍蝦 🦞、不想買 GPU => 租雲端的 LLM 來用。因為我有 AWS 的點數，那就拿 AWS BedRock來用吧!

[7/8] 補充說明：但 aws 其實比較貴。如果你不像我有點數，建議問一下 AI：「有哪些可替代 AWS Bedrock 和 OpenRouter、可租用開放權重模型的平台？請比較 AWS Bedrock、OpenRouter 以及你推薦的其他方案的價格(以整體概況為主)。另外，也請比較它們所提供的模型種類 (多樣性)，以及其他你認為重要的面向。」 Gemini 跟 ChatGPT 都推薦 DeepInfra。另外還有 Together AI、 Groq、 Novita AI 等等。

回到 AWS BedRock。請參考：給小白的 bedrock 簡介、 bedrock 網頁介面試用心得。不過，我喜歡下指令，所以是在 debian 上面安裝 awscli 套件來測試。假設你已經用 aws configure 命令設定好 access key，也略微熟悉 jq。我們的目的只是要跟 OpenClaw 接軌，所以只關心有哪些模型可選擇、如何下簡單的呼叫指令，以及價格。

AWS 在全球很多區域 (region) 都有伺服器，各區域提供的模型不盡相同。很粗略地統計 (下詳)，模型最豐富的區域可能是 us-west-2、 us-east-1、 us-east-2、 ap-northeast-1。那就建一個包含上述字串的文字檔 regions.txt (每列一個區名)，等一下我們要把這幾區的模型清單抓下來。先簡單測試一下： aws bedrock list-foundation-models --region ap-northeast-1 。抓回來的 json 檔裡面只有一個欄位 "modelSummaries"，我們直接只存 modelSummaries 這個大陣列。 for reg in $(cat regions.txt) ; do aws bedrock list-foundation-models --region $reg | jq .modelSummaries > ml-$reg.json ; done 然後為每一區產生一個模型 id 清單檔： for reg in $(cat regions.txt) ; do jq '.[] | .modelId' ml-$reg.json | sed 's/"//g' | sort > ml-$reg.txt ; done (因為傳回資料內沒有 ","，所以大膽把所有雙引號刪掉。)

有了每一區的 ml-$reg.txt 檔，就可以查看每一區提供哪些模型、用 comm 指令比較兩區供應清單的差異、用 grep 指令撈出有興趣的模型。 (例如可能只對 anthropic 家的模型有興趣) 如果想查看其中一個模型的詳細資訊，例如 openai.gpt-oss-20b-1:0 就要回去 ml-$reg.json 檔查看完整的資料。

再來，建立一個 query.json 內容如下：

{
  "service_tier": "flex",
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "請以四到五句話描述你自己，特別是與其他模型比較的長處與短處。"
        }
      ]
    }
  ]
}

然後在命令列上拿它去詢問一個 LLM： aws bedrock-runtime invoke-model --model-id openai.gpt-oss-20b-1:0 --body file://query.json --cli-binary-format raw-in-base64-out response.json 順利的話，幾十秒後，它的回答就會放在 response.json 裡面。

有幾種常見的失敗狀況：

model identifier is invalid => model id 剪貼錯了，或是你要的模型在別區。 (可以用 --region us-east-1 之類的選項改選別區的模型)
on-demand throughput isn’t supported => 要用這個模型，必須先建立 inference profile。例如想用 anthropic 家的模型，還必須先簽署模型存取許可 ✍️ 才可以建立 inference profile。我還在摸索，目前沒有要做重要的事業，暫時先略過。
Validation Error => 不知道。 (例如 mistral.mistral-large-2402-v1:0)
Malformed input request => 提供的 query.json 不完備，該模型可能需要其他輸入參數，例如一張圖片或一個聲音檔。

接下來，產生價格列表： aws pricing get-products --region us-east-1 --service-code AmazonBedrock > tmp.json 注意：只有 us-east-1 的伺服器能夠回答查價指令。這個指令會執行很久，得到一個 12MB 的 json 檔。

jq '[.PriceList[] | fromjson]' tmp.json > bedrock-pricing.json
echo 'provider,model,tier,price,provider,price,usagetype' > bedrock-pricing.csv
jq -r '.[] | [
    .product.attributes.provider,
    .product.attributes.model,
    .product.attributes.service_tier,
    .terms.OnDemand[].priceDimensions[].pricePerUnit.USD,
    .product.attributes.usagetype
] | @csv' bedrock-pricing.json | sed 's/"//g' >> bedrock-pricing.csv

得到一萬多筆資料的 bedrock-pricing.csv。可以用 grep 找出有興趣的模型，或用visidata 或 LibreOffice 等等其他試算表工具查看完整內容。例如 grep openai.gpt-oss-20b bedrock-pricing.csv | grep APN1 查出 APN1 (ap-northeast-1，東京) 所提供的 gpt-oss-20b 服務包含以下幾種計價資訊：

OpenAI,gpt-oss-20b,priority,0.0001400000,APN1-openai.gpt-oss-20b-mantle-input-tokens-priority
OpenAI,gpt-oss-20b,priority,0.0006300000,APN1-openai.gpt-oss-20b-mantle-output-tokens-priority
OpenAI,gpt-oss-20b,flex,0.0001800000,APN1-openai.gpt-oss-20b-mantle-output-tokens-flex
OpenAI,gpt-oss-20b,batch,0.0001800000,APN1-openai.gpt-oss-20b-mantle-output-tokens-batch
OpenAI,gpt-oss-20b,flex,0.0000400000,APN1-openai.gpt-oss-20b-mantle-input-tokens-flex
OpenAI,gpt-oss-20b,standard,0.0003600000,APN1-openai.gpt-oss-20b-mantle-output-tokens-standard
OpenAI,gpt-oss-20b,standard,0.0000800000,APN1-openai.gpt-oss-20b-mantle-input-tokens-standard
OpenAI,gpt-oss-20b,batch,0.0000400000,APN1-openai.gpt-oss-20b-mantle-input-tokens-batch

這些數字是每一千個 tokens 的費用。其中第三個欄位「服務層級」決定價格 vs 延遲的取捨：

priority：最貴，優先處理，較快
standard：標準
flex：便宜，可能會被排到後面，較慢
batch：批次處理，也會比較便宜，但不適用於 invoke-model 的呼叫方式

例如上例的 query.json 裡面我用 "service_tier": "flex" 指定較便宜的計價方式；而傳回的 response.json 裡面，也有同一個欄位可以看出 aws bedrock 有沒有採用你所指定的服務層級。

有些服務沒有模型名稱，要看 usagetype 欄位才可以猜得出來那是什麼，例如 APN1-Guardrail-SensitiveInformationPolicyFreeUnitsConsumed 跟外掛的安全服務有關。

有了這些資訊，就可以畫氣泡圖挑選性價比最佳的租賃 LLM，耶!

(寫完這篇以後，覺得我的 jq 又進步一點了。)

玩具烏托邦

2026年4月25日星期六

把買 GPU 的錢省下來租雲端服務：建立 aws bedrock 模型與價格清單

沒有留言:

張貼留言

反共護台，或成為器官供體?

近期文章

所有文章

留言

固定讀者

資訊人權貴ㄓ疑

英文閱讀噗摘要

標籤

linux 好站

關於格主

最近30天流量

License