AGENT SKILL 一日工作坊 · 先備知識

九個常聽卻講不清的概念,
半小時講明白。

動手之前,我把最底層的九塊磚頭一層一層疊給你看。疊到頂端那一塊,就是你今天要親手做的 Skill。

⏱ 約 36 分鐘 24 頁 · 由下往上 九層概念 · 一次打通
由下往上,九層:LLM → Token → Context → Prompt → Tool → API → MCP → Agent → Skill。每一層都為下一層服務。最頂端那塊,就是今天的主角。

第一層

ChatGPT、Claude 背後那顆腦,
其實在玩文字接龍

LLM(大語言模型)做的事極其樸素:看著你給的字,猜下一個最可能的字,猜完接上去,再猜下一個。

LLM 的全名

Large Language Model,大語言模型。ChatGPT、Claude、Gemini 背後都是這種架構。它是整座九層塔的地基。

它做的那一件事

看你給的文字,猜下一個字。猜完接上去,再猜下一個。一個字一個字吐,永遠在做這同一件事。

理解這一點,你就不會神化它,也不會它。它不是魔法,是個會接龍的工具。今天我們要做的,是把這個工具導引到你的工序上。

接龍拆解

「連老師長得真帥」
它是這樣一個字一個字吐的

「連老師」 → 輸入
1 猜最可能的下一個字 → 「長
2 「連老師長」接回去再猜 → 「得
3 「連老師長得」再猜 → 「真」… 最後湊出「連老師長得真帥」
每一步都重複同一件事:看現有的字 → 猜下一個。沒有更多秘密。

第二層

AI 不是一個字一個字讀,
它把文字切成一塊一塊的 Token

中間有個翻譯官叫 Tokenizer,負責把你的文字切塊、轉成數字餵給 AI。AI 吐出數字後再轉回文字。那一塊一塊的單位,就叫 Token。

一句話被切開的樣子

工作 開始 5 個 Token
程式 設計 3 個 Token

翻譯官的工作

AI 其實不認識文字,
它只認數字

切分
映射
37660
176152
35081
11789
7910
3151
98
編碼 · TOKENIZER
👤
用戶
「連老師長得真帥」
文字
編碼 ⇅ 解碼
Tokenizer
[37660, 176152, 35081, …]
Token ID(共 7 塊)
🧠
大模型

每一個切片,都對應一個數字 ID(Token ID)。AI 看到的不是文字,是這一串數字。這個例子剛好一字一塊,但 token 不一定等於字 ── 下一頁就見反例。

重要陷阱

一個字,不一定是一個 Token

字數Token 數切成
工作坊 3 字 2 Token 工作 | 坊
程式設計師 5 字 3 Token 程式 | 設計 | 師
workflow 8 字母 1 Token workflow
supercalifragilistic 20 字母 7 Token 依音節切

平均換算:1 個 Token ≈ 0.75 個英文字 ≈ 1.5–2 個中文字。用字數估 Token 數,常常低估。連到今天:API 按 Token 收費,叫 AI 讀一整份大手冊很貴。

第三層

AI 沒有真記憶。
它靠一張桌子。

LLM 無狀態:每次請求都重置回同一狀態、重讀整段歷史

它不是在「學」

大家以為跟它聊過、它就記住了。其實模型是無狀態(stateless):每一次請求都重置回同一個空白,把整段對話從頭重讀一次。

「記得」是錯覺

它像記得前文,是因為程式每次都把對話歷史重新餵進去。沒餵進去的,它一個字都不知道。

這整包每次重新餵進去、攤開給它看的東西,就叫 Context(上下文) ── 像一張桌子,沒攤上去的,它看不到。

Context Window

桌子有上限。
攤越多越貴越慢。

Context Window 是什麼

桌子的大小上限叫 Context Window。主流模型現在約 100 萬 Token,等於一整套哈利波特全集攤得下。

滿不等於好

桌子不是越滿越聰明。攤太多東西,AI 的注意力會被稀釋,開始跳步、忘記前面交代的規則。

Context 容量比例示意

哈利波特全集 ≈ 60%
一般工作 Skill 約 25%

記住這張桌子。等一下講到 Skill,你會看到一個聰明的設計,專門省這張桌子。

第四層

Prompt,
就是你給 AI 的指令

沒那麼玄。你在對話框裡打的那一句話,就是一個 Prompt。

💬 你輸入

一句問題或指令。例:「幫我寫一封感謝信,對象是客戶小明,語氣專業。」

⚙️ AI 接龍生成

把你的 Prompt 加上 Context 裡的所有資訊,一個字一個字猜出來。

📄 輸出結果

一封感謝信。你的 Prompt 講得多清楚,輸出就多到位。

Prompt 是你唯一能控制的輸入。講得清楚,AI 就能做出你要的東西。

兩種 Prompt

你看得見的,
和藏在背後的。

System Prompt (你看不到的那一層)

「你是一位耐心的數學老師,絕對不能直接給答案,要引導學生自己想出來。」

User Prompt (學生在對話框打的)

「3 加 5 等於幾?」

輸出:「你覺得先把 3 個蘋果放到桌上,再放 5 個,一共幾個?」
同樣的問題,因為背後有 System Prompt,AI 的回答完全不一樣。

📌 記住這句:你今天要做的 Skill,本質上就是一份預先寫好、能隨時套上的 System Prompt 加操作步驟。

Prompt Engineering

不是在背技巧。
想清楚你要什麼

模糊的 Prompt

「幫我寫文章」

輸出:不知道主題、風格、長度、對象。隨機生成,猜你要什麼。

清楚的 Prompt

「針對 30–40 歲媽媽族群,寫一篇 300 字的 IG 文案,推廣暑假親子課程,語氣溫暖帶行動呼籲。」

輸出:精準。一次到位。

把這 5 件事先想清楚,AI 就不用猜 ↓

主題
對象
長度
語氣
格式

模型越來越聰明,你說得模糊它也能猜。但想清楚你要什麼,永遠比背技巧更重要。
等一下做 Skill,description 寫得好不好,就是這門功夫的應用。

先講痛點

AI 碰不到
真實世界

你問 AI「今天台北天氣怎樣」,它只會說「抱歉我查不到即時資訊」。它就是個文字接龍機器,沒有手、沒有眼睛。

🧠
大模型
文字進
文字出
沒有感知器官
A I 的牆
即時天氣
查不到
📧
Gmail
發不了
🌐
瀏覽器
開不了
📊
Google Sheet
看不到

這不是 AI 不夠聰明,是它天生的設計限制。打破這道牆,才是下一頁要講的事。

Tool 的本質

大模型只能說「我要呼叫」
真正動手的是平台

平台=Claude Code 等 · 大模型=Claude/GPT · 天氣工具=外部服務

1
👤 使用者
「台北天氣?」
⚙️ 平台
2
⚙️ 平台
轉送問題
🧠 大模型
3
🧠 大模型
「我要呼叫天氣工具」
⚙️ 平台
★ 大模型不能自己執行,只能回「我要呼叫 XX 工具、參數 YY」── 真正去執行的是平台
4
⚙️ 平台
平台實際去敲工具
⛅ 天氣工具
5
⛅ 天氣工具
回傳:25°C 晴
⚙️ 平台
6
⚙️ 平台
交回、大模型整合成一句話
「台北今天 25°C,適合外出」

Tool 就是 AI 伸出去的手。今天階梯 6 用 serper 查 Google、階梯 8 用瀏覽器抓競品,那些都是 Tool。

別怕這個詞

API 就是得來速
點餐窗口

你不用進廚房,照菜單說「我要一號餐」,窗口就把餐遞出來。這就是 API。

API 像得來速:程式開車到窗口點餐、資料從窗口遞出
你的程式開車來,照菜單點餐,資料就從窗口遞出 ── 不用進廚房。

你需要記住的三件事

① 照規矩點餐
每個 API 有自己的菜單(文件)。照文件格式傳參數,廚房才看得懂。
② 不用懂廚房
廚房怎麼煮是別人的事。你只管點餐、拿餐,不用知道後端怎麼實作。
③ 要先領資格卡
大多數 API 要先申請一把 API Key。沒有卡,窗口不理你。

連到今天

三個窗口,
今天都會親手敲

API Key 就是「點餐資格卡」。申請到卡,窗口才理你。這就是課前要你申請的原因。

🔍

serper

Google 搜尋結果
你不用自己開瀏覽器一頁頁查。
說「查這個關鍵字」,它把前十名、別人也問、相關搜尋整包回給你。
📌 階梯 6 用到 · 課前要申請 Key
📈

DataForSEO

搜量與 SEO 數據
關鍵字月搜量、競爭度、SERP 分析。
以前要手動查工具,現在你的 Skill 自己去敲這個窗口拿資料。
📌 SEO 分析階梯用到 · 課前要申請 Key
☁️

Google 服務

Search Console / Docs / Sheet
GSC 流量數據、自動寫進 Sheet、更新 Google Doc 報告。
全部都是 API 窗口,透過授權金鑰點餐。
📌 後段階梯用到 · OAuth 授權替代 Key

你的 Skill 就是那台開進得來速的車。它知道怎麼對哪個窗口說什麼,把資料拿回來給大模型用。API Key 就是資格卡,有卡才有資格點餐。

痛點

同一個工具,
要寫三遍

工具要能被 AI 使用,得先「接入」平台。問題來了:每個平台各有一套規範。

🔧 工具

天氣查詢
Notion、Slack…

OpenAI 格式
Anthropic 格式
Google 格式
ChatGPT
Claude
Gemini

同一個工具,接到 ChatGPT 照一套寫、接到 Claude 又一套、接到 Gemini 再一套。工程師寫到崩潰。這就是 MCP 出現之前的接入規範地獄。

MCP 是什麼

寫一次,
所有 AI 都能用

❌ 沒有 MCP

工具
OpenAI 格式
Anthropic 格式
Google 格式

同一工具要寫三套規範。每增加一個 AI 平台,就多寫一遍。

✅ 有 MCP

工具
MCP
統一規範
ChatGPT
Claude
Gemini

只寫一次。所有支援 MCP 的 AI 平台,全部能用。

MCP 全名 Model Context Protocol(模型上下文協定)。名字很學術,你把它記成「工具接入的統一規範」就好。一條線取代三條線。

一個比喻

MCP 就是
手機的 Type-C

🔌 Type-C 統一插頭

💻 📱 🎮 🖥

以前每支手機配一條不同的充電線。Type-C 出來之後,一條線接所有裝置。MCP 對工具接入做的事,跟 Type-C 一模一樣:統一規格,一次寫通。

🍳 分工記一句話

MCP = 廚房
給你爐子、刀、食材的存取權。解決「連得上什麼」。
Skill = 食譜
教你一步步把菜做出來。解決「連上之後怎麼把事做對」。

連得上 GA4 是 MCP 的事;連上後怎麼判斷一個關鍵字健不健康,是 Skill 的事。

能連到廚房,不等於做得出好菜。菜好不好,靠食譜。這也是為什麼今天重點在教你寫 Skill,而不是教你裝一堆工具。

Agent

腦 + 手 +自己規劃

你說一句意圖。它自己想步驟、自己連續呼叫工具、自己把事做完。

你說
「查今天天氣,下雨的話找附近賣傘的店」
STEP 1
📍
定位
呼叫 GPS Tool
回傳:台北市大安區
STEP 2
🌧
查天氣
呼叫天氣 Tool
回傳:下午有雨
發現下雨
STEP 3
☂️
找店家
呼叫地圖 Tool
回傳:附近 3 間雨傘店
Agent 自己規劃這三步、自己連續呼叫、自己判斷、一氣呵成

你今天用的 Claude Code,就是一個 Agent。你只下意圖,它自己規劃步驟、自己呼叫工具、自己把事跑完。

主角登場

Skill:提前寫好、
塞給 Agent 的說明書

Agent 很強,但它不知道你的私人規則。每次重打很煩。Skill 解這個問題。

😤 沒有 Skill 之前

每次都要重打規則:輸出格式、語氣、流程、限制條件。打完還要確認它有沒有漏讀。

✅ 有 Skill 之後

規則提前寫進 Skill,以後只說一句「出門助手」,它就自動照你的規矩辦,不用每次重講。

🚪 出門助手 Skill 長這樣:下雨帶傘 · 空氣差戴口罩 · 手機一定帶 · 回答先給結論
以後只說一句「我要出門」,它就照這份規矩辦,不用每次重講。

超能力外掛卡。 平常收著不佔位置,要用才抽出來。一份 Markdown 檔,就是你給 Agent 的完整說明書。

解剖一份 Skill

一個資料夾 + 一份 SKILL.md

上半:封面(frontmatter)

名字 + 描述。告訴 Agent 這個 Skill 叫什麼、什麼時候該用它。這是 Agent 平常看到的全部。

---
name: 出門助手
description: 幫我確認出門前要帶的東西
---

下半:內文(body)

步驟與規則。告訴 Agent 接到這個任務要怎麼做,細節全在這裡。只有描述「命中」了才會被翻開。

## 規則
1. 下雨帶傘
2. 空氣差帶口罩
3. 手機一定帶
4. 先給結論再列清單

SKILL.md 大寫是接頭暗號。 檔名必須大寫,名字錯系統就不認。一個資料夾、一份 SKILL.md,僅此而已。

最聰明的設計

平常只讀封面,
命中了才翻內文

還記得 Context 那張有限的桌子嗎?這個設計專門省桌子。

平常(問題不相關)
Skill A 封面 ≈ 100 token
Skill B 封面 ≈ 100 token
Skill C 封面 ≈ 100 token
桌子幾乎空著 ✓
命中(問題符合描述)
Skill A 封面
Skill B 封面 + 完整內文 ✦
Skill C 封面
只有 B 被翻開

Progressive Disclosure(漸進式披露)。 掛一百個 Skill 也不會塞爆桌子。不需要的內容不上桌,省 Context、省錢。

接下來做什麼

這就是今天的主角
你會親手做好幾個。

接下來十個階梯,你會把最煩的 SEO 工序,一個一個變成一句話就跑完的 Skill。

✦ Skill ← 今天你要親手做的
Agent你用的 Claude Code
MCP統一插座
API點餐窗口
ToolAI 的手
Prompt / Context / Token / LLM

↑ 你今天學的九個概念,全疊在這座塔上 ── Skill 就站在最頂端。

把最煩的 SEO 工序一個一個變成 Skill,最後做出一個用你自己風格寫作的 Skill。我們開始。

九層收斂

九層疊起來,
只學最頂那層

LLM 腦。猜下一個字的文字接龍機器。
Token 它的眼。文字被切成塊後轉成數字。
Context 桌子。它當下能看到的全部東西。
Prompt 你的指令。System 設規則、User 問問題。
Tool 它的手。讓它碰到真實世界。
API 服務的點餐窗口。程式照菜單呼叫。
MCP 工具的統一插座。Type-C 的概念。
Agent 會自己規劃的它。你只下意圖。
✦ Skill 你教它做事的說明書。今天你來寫這個。

你不用懂怎麼造腦造手。你只要學會寫最頂層那份說明書。 我們開始。