LLM 學習兩階段

AI 到底是怎麼運作的？

💬 Alex 碎碎念

簡單來說：AI 不是在「理解」你說的話，它是在「猜」下一個字。這個差別，決定了你用 AI 的整個策略。

你有沒有遇過這種情況？問 AI 一個問題，它講得頭頭是道，但其中一個數字根本是假的——你還差點拿去報告了。

第一次遇到這種事，代表你是正常人！我也走過這段。重點是知道為什麼會這樣，才能用得安心。

🎯 學習目標

📚 Know (知道)

了解 LLM（大型語言模型）是什麼，以及它和傳統計算機的本質差異
能說明預訓練和微調這兩個學習階段的白話意思
知道 AI 幻覺、知識截止日、上下文視窗這三個限制各自是什麼

🛠️ Use (使用)

能用「接龍機器」比喻，向同事解釋 AI 為什麼有時候會講錯話
在使用 AI 時，能判斷哪類任務受知識截止日影響最大

🚀 Do (實作)

試著問 AI 一個涉及最新資訊的問題，然後去原始來源驗證答案
注意上下文視窗的限制：下次貼入長文時，觀察 AI 是否在結尾開始「忘東忘西」

🔧 Manage (管理)

養成對 AI 輸出「先懷疑、再採用」的工作習慣
了解何時該補充即時資訊給 AI（例如：貼上最新公告、產品規格），何時可以直接信任它的知識

📋 流程

一個比喻：AI 不是計算機，是文字接龍機器

辦公室裡新來一個實習生，你問他：「這份合約的違約金是多少？」

計算機版的回答：「我查一下，第 7 條第 2 項寫 10 萬元。」精確、有來源。

AI 版的回答：它從記憶中拼湊出一個「聽起來最合理的答案」，不一定查過你手上這份合約。

重點來了：LLM 的本質是一台超大型的「文字接龍機器」。給它一段話，它預測下一個字應該是什麼，再預測下下一個字……直到組成一個完整的回應。這個過程不是查資料庫，是在做機率上最合理的「猜測」。

這不是缺陷，是設計原理。搞懂這點，你就懂了 AI 的全部行為邏輯。

LLM 是怎麼學會說話的：預訓練 + 微調

AI 的學習分兩個階段，就像實習生報到前後：

第一階段：預訓練（Pre-training）

實習生在學校讀了幾千萬篇文章、書本、論文、網頁。它沒有老師逐句教，就是大量閱讀，學會了語言的規律、世界的常識。

AI 的預訓練也是這樣：餵給它海量的數位文字，用大量運算讓它學會「什麼字之後通常接什麼字」。

第二階段：微調（Fine-tuning）

實習生進公司後，有人教他：「這樣回答客戶比較好」「那樣說話太不禮貌」「要有幫助、要誠實、要安全」。

AI 的微調也是這樣：由真人評分員引導，讓它學會怎麼給出有用、安全、符合人類期待的回應。

簡單來說：預訓練學知識，微調學態度。

為什麼 AI 會「亂講」？— 三個根本原因

原因一：幻覺（Hallucination）

AI 接龍接到一個它不確定的地方，但它不會說「我不知道」，而是繼續猜——猜出一個「看起來正確」的答案。

這在職場上最危險：數字、人名、法規條文、產品規格。這些你問就問了，AI 可能照猜不誤。

你有沒有遇過這種情況？把 AI 的答案直接貼進報告，後來才發現數字對不上？這就是幻覺在作怪。

原因二：知識截止日（Knowledge Cutoff）

實習生的教科書是某一年出版的。2024 年發生的事，他課本裡沒有。

AI 的知識也有個截止日期，之後發生的事它不知道。問它今年的稅法修訂、最新的產品價格——風險很高。

原因三：上下文視窗（Context Window）

你和 AI 對話時，它能「記住」的對話長度有上限，就像工作記憶有限。貼進去的文字超過這個上限，它就開始「忘記」前面的內容。

長文件、長對話尤其要注意。如果你貼了一份 50 頁的合約請它摘要，它很可能在結尾開始出現遺漏或矛盾。

AI 的強項 vs 限制

維度	AI 擅長	AI 不擅長
文字任務	起草、摘要、改寫、翻譯	確認數字的精確性
跨任務切換	同一對話中切換不同類型的工作	複雜多步驟的嚴密推理
時效性	知識截止日前的背景知識	今天剛發生的事
記憶	同一對話內的上下文	超過視窗限制的長對話
外部工具	可以接外部工具取得即時資訊	無工具時無法自行查詢

這套知識的邊界

這節課讓你知道「AI 為什麼這樣運作」，但它不能幫你決定哪個 AI 工具最適合你的工作。選工具是下一課（ch01-04）的事——那裡會比較不同平台的強項和適用場景。

一句話收尾：AI 是一台很強的文字接龍機器，不是全知的神。知道它的原理，你就能在對的地方信任它，在對的地方查驗它。

✅ 確認清單

[ ] 能用自己的話解釋「LLM 是文字接龍機器」這個比喻
[ ] 說得出 AI 幻覺、知識截止日、上下文視窗這三個限制各是什麼
[ ] 知道預訓練和微調各自代表什麼
[ ] 下次用 AI 查時效性資料時，記得去原始來源驗證

AI 到底是怎麼運作的？ ​

💬 Alex 碎碎念 ​

🎯 學習目標 ​

📚 Know (知道) ​

🛠️ Use (使用) ​

🚀 Do (實作) ​

🔧 Manage (管理) ​

📋 流程 ​

一個比喻：AI 不是計算機，是文字接龍機器 ​

LLM 是怎麼學會說話的：預訓練 + 微調 ​

為什麼 AI 會「亂講」？— 三個根本原因 ​

AI 的強項 vs 限制 ​

這套知識的邊界 ​

✅ 確認清單 ​

🔗 相關連結 ​