Skip to content

LLM 學習兩階段

AI 到底是怎麼運作的?

💬 Alex 碎碎念

簡單來說:AI 不是在「理解」你說的話,它是在「猜」下一個字。這個差別,決定了你用 AI 的整個策略。

你有沒有遇過這種情況?問 AI 一個問題,它講得頭頭是道,但其中一個數字根本是假的——你還差點拿去報告了。

第一次遇到這種事,代表你是正常人!我也走過這段。重點是知道為什麼會這樣,才能用得安心。

🎯 學習目標

📚 Know (知道)

  • 了解 LLM(大型語言模型)是什麼,以及它和傳統計算機的本質差異
  • 能說明預訓練和微調這兩個學習階段的白話意思
  • 知道 AI 幻覺、知識截止日、上下文視窗這三個限制各自是什麼

🛠️ Use (使用)

  • 能用「接龍機器」比喻,向同事解釋 AI 為什麼有時候會講錯話
  • 在使用 AI 時,能判斷哪類任務受知識截止日影響最大

🚀 Do (實作)

  • 試著問 AI 一個涉及最新資訊的問題,然後去原始來源驗證答案
  • 注意上下文視窗的限制:下次貼入長文時,觀察 AI 是否在結尾開始「忘東忘西」

🔧 Manage (管理)

  • 養成對 AI 輸出「先懷疑、再採用」的工作習慣
  • 了解何時該補充即時資訊給 AI(例如:貼上最新公告、產品規格),何時可以直接信任它的知識

📋 流程

一個比喻:AI 不是計算機,是文字接龍機器

辦公室裡新來一個實習生,你問他:「這份合約的違約金是多少?」

計算機版的回答:「我查一下,第 7 條第 2 項寫 10 萬元。」精確、有來源。

AI 版的回答:它從記憶中拼湊出一個「聽起來最合理的答案」,不一定查過你手上這份合約。

重點來了:LLM 的本質是一台超大型的「文字接龍機器」。給它一段話,它預測下一個字應該是什麼,再預測下下一個字……直到組成一個完整的回應。這個過程不是查資料庫,是在做機率上最合理的「猜測」。

這不是缺陷,是設計原理。搞懂這點,你就懂了 AI 的全部行為邏輯。

LLM 是怎麼學會說話的:預訓練 + 微調

AI 的學習分兩個階段,就像實習生報到前後:

第一階段:預訓練(Pre-training)

實習生在學校讀了幾千萬篇文章、書本、論文、網頁。它沒有老師逐句教,就是大量閱讀,學會了語言的規律、世界的常識。

AI 的預訓練也是這樣:餵給它海量的數位文字,用大量運算讓它學會「什麼字之後通常接什麼字」。

第二階段:微調(Fine-tuning)

實習生進公司後,有人教他:「這樣回答客戶比較好」「那樣說話太不禮貌」「要有幫助、要誠實、要安全」。

AI 的微調也是這樣:由真人評分員引導,讓它學會怎麼給出有用、安全、符合人類期待的回應。

簡單來說:預訓練學知識,微調學態度。

為什麼 AI 會「亂講」?— 三個根本原因

原因一:幻覺(Hallucination)

AI 接龍接到一個它不確定的地方,但它不會說「我不知道」,而是繼續猜——猜出一個「看起來正確」的答案。

這在職場上最危險:數字、人名、法規條文、產品規格。這些你問就問了,AI 可能照猜不誤。

你有沒有遇過這種情況?把 AI 的答案直接貼進報告,後來才發現數字對不上?這就是幻覺在作怪。

原因二:知識截止日(Knowledge Cutoff)

實習生的教科書是某一年出版的。2024 年發生的事,他課本裡沒有。

AI 的知識也有個截止日期,之後發生的事它不知道。問它今年的稅法修訂、最新的產品價格——風險很高。

原因三:上下文視窗(Context Window)

你和 AI 對話時,它能「記住」的對話長度有上限,就像工作記憶有限。貼進去的文字超過這個上限,它就開始「忘記」前面的內容。

長文件、長對話尤其要注意。如果你貼了一份 50 頁的合約請它摘要,它很可能在結尾開始出現遺漏或矛盾。

AI 的強項 vs 限制

維度AI 擅長AI 不擅長
文字任務起草、摘要、改寫、翻譯確認數字的精確性
跨任務切換同一對話中切換不同類型的工作複雜多步驟的嚴密推理
時效性知識截止日前的背景知識今天剛發生的事
記憶同一對話內的上下文超過視窗限制的長對話
外部工具可以接外部工具取得即時資訊無工具時無法自行查詢

這套知識的邊界

這節課讓你知道「AI 為什麼這樣運作」,但它不能幫你決定哪個 AI 工具最適合你的工作。選工具是下一課(ch01-04)的事——那裡會比較不同平台的強項和適用場景。

一句話收尾:AI 是一台很強的文字接龍機器,不是全知的神。知道它的原理,你就能在對的地方信任它,在對的地方查驗它。

✅ 確認清單

  • [ ] 能用自己的話解釋「LLM 是文字接龍機器」這個比喻
  • [ ] 說得出 AI 幻覺、知識截止日、上下文視窗這三個限制各是什麼
  • [ ] 知道預訓練和微調各自代表什麼
  • [ ] 下次用 AI 查時效性資料時,記得去原始來源驗證

🔗 相關連結