外觀
AI 到底是怎麼運作的?
💬 Alex 碎碎念
簡單來說:AI 不是在「理解」你說的話,它是在「猜」下一個字。這個差別,決定了你用 AI 的整個策略。
你有沒有遇過這種情況?問 AI 一個問題,它講得頭頭是道,但其中一個數字根本是假的——你還差點拿去報告了。
第一次遇到這種事,代表你是正常人!我也走過這段。重點是知道為什麼會這樣,才能用得安心。
🎯 學習目標
📚 Know (知道)
- 了解 LLM(大型語言模型)是什麼,以及它和傳統計算機的本質差異
- 能說明預訓練和微調這兩個學習階段的白話意思
- 知道 AI 幻覺、知識截止日、上下文視窗這三個限制各自是什麼
🛠️ Use (使用)
- 能用「接龍機器」比喻,向同事解釋 AI 為什麼有時候會講錯話
- 在使用 AI 時,能判斷哪類任務受知識截止日影響最大
🚀 Do (實作)
- 試著問 AI 一個涉及最新資訊的問題,然後去原始來源驗證答案
- 注意上下文視窗的限制:下次貼入長文時,觀察 AI 是否在結尾開始「忘東忘西」
🔧 Manage (管理)
- 養成對 AI 輸出「先懷疑、再採用」的工作習慣
- 了解何時該補充即時資訊給 AI(例如:貼上最新公告、產品規格),何時可以直接信任它的知識
📋 流程
一個比喻:AI 不是計算機,是文字接龍機器
辦公室裡新來一個實習生,你問他:「這份合約的違約金是多少?」
計算機版的回答:「我查一下,第 7 條第 2 項寫 10 萬元。」精確、有來源。
AI 版的回答:它從記憶中拼湊出一個「聽起來最合理的答案」,不一定查過你手上這份合約。
重點來了:LLM 的本質是一台超大型的「文字接龍機器」。給它一段話,它預測下一個字應該是什麼,再預測下下一個字……直到組成一個完整的回應。這個過程不是查資料庫,是在做機率上最合理的「猜測」。
這不是缺陷,是設計原理。搞懂這點,你就懂了 AI 的全部行為邏輯。
LLM 是怎麼學會說話的:預訓練 + 微調
AI 的學習分兩個階段,就像實習生報到前後:
第一階段:預訓練(Pre-training)
實習生在學校讀了幾千萬篇文章、書本、論文、網頁。它沒有老師逐句教,就是大量閱讀,學會了語言的規律、世界的常識。
AI 的預訓練也是這樣:餵給它海量的數位文字,用大量運算讓它學會「什麼字之後通常接什麼字」。
第二階段:微調(Fine-tuning)
實習生進公司後,有人教他:「這樣回答客戶比較好」「那樣說話太不禮貌」「要有幫助、要誠實、要安全」。
AI 的微調也是這樣:由真人評分員引導,讓它學會怎麼給出有用、安全、符合人類期待的回應。
簡單來說:預訓練學知識,微調學態度。
為什麼 AI 會「亂講」?— 三個根本原因
原因一:幻覺(Hallucination)
AI 接龍接到一個它不確定的地方,但它不會說「我不知道」,而是繼續猜——猜出一個「看起來正確」的答案。
這在職場上最危險:數字、人名、法規條文、產品規格。這些你問就問了,AI 可能照猜不誤。
你有沒有遇過這種情況?把 AI 的答案直接貼進報告,後來才發現數字對不上?這就是幻覺在作怪。
原因二:知識截止日(Knowledge Cutoff)
實習生的教科書是某一年出版的。2024 年發生的事,他課本裡沒有。
AI 的知識也有個截止日期,之後發生的事它不知道。問它今年的稅法修訂、最新的產品價格——風險很高。
原因三:上下文視窗(Context Window)
你和 AI 對話時,它能「記住」的對話長度有上限,就像工作記憶有限。貼進去的文字超過這個上限,它就開始「忘記」前面的內容。
長文件、長對話尤其要注意。如果你貼了一份 50 頁的合約請它摘要,它很可能在結尾開始出現遺漏或矛盾。
AI 的強項 vs 限制
| 維度 | AI 擅長 | AI 不擅長 |
|---|---|---|
| 文字任務 | 起草、摘要、改寫、翻譯 | 確認數字的精確性 |
| 跨任務切換 | 同一對話中切換不同類型的工作 | 複雜多步驟的嚴密推理 |
| 時效性 | 知識截止日前的背景知識 | 今天剛發生的事 |
| 記憶 | 同一對話內的上下文 | 超過視窗限制的長對話 |
| 外部工具 | 可以接外部工具取得即時資訊 | 無工具時無法自行查詢 |
這套知識的邊界
這節課讓你知道「AI 為什麼這樣運作」,但它不能幫你決定哪個 AI 工具最適合你的工作。選工具是下一課(ch01-04)的事——那裡會比較不同平台的強項和適用場景。
一句話收尾:AI 是一台很強的文字接龍機器,不是全知的神。知道它的原理,你就能在對的地方信任它,在對的地方查驗它。
✅ 確認清單
- [ ] 能用自己的話解釋「LLM 是文字接龍機器」這個比喻
- [ ] 說得出 AI 幻覺、知識截止日、上下文視窗這三個限制各是什麼
- [ ] 知道預訓練和微調各自代表什麼
- [ ] 下次用 AI 查時效性資料時,記得去原始來源驗證