LLMs Usage FAQ in Mandarin: Difference between revisions

Revision as of 09:49, 5 July 2025

LLMs 使用常見問題與解答

🌐 Switch language: EN, 漢字

如何解決「強制保持繁體中文輸出」

📝 問題： AI 回答的內容包含簡體中文字

💬　解決方式：

在問題前加上 #zh-TW。^[1]
或指定「使用臺灣常用的繁體中文」。

範例：部份模型無法區分繁體中文與簡體中文的差別，因此保哥建議提供繁體中文與英文對照的詞彙表。

請使用台灣常用的繁體中文：

規則：
- 使用全形標點符號，中英文之間加入空格。
- 以下是常見的 AI 相關術語詞彙對應表（English -> 中文）：
  * Transformer -> Transformer
  * Token -> Token
  * LLM/Large Language Model -> 大語言模型
  * Zero-shot -> 零樣本
  * Few-shot -> 少樣本
  * AI Agent -> AI 代理
  * AGI -> 通用人工智慧

我想產生更長的文章內容

📝 問題：我想要使用 LLMs 產生 5000~6000 字的文章，但是每次只能產生 1000~1500 字的文章。

💬 原因： LLMs 模型有上下文 (context window) 的長度限制，每次請求的輸入與輸出加起來的 token 數量有固定限制。因此每次產生的結果都會遇到 1000~1500 字的上限。建議的解決方式（workaround）是將預定輸出的文章進行結構拆解，分章節逐步輸出內容。

解決方案：如果無法一次產生 5000~6000 字的文章，可以在輸入指示中事先規劃五個章節架構，再依照章節順序逐次產生內容，最終達到 5000~6000 字文章的產出目標。

以 OpenAI o3 模型為例：(1) Context Window (200,000)：輸入 + 輸出的總額度、(2) Max Output Tokens (100,000)：單次回答上限。實際輸入空間：200,000 - 預計輸出長度

如何讓 AI 處理長篇文章

📝 問題：上下文長度限制 LLMs 模型受到上下文窗口（context window）長度的限制，以翻譯長文章為例，由於無法一次處理全部內容，我們需要將文章分段進行處理。

💬 處理方式：分塊處理與保持上下文連貫的策略

處理長文時需要採用分段切塊（Chunking）的技術策略^[2]。為了讓模型在處理後續段落時能夠理解前面章節的脈絡，一個有效的方法是將前面文章摘要的切塊策略：

先將前面章節進行摘要
將摘要與待處理的下一章節全文一起輸入給 AI
這樣既能保持上下文連貫性，又能節省 token 使用量

重疊式切塊策略

另一種切塊策略適用於處理逐字稿的編輯。逐字稿的格式通常包含時間戳記和對應的字幕內容：

1
00:00:00,001 --> 00:00:02,000
所以你先回答我

2
00:00:02,000 --> 00:00:06,000
有哪一個國家讓憲法把你空窗那麼久的

3
00:00:06,000 --> 00:00:10,000
你再來跟我說有哪一個國家沒有這樣制定

如果直接將第 3 段獨立送到 AI 編輯，很容易因為缺乏前面的對話脈絡而產生錯誤。此時可以採用「允許部分重疊（overlap）」的內容切塊策略。以下是一個改善中文逐字稿的 prompt 範例^[3]：

你的任務是改善中文口語訪談的逐字稿段落。您需要增加標點符號、確保段落連貫、保持原意，並視需要重寫部分文字。請使用台灣常用的繁體中文。

這是前文段落：
<previous_paragraph>
{PREVIOUS_PARAGRAPH}
</previous_paragraph>

這是目前的段落：
<current_paragraph>
{CURRENT_PARAGRAPH}
</current_paragraph>

這是後文段落：
<next_paragraph>
{NEXT_PARAGRAPH}
</next_paragraph>

這種方法讓 AI 能夠同時參考前後文內容，確保處理結果的連貫性和準確性。

如何解決 AI 會忘記訓練內容

📝 詢問內容：

我想進一步請教一個問題：如果我們採用「層層優化提示詞」這種漸進式的方法來改善AI表現，會不會遇到以下情況：在經過多次提示詞優化後，AI確實學會了相關技能並表現良好，但是過了一段時間後，它又忘記了這些已經訓練好的能力？

我想了解現在各大主流AI模型平台是否都具備穩定的記憶保留功能，也就是說，它們能夠持續記住之前我們給予的訓練提示和指導內容嗎？

我有時候會感覺AI的記憶力似乎不太穩定。在同一個專案進行過程中，明明之前已經向AI詳細說明過的內容和要求，過了一陣子卻需要重新從頭解釋一遍，這讓我對AI的學習持續性產生疑問。

💬 回覆內容：

早期的AI模型由於context window（上下文視窗）長度限制較短，很容易出現偏離原本設定方向的情況。當我遇到這種狀況時，我通常會選擇開啟一個全新的對話，重新開始整個互動過程。

現在的AI模型在這方面應該有顯著的改善。如果這次的對話效果令人滿意，我建議你可以給AI下達一個指令，要求它總結並收斂整個對話過程，將對話中累積的互動原則和經驗歸納整合到最初的提示詞中：

假設我要開啟一個新的對話來討論相同的主題，請你建議我應該使用怎樣的完整提示詞。
這個提示詞需要包含我們整個討論過程中的重要內容：
(1) 原本提示詞想要解決的核心問題和目標
(2) 與原本問題相關聯，但是一開始的解決方法沒有充分考慮到的重要面向和細節

如何解決：AI 好笨啊，問它 AABB 都不知道

📝 詢問內容：AI 好笨啊，問它關於 AABB 主題的事情都不知道，怎麼這麼難用？

💬 回覆內容：AI 基底模型 (base model) 有知識截止時間 (knowledge cut-off date^[4])。知識截止日期代表 AI 模型無法取得超過該時間點的事件或資訊。這個日期是由模型訓練資料最後更新的時間點決定的。當超出這個模型的時間限制，很容易會遇到幻覺或不懂的狀況。

建議方式：

網路搜尋：建議選擇支援「網路搜尋」功能的 AI 工具，先啟用「網路搜尋」功能後，再重新提出問題。
上傳知識檔案：或是準備關於介紹 AABB 主題的文件或知識檔案 (knowledge files) ^[5]^[6]，上傳到 AI 對話中，讓它具備先備知識，然後才討論這個主題。

如果是太新或冷門的資訊，無法透過網路搜尋即時取得時，則建議採用第二種上傳知識檔案的方式。有時候 AI 會宣稱已經理解 AABB 不懂裝懂的狀況，則可以提出基本概念問題進行驗證。

參考資料

[1] ChatGPT：如何強制保持繁體中文輸出｜學科技、省時間 - 學科技

[2] 使用繁體中文評測 RAG 的 Chunking 切塊策略 – ihower { blogging }

[3] 如何改善 Whisper 逐字稿可讀性：AI 標點符號教學

[4] A comprehensive list of Large Language Model knowledge cut off dates - ALLMO: Boost Your Brand’s Visibility in AI Search

[5] What kinds of documents can I upload to Claude.ai? | Anthropic Help Center

[6] Document understanding | Gemini API | Google AI for Developers

[1]

[2]

[3]

[4]

[5]

[6]

@@ Line 125: / Line 125: @@
 💬 回覆內容：AI 基底模型 (base model) 有知識截止時間 (knowledge cut-off date<ref>[https://www.allmo.ai/articles/list-of-large-language-model-cut-off-dates A comprehensive list of Large Language Model knowledge cut off dates - ALLMO: Boost Your Brand’s Visibility in AI Search]</ref>)。知識截止日期代表 AI 模型無法取得超過該時間點的事件或資訊。這個日期是由模型訓練資料最後更新的時間點決定的。當超出這個模型的時間限制，很容易會遇到幻覺或不懂的狀況。
-(1) 建議選擇支援「網路搜尋」功能的 AI 工具，先啟用「網路搜尋」功能後，再重新提出問題。
+建議方式：
+# '''網路搜尋'''：建議選擇支援「網路搜尋」功能的 AI 工具，先啟用「網路搜尋」功能後，再重新提出問題。
-(2) 或是準備關於介紹 AABB 主題的文件或知識檔案 (knowledge files) <ref>[https://support.anthropic.com/en/articles/8241126-what-kinds-of-documents-can-i-upload-to-claude-ai What kinds of documents can I upload to Claude.ai? | Anthropic Help Center]</ref><ref>[https://ai.google.dev/gemini-api/docs/document-processing?lang=rest Document understanding  |  Gemini API  |  Google AI for Developers]</ref>，上傳到 AI 對話中，讓它具備先備知識，然後才討論這個主題。
+# '''上傳知識檔案'''：或是準備關於介紹 AABB 主題的文件或知識檔案 (knowledge files) <ref>[https://support.anthropic.com/en/articles/8241126-what-kinds-of-documents-can-i-upload-to-claude-ai What kinds of documents can I upload to Claude.ai? | Anthropic Help Center]</ref><ref>[https://ai.google.dev/gemini-api/docs/document-processing?lang=rest Document understanding  |  Gemini API  |  Google AI for Developers]</ref>，上傳到 AI 對話中，讓它具備先備知識，然後才討論這個主題。
 如果是太新或冷門的資訊，無法透過網路搜尋即時取得時，則建議採用第二種上傳知識檔案的方式。有時候 AI 會宣稱已經理解 AABB 不懂裝懂的狀況，則可以提出基本概念問題進行驗證。