NLP Glossary
Jump to navigation
Jump to search
自然語言處理(Natural Language Processing, NLP)相關詞彙
這篇文章「NLP Glossary」內容還在撰寫中,如果有不完整的部分,歡迎你直接動手修改。 |
C[edit]
- computational linguistics; 計算語言學、電腦語言學; 计算语言学
- Coreference; 指代
- Coreference Resolution; 指代消解、共指消解; 指代消解
D[edit]
- discourse analysis; 篇章分析、言談分析; 篇章分析、语篇分析。「分析口語、書面語言、手語、肢體語言等等不同的語言行為(Speech acts)及言外行為。」(資料來源: 維基百科 篇章分析)
E[edit]
- EMNLP (Empirical Methods in Natural Language Processing) is a "leading conference in the area of natural language processing and artificial intelligence."[1] 「自然語言處理實務研討會」,研討會網站 EMNLP 2021。
G[edit]
- Generative AI (GenAI, 生成式人工智慧):「是一種人工智慧系統,能夠產生文字、圖像或其他媒體以回應提示工程,比如 ChatGPT。產生模型學習輸入數據的模式和結構,然後產生與訓練數據相似但具有一定程度新穎性的新內容,而不僅僅是分類或預測數據。」(資料來源:維基百科)
H[edit]
- Hallucinate (機器幻覺):「廣泛使用來指稱ChatGPT 等所犯的系統錯誤,展示了我們對待和擬人化人工智慧的思考方式。然而,不準確或誤導性資訊長期以來一直存在於我們身邊,無論是謠言、宣傳還是『假新聞』的形式。」(Henry Shevlin)[2]。相關詞彙:Generative AI
I[edit]
- intent (意圖):讓電腦了解「使用者聊天內容的問題類型」,從對話內容萃取實體參數 (entity type),進而決定電腦後續如何操作。(參考資料:Intents | Dialogflow ES | Google Cloud、如何分類意圖?. 意圖是什麼? 意圖怎麼分? 意圖不應該怎麼分類? | by Umy Chang | YOCTOL.AI)
- Information Extraction; 資訊擷取; 信息抽取。「資訊擷取是由文件中擷取事先預設所需的資訊」(資料來源: 國家教育研究院雙語詞彙 資訊擷取)
L[edit]
- Lexicology; 詞彙學; 词汇学;
- Lexical Semantics; 詞彙語義、詞彙語義學、詞匯語義學[3]; 词汇语义、词汇语义学 "Lexical Semantics is about the meaning of words." (來源: D. A. Cruse, 1986)[4]
- Linguistic Science; 語言科學、語言學、语言科学。「對於語言系統的科學研究,主要在研究人類語言系統的本質、結構、單位及變遷等。」(來源: 國家教育研究院雙語詞彙 語言科學)
N[edit]
- Named-entity recognition (NER); 命名實體識別; 命名实体识别。「識別文本中具有特定意義的實體,主要包括人名、地名、機構名、專有名詞等,以及時間、數量、貨幣、比例數值等文字。」(資料來源: 维基百科)。相關頁面:Named entity recognition tools
- NLU (Natural-language understanding): 自然語言理解 / 自然语言理解。「目標研究如何讓電腦讀懂人類語言。商業應用有電腦理解、機器翻譯、對話、新聞蒐集、語音介面」(資料來源: 维基百科)
- NLP (Natural language processing): 自然語言處理 / 自然语言处理。「此領域探討如何處理及運用自然語言;自然語言處理的挑戰包括有語音識別、自然語言理解、自然語言生成等部分。」(資料來源: 维基百科)
O[edit]
- OOV, Out of Vocabulary [繁] 未登錄詞、遺失字 [簡] 未登录词。
P[edit]
- POS (part-of-speech) 詞性。:圖書館學與資訊科學大辭典:「字詞(word)是語言系統中具有獨立語意或扮演特定語法功能,且可以自由使用的最小語言單位。依據字詞在句法結構或語言形態上扮演的角色,經由詞性分類賦予語句中每個字詞適當之詞性符號或標記的過程,則稱為詞性標記(part-of-speech tagging,或稱POS tagging)。」
Q[edit]
- Quantitative content analysis 量化內容分析
S[edit]
- Semantics; 語義學、語意學; 语义学。「語意學就是專門研究『語言意義』(meaning of Language) 的一門學問;屬於語言學 (Linguistics) 的一部分。」(來源: 國家教育研究院雙語詞彙 Semantics - 語意學)
- semantic analysis; 語意分析; 语意分析、语义分析;「將一長串的文字或內容,從其中分析出該個段落的摘要以及大意,甚至更進一步,將整篇文章的文意整理出來。」(來源: 维基百科 語意分析)
T[edit]
- Telicity (動詞的終結點):
- (1) telic: 有事件或狀態的終結點 (endpoint) 的動詞,例如「約翰蓋了一間房子」
- (2) atelic: 沒有終結點的動詞,例如「約翰蓋房子蓋了一個月」。參考資料:維基百科、中文文法:telicity 這動作有停下來的一天嗎? - Droidtown.co
- Temperature 溫度:「溫度是自然語言處理模型中的參數,用於增加或減少模型對其最可能的反應的『信心』。較高的溫度使模型更有『創造性』,這在生成文章等方面可能很有用。較低的溫度使模型更加『自信』,這在回答問題等應用中很有用。」[5] (comments)
- Text mining (文本挖掘、文字探勘、文本挖掘) 「從文本處理過程中取得高質量的訊息」 (來源: 維基百科)
- Text segmentation, Segmentation of words 斷詞。相關工具: 中文斷詞工具
W[edit]
- Word-sense disambiguation; 詞義消歧; 词义消歧。一詞多義
延伸閱讀[edit]
- 分類:計算語言學 - 維基百科,自由的百科全書 或 Category:Computational linguistics - Wikipedia
- Category:Natural language processing - Wikipedia
參考資料[edit]
- ↑ Empirical Methods in Natural Language Processing - Wikipedia
- ↑ 「真真假假,假假真真的AI時代」劍橋詞典2023年度代表字:Hallucinate | DQ 地球圖輯隊
- ↑ ISBN 9787506272995 博客來-詞匯語義學(英文版)
- ↑ ISBN 9780521276436 Lexical semantics | Semantics and pragmatics | Cambridge University Press
- ↑ What is Temperature in NLP?🐭 :: Luke Salamone's Blog