Editing
NLP Glossary
Jump to navigation
Jump to search
Warning:
You are not logged in. Your IP address will be publicly visible if you make any edits. If you
log in
or
create an account
, your edits will be attributed to your username, along with other benefits.
Anti-spam check. Do
not
fill this in!
自然語言處理(Natural Language Processing, NLP)相關詞彙 {{Template:Draft}} == A == * APA 代理自動化 (Agentic Process Automation) 「是一種利用大型語言模型(LLM)代理進行高級自動化的新範式。傳統的機器人流程自動化(RPA)在處理需要人類智慧的任務時存在局限性,特別是在工作流程建立和動態決策方面。APA利用LLM代理來建立和執行工作流程,從而減少人類勞動。例如,ProAgent 是一個基於LLM的代理,能夠根據人類指令建立工作流程並進行複雜決策。APA技術與工具學習、流程挖掘等領域有關,並且對自動化偏見和人類勞動的意義具有潛力和機會。」來源:[https://arxiv.org/abs/2311.10751 [2311.10751] ProAgent: From Robotic Process Automation to Agentic Process Automation]) == C == * [https://en.wikipedia.org/wiki/Catastrophic_interference Catastrophic Forgetting] 災難性遺忘、災難性失憶; 灾难性遗忘。「災難性遺忘是神經網路在學習新資訊時忘記舊資訊的問題,這與人類記憶的穩定性形成對比。減少干擾的方法:包括使用正交向量、半分佈表示、創新規則、預訓練、重複機制和生成重放等技術。」(資料來源:[https://en.wikipedia.org/wiki/Catastrophic_interference 維基百科]) * [https://en.wikipedia.org/wiki/Computational_linguistics computational linguistics]; [https://zh.wikipedia.org/zh-tw/%E8%AE%A1%E7%AE%97%E8%AF%AD%E8%A8%80%E5%AD%A6 計算語言學]、電腦語言學; 计算语言学 * [https://en.wikipedia.org/wiki/Coreference Coreference]; [https://zh.wikipedia.org/zh-tw/%E6%8C%87%E4%BB%A3 指代] * Coreference Resolution; 指代消解、共指消解; 指代消解 == D == * [https://en.wikipedia.org/wiki/Discourse_analysis discourse analysis]; [https://zh.wikipedia.org/zh-tw/%E7%AF%87%E7%AB%A0%E5%88%86%E6%9E%90 篇章分析]、言談分析; 篇章分析、[https://baike.baidu.com/item/%E8%AF%AD%E7%AF%87%E5%88%86%E6%9E%90 语篇分析]。「分析口語、書面語言、手語、肢體語言等等不同的語言行為(Speech acts)及言外行為。」(資料來源: 維基百科 [https://zh.wikipedia.org/zh-tw/%E7%AF%87%E7%AB%A0%E5%88%86%E6%9E%90 篇章分析]) == E == * EMNLP (Empirical Methods in Natural Language Processing) is a "leading conference in the area of natural language processing and artificial intelligence."<ref>[https://en.wikipedia.org/wiki/Empirical_Methods_in_Natural_Language_Processing Empirical Methods in Natural Language Processing - Wikipedia]</ref> 「自然語言處理實務研討會」,研討會網站 [https://2021.emnlp.org/ EMNLP 2021]。 == G == * Generative AI (GenAI, 生成式人工智慧):「是一種人工智慧系統,能夠產生文字、圖像或其他媒體以回應提示工程,比如 ChatGPT。產生模型學習輸入數據的模式和結構,然後產生與訓練數據相似但具有一定程度新穎性的新內容,而不僅僅是分類或預測數據。」(資料來源:[https://zh.wikipedia.org/zh-tw/%E7%94%9F%E6%88%90%E5%BC%8F%E4%BA%BA%E5%B7%A5%E6%99%BA%E6%85%A7 維基百科]) == H == * Hallucinate (機器幻覺):「廣泛使用來指稱ChatGPT 等所犯的系統錯誤,展示了我們對待和擬人化人工智慧的思考方式。然而,不準確或誤導性資訊長期以來一直存在於我們身邊,無論是謠言、宣傳還是『假新聞』的形式。」(Henry Shevlin)<ref>[https://dq.yam.com/post/15833 「真真假假,假假真真的AI時代」劍橋詞典2023年度代表字:Hallucinate | DQ 地球圖輯隊]</ref>。相關詞彙:[[Generative AI]] == I == * intent (意圖):讓電腦了解「使用者聊天內容的問題類型」,從對話內容萃取實體參數 (entity type),進而決定電腦後續如何操作。(參考資料:[https://cloud.google.com/dialogflow/es/docs/intents-overview?hl=en Intents | Dialogflow ES | Google Cloud]、[https://blog.yoctol.com/%E5%A6%82%E4%BD%95%E5%88%86%E9%A1%9E%E6%84%8F%E5%9C%96-4ba2e3ad3997 如何分類意圖?. 意圖是什麼? 意圖怎麼分? 意圖不應該怎麼分類? | by Umy Chang | YOCTOL.AI]) * [https://en.wikipedia.org/wiki/Information_extraction Information Extraction]; [https://zh.wikipedia.org/zh-tw/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96 資訊擷取]; [http://wiki.mbalib.com/zh-tw/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96 信息抽取]。「資訊擷取是由文件中擷取事先預設所需的資訊」(資料來源: 國家教育研究院雙語詞彙 [http://terms.naer.edu.tw/detail/1679021/ 資訊擷取]) == L == * [https://en.wikipedia.org/wiki/Lexicology Lexicology]; 詞彙學; 词汇学; * Lexical Semantics; 詞彙語義、詞彙語義學、詞匯語義學<ref>ISBN 9787506272995 [http://www.books.com.tw/products/CN10143163 博客來-詞匯語義學(英文版)]</ref>; 词汇语义、[https://baike.baidu.com/item/%E8%AF%8D%E6%B1%87%E8%AF%AD%E4%B9%89%E5%AD%A6 词汇语义学] "Lexical Semantics is about the meaning of words." (來源: D. A. Cruse, 1986)<ref>ISBN 9780521276436 [http://admin.cambridge.org/academic/subjects/languages-linguistics/semantics-and-pragmatics/lexical-semantics?format=PB#lSg4hz4FFWYy0BGH.97 Lexical semantics | Semantics and pragmatics | Cambridge University Press]</ref> * Linguistic Science; [http://terms.naer.edu.tw/detail/1313402/ 語言科學]、語言學、语言科学。「對於語言系統的科學研究,主要在研究人類語言系統的本質、結構、單位及變遷等。」(來源: 國家教育研究院雙語詞彙 [http://terms.naer.edu.tw/detail/1313402/ 語言科學]) == N == * [https://en.wikipedia.org/wiki/Named-entity_recognition Named-entity recognition] (NER); [https://zh.wikipedia.org/zh-tw/%E5%91%BD%E5%90%8D%E5%AE%9E%E4%BD%93%E8%AF%86%E5%88%AB 命名實體識別]; 命名实体识别。「識別文本中具有特定意義的實體,主要包括人名、地名、機構名、專有名詞等,以及時間、數量、貨幣、比例數值等文字。」(資料來源: [https://zh.wikipedia.org/zh-tw/%E5%91%BD%E5%90%8D%E5%AE%9E%E4%BD%93%E8%AF%86%E5%88%AB 维基百科])。相關頁面:[[Named entity recognition tools]] * NLU ([https://en.wikipedia.org/wiki/Natural-language_understanding Natural-language understanding]): [https://zh.wikipedia.org/zh-tw/%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E7%90%86%E8%A7%A3 自然語言理解] / 自然语言理解。「目標研究如何讓電腦讀懂人類語言。商業應用有電腦理解、機器翻譯、對話、新聞蒐集、語音介面」(資料來源: [https://zh.wikipedia.org/zh-tw/%E5%91%BD%E5%90%8D%E5%AE%9E%E4%BD%93%E8%AF%86%E5%88%AB 维基百科]) * NLP ([https://en.wikipedia.org/wiki/Natural_language_processing Natural language processing]): [https://zh.wikipedia.org/zh-tw/%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86 自然語言處理] / 自然语言处理。「此領域探討如何處理及運用自然語言;自然語言處理的挑戰包括有語音識別、自然語言理解、自然語言生成等部分。」(資料來源: [https://zh.wikipedia.org/zh-tw/%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86 维基百科]) == O == * OOV, [https://www.igi-global.com/dictionary/out-of-vocabulary/21613 Out of Vocabulary] [繁] 未登錄詞、遺失字、未見字 [簡] 未登录词。 == P == * POS (part-of-speech) 詞性。:[http://terms.naer.edu.tw/detail/1678982/ 圖書館學與資訊科學大辭典]:「字詞(word)是語言系統中具有獨立語意或扮演特定語法功能,且可以自由使用的最小語言單位。依據字詞在句法結構或語言形態上扮演的角色,經由詞性分類賦予語句中每個字詞適當之詞性符號或標記的過程,則稱為詞性標記(part-of-speech tagging,或稱POS tagging)。」 == Q == * Quantitative content analysis 量化內容分析 == S == * [https://en.wikipedia.org/wiki/Semantics Semantics]; [https://zh.wikipedia.org/zh-tw/%E8%AF%AD%E4%B9%89%E5%AD%A6 語義學]、語意學; 语义学。「語意學就是專門研究『語言意義』(meaning of Language) 的一門學問;屬於語言學 (Linguistics) 的一部分。」(來源: 國家教育研究院雙語詞彙 [http://terms.naer.edu.tw/detail/1313389/ Semantics - 語意學]) * [https://en.wikipedia.org/wiki/Semantic_analysis_(machine_learning) semantic analysis]; [https://zh.wikipedia.org/zh-tw/%E8%AA%9E%E6%84%8F%E5%88%86%E6%9E%90 語意分析]; 语意分析、语义分析;「將一長串的文字或內容,從其中分析出該個段落的摘要以及大意,甚至更進一步,將整篇文章的文意整理出來。」(來源: 维基百科 [https://zh.wikipedia.org/zh-tw/%E8%AA%9E%E6%84%8F%E5%88%86%E6%9E%90 語意分析]) == T == * [https://en.wikipedia.org/wiki/Telicity Telicity] (動詞的終結點): ** (1) telic: 有事件或狀態的終結點 (endpoint) 的動詞,例如「約翰蓋了一間房子」 ** (2) atelic: 沒有終結點的動詞,例如「約翰蓋房子蓋了一個月」。參考資料:[https://en.wikipedia.org/wiki/Telicity 維基百科]、[https://blog.droidtown.co/post/189716361582/telicity 中文文法:telicity 這動作有停下來的一天嗎? - Droidtown.co] * Temperature 溫度:「溫度是自然語言處理模型中的參數,用於增加或減少模型對其最可能的反應的『信心』。較高的溫度使模型更有『創造性』,這在生成文章等方面可能很有用。較低的溫度使模型更加『自信』,這在回答問題等應用中很有用。」<ref>[https://lukesalamone.github.io/posts/what-is-temperature/ What is Temperature in NLP?🐭 :: Luke Salamone's Blog]</ref> ([https://news.ycombinator.com/item?id=35131112 comments]) * [https://en.wikipedia.org/wiki/Text_mining Text mining] ([https://zh.wikipedia.org/wiki/%E6%96%87%E6%9C%AC%E6%8C%96%E6%8E%98 文本挖掘]、文字探勘、文本挖掘) 「從文本處理過程中取得高質量的訊息」 (來源: [https://zh.wikipedia.org/wiki/%E6%96%87%E6%9C%AC%E6%8C%96%E6%8E%98 維基百科]) * [https://en.wikipedia.org/wiki/Text_segmentation Text segmentation], Segmentation of words 斷詞。相關工具:[[Text segmentation tools | 中文斷詞工具]] == W == * [https://en.wikipedia.org/wiki/Word-sense_disambiguation Word-sense disambiguation]; [https://zh.wikipedia.org/zh-tw/%E8%AF%8D%E4%B9%89%E6%B6%88%E6%AD%A7 詞義消歧]; 词义消歧。一詞多義 == 延伸閱讀 == # [https://zh.wikipedia.org/zh-tw/Category:%E8%AE%A1%E7%AE%97%E8%AF%AD%E8%A8%80%E5%AD%A6 分類:計算語言學 - 維基百科,自由的百科全書] 或 [https://en.wikipedia.org/wiki/Category:Computational_linguistics Category:Computational linguistics - Wikipedia] # [https://en.wikipedia.org/wiki/Category:Natural_language_processing Category:Natural language processing - Wikipedia] # [https://blog.hlb.im/generative-ai-openai-%E8%A9%9E%E5%BD%99%E5%B0%8D%E7%85%A7%E8%A1%A8-591d2a1f1612 Generative AI / OpenAI 詞彙對照表. 本篇文章提供 Generative AI 領域常用的詞彙對照表,內容翻譯自… | by Liang-Bin Hsueh aka hlb | Medium] == 參考資料 == <references/> [[Category:NLP]] [[Category:Glossary]] [[Category:Data Science]]
Summary:
Please note that all contributions to LemonWiki共筆 are considered to be released under the Creative Commons Attribution-NonCommercial-ShareAlike (see
LemonWiki:Copyrights
for details). If you do not want your writing to be edited mercilessly and redistributed at will, then do not submit it here.
You are also promising us that you wrote this yourself, or copied it from a public domain or similar free resource.
Do not submit copyrighted work without permission!
Cancel
Editing help
(opens in new window)
Template used on this page:
Template:Draft
(
edit
)
Navigation menu
Personal tools
Not logged in
Talk
Contributions
Log in
Namespaces
Page
Discussion
English
Views
Read
Edit
View history
More
Search
Navigation
Main page
Current events
Recent changes
Random page
Help
Categories
Tools
What links here
Related changes
Special pages
Page information