Data Science Glossary: Difference between revisions

From LemonWiki共筆
Jump to navigation Jump to search
Line 46: Line 46:
** (1) telic: 有事件或狀態的終結點 (endpoint) 的動詞,例如「約翰蓋了一間房子」
** (1) telic: 有事件或狀態的終結點 (endpoint) 的動詞,例如「約翰蓋了一間房子」
** (2) atelic: 沒有終結點的動詞,例如「約翰蓋房子蓋了一個月」。參考資料:[https://en.wikipedia.org/wiki/Telicity 維基百科]、[https://blog.droidtown.co/post/189716361582/telicity 中文文法:telicity 這動作有停下來的一天嗎? - Droidtown.co]  
** (2) atelic: 沒有終結點的動詞,例如「約翰蓋房子蓋了一個月」。參考資料:[https://en.wikipedia.org/wiki/Telicity 維基百科]、[https://blog.droidtown.co/post/189716361582/telicity 中文文法:telicity 這動作有停下來的一天嗎? - Droidtown.co]  
* Temperature 溫度:「溫度是自然語言處理模型中的參數,用於增加或減少模型對其最可能的反應的『信心』。較高的溫度使模型更有『創造性』,這在生成文章等方面可能很有用。較低的溫度使模型更加『自信』,這在回答問題等應用中很有用。」<ref>[https://lukesalamone.github.io/posts/what-is-temperature/ What is Temperature in NLP?🐭 :: Luke Salamone's Blog]</ref>
* [https://en.wikipedia.org/wiki/Text_mining Text mining] ([https://zh.wikipedia.org/wiki/%E6%96%87%E6%9C%AC%E6%8C%96%E6%8E%98 文本挖掘]、文字探勘、文本挖掘) 「從文本處理過程中取得高質量的訊息」 (來源: [https://zh.wikipedia.org/wiki/%E6%96%87%E6%9C%AC%E6%8C%96%E6%8E%98 維基百科])
* [https://en.wikipedia.org/wiki/Text_mining Text mining] ([https://zh.wikipedia.org/wiki/%E6%96%87%E6%9C%AC%E6%8C%96%E6%8E%98 文本挖掘]、文字探勘、文本挖掘) 「從文本處理過程中取得高質量的訊息」 (來源: [https://zh.wikipedia.org/wiki/%E6%96%87%E6%9C%AC%E6%8C%96%E6%8E%98 維基百科])
* [https://en.wikipedia.org/wiki/Text_segmentation Text segmentation], Segmentation of words 斷詞。相關工具:[[Text segmentation tools | 中文斷詞工具]]
* [https://en.wikipedia.org/wiki/Text_segmentation Text segmentation], Segmentation of words 斷詞。相關工具:[[Text segmentation tools | 中文斷詞工具]]



Revision as of 15:47, 13 March 2023

自然語言處理(Natural Language Processing, NLP)相關詞彙


icon_scale_pencil.png This article "Data Science Glossary" is still being written. If there are any incomplete parts, you are welcome to directly edit them. 這篇文章「Data Science Glossary」內容還在撰寫中,如果有不完整的部分,歡迎你直接動手修改


C

D

E

  • EMNLP (Empirical Methods in Natural Language Processing) is a "leading conference in the area of natural language processing and artificial intelligence."[1] 「自然語言處理實務研討會」,研討會網站 EMNLP 2021

I

L

  • Lexicology; 詞彙學; 词汇学;
  • Lexical Semantics; 詞彙語義、詞彙語義學、詞匯語義學[2]; 词汇语义、词汇语义学 "Lexical Semantics is about the meaning of words." (來源: D. A. Cruse, 1986)[3]
  • Linguistic Science; 語言科學、語言學、语言科学。「對於語言系統的科學研究,主要在研究人類語言系統的本質、結構、單位及變遷等。」(來源: 國家教育研究院雙語詞彙 語言科學)

N

O

P

  • POS (part-of-speech) 詞性。:圖書館學與資訊科學大辭典:「字詞(word)是語言系統中具有獨立語意或扮演特定語法功能,且可以自由使用的最小語言單位。依據字詞在句法結構或語言形態上扮演的角色,經由詞性分類賦予語句中每個字詞適當之詞性符號或標記的過程,則稱為詞性標記(part-of-speech tagging,或稱POS tagging)。」

Q

  • Quantitative content analysis 量化內容分析

S

  • Semantics; 語義學、語意學; 语义学。「語意學就是專門研究『語言意義』(meaning of Language) 的一門學問;屬於語言學 (Linguistics) 的一部分。」(來源: 國家教育研究院雙語詞彙 Semantics - 語意學)
  • semantic analysis; 語意分析; 语意分析、语义分析;「將一長串的文字或內容,從其中分析出該個段落的摘要以及大意,甚至更進一步,將整篇文章的文意整理出來。」(來源: 维基百科 語意分析)

T

  • Temperature 溫度:「溫度是自然語言處理模型中的參數,用於增加或減少模型對其最可能的反應的『信心』。較高的溫度使模型更有『創造性』,這在生成文章等方面可能很有用。較低的溫度使模型更加『自信』,這在回答問題等應用中很有用。」[4]

W


延伸閱讀

  1. 分類:計算語言學 - 維基百科,自由的百科全書Category:Computational linguistics - Wikipedia
  2. Category:Natural language processing - Wikipedia

參考資料