Data science glossary

From LemonWiki共筆
Revision as of 11:41, 29 June 2019 by Planetoid (talk | contribs) (→‎D)
Jump to navigation Jump to search

資料科學相關詞彙


icon_scale_pencil.png 這篇文章「Data science glossary」內容還在撰寫中,如果有不完整的部分,歡迎你直接動手修改


D

  • data [繁] 資料 [簡] 数据。「指未經過處理的原始記錄。」(資料來源: 維基百科)
  • Data extraction [繁] 資料萃取、資料提取[1] [簡] 数据提取、数据抽取。「從資料來源萃取資料的流程,通常資料來源是非結構化資料。以利進一步資料處理或資料儲存。[2]」。相關詞彙: Extract, transform, load (ETL)
  • Data ingestion [繁] 資料擷取 [簡] 数据获取、数据摄取、数据接入。「將不同來源的資料,集中放置或匯入到同一目的地的流程[3][4]」。
  • Data transformation [繁] 資料轉換、資料變換[5] [簡] 数据转换。「將資料轉換成不同的格式或結構的流程。資料轉換是 資料整合資料管理 的基礎,其任務包含了資料整理 (data wrangling)、資料倉儲 (Data warehouse) 等。[6]」依據資料分析目的,「將原始資料轉換成乾淨的、檢核過的、可以使用的格式。 (cleansed, validated, and ready-to-use form) [7]

E

K

  • Knowledge discovery in databases (KDD) [繁] 資料庫的知識探索 [簡] 数据库的知识发现。KDD 處理程序包含「data preparation, data selection, data cleaning, incorporation of appropriate prior knowledge, and proper interpretation of the results of mining, are essential to ensure that useful knowledge is derived from the data. 」從原始資料中萃取有價值的知識。(Fayyad, Piatetsky-Shapiro, and Smyth 1996[9])

M

P

  • pattern [繁] 樣式 [簡] 模式。「從資料中找出隱藏的規則性或因果關係,即尋找樣式」(資料來源: 陳允傑, 2018[10])

Q

S

T

參考資料