Extract url from text: Difference between revisions

Extract url from text (edit)

Revision as of 15:22, 28 March 2025

1,131 bytes removed , 28 March 2025

no edit summary

Planetoid

Bureaucrats, Administrators

15,049

edits

@@ Line 122: / Line 122: @@
 * 啟動下載任務
-== 資料驗證用  ==
+== 資料驗證用：文章內容是否包含網址 ==
-=== 文章內容是否包含網址 ===
 使用 Google 試算表 [https://support.google.com/docs/answer/3098292?hl=zh-Hant REGEXMATCH] 函數，符合正規表示法的規則的話，回傳 TRUE。若不符合，則回傳 FALSE。
 <pre>
@@ Line 148: / Line 147: @@
 FALSE
 </pre>
-=== 文章內容是否包含網域 ===
-原始資料包含網域，但是網域前面不包含 http e.g. tw.news.yahoo.com 或 www.bbc.co.uk。使用 Google 試算表 [https://support.google.com/docs/answer/3098292?hl=zh-Hant REGEXMATCH] 函數，符合正規表示法的規則的話，回傳 TRUE。若不符合，則回傳 FALSE。 {{exclaim}} 以下語法未處理 [https://zh.wikipedia.org/wiki/IPv4 IPv4] 形式的網域。(如果網域前面包含 http ，則可直接搜尋關鍵字: regular expression extract host )
-<pre>
-=IF(ISERROR(REGEXMATCH(A1, "([a-zA-Z0-9\-_\\._~\:\/\?#\[\]@\!\$&'\(\)\*\+,;\=%]+\.[a-zA-Z]{2,}$|\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})")), FALSE, REGEXMATCH(A1, "([a-zA-Z0-9\-_\\._~\:\/\?#\[\]@\!\$&'\(\)\*\+,;\=%]+\.[a-zA-Z]{2,}$|\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})"))
-</pre>
-輸入1:
-<pre>
-www.bbc.co.uk
-</pre>
-輸出1:
-<pre>
-TRUE
-</pre>
-輸入2:
-<pre>
-.0.0.0
-</pre>
-輸出2:
-<pre>
-TRUE
-</pre>
-輸入3:
-<pre>
-Yahoo! 新聞
-</pre>
-輸出3:
-<pre>
-FALSE
-</pre>
-不建議的其他方法:
-* 檢查網域結尾是否是 .com, .tw, .net, .org 因為太多要列舉，該方法沒有效率。
 == References ==

Extract url from text: Difference between revisions

Extract url from text (edit)

Revision as of 15:22, 28 March 2025

Navigation menu

Search