Extract url from text: Difference between revisions

Jump to navigation Jump to search
no edit summary
No edit summary
Line 40: Line 40:




== 擷取特定檔案類型的網址 ==
以下語法適用於 [https://www.sublimetext.com/ Sublime Tex]
步驟1: 擷取該網頁的全部網址
* {{Chrome}} 瀏覽器安裝 [https://chrome.google.com/webstore/detail/getthemall-video-download/nbkekaeindpfpcoldfckljplboolgkfm GetThemAll Video Downloader] 擴充套件
* 安裝後,點選工具列上的 GetThemAll Video Downloader 按鈕
* 點選「save link in txt」
* 儲存網址清單為純文字檔
步驟2: 刪除不包含不包含檔案類型的行,下例是檔案類型 ttf
* 用 Sublime Tex 開啟網址清單
<pre>
Frequently Asked Questions http://www.clearchinese.com/faq.htm
Contact Us http://www.clearchinese.com/contact.php
HDZB_5 http://www.clearchinese.com/images/fonts/HDZB_5.TTF
HDZB_6 http://www.clearchinese.com/images/fonts/HDZB_6.TTF
</pre>
* 選單 Find --> Replace
* 啟用 Regular expression
* Find What: {{kbd | key= <nowiki>^((?!\.ttf).)*$</nowiki>}}
* Replace with: (不需要輸入任何文字)
步驟3: 刪除不包含不包含檔案類型的行
* 選單 Find --> Replace
* 啟用 Regular expression
* Find What: {{kbd | key= <nowiki>^[\s\t]*$\n</nowiki>}}
* Replace with: (不需要輸入任何文字)
步驟4: 只留下網址部分,刪除該行最前面的文字
* 選單 Find --> Replace
* 啟用 Regular expression
* Find What: {{kbd | key= <nowiki>.*(http[s]?://[a-zA-Z0-9\-_\\._~\:\/\?#\[\]@\!\$&'\(\)\*\+,;\=%]+)(\.ttf$)</nowiki>}}
* Replace with: {{kbd | key= <nowiki>\1\2</nowiki>}}
* 儲存網址清單
步驟5: 下載檔案
* 安裝與執行 [http://www.orbitdownloader.com/ Orbit Downloader]
* 選單: 檔案 --> 匯入下載清單 --> 選擇網址清單
* 啟動下載任務


== 資料驗證用  ==
== 資料驗證用  ==

Navigation menu