網頁備份: Difference between revisions
Tags: Mobile edit Mobile web edit |
(→比較不同社群網站的文章備份結果: remove Diigo part) |
||
| (29 intermediate revisions by the same user not shown) | |||
| Line 1: | Line 1: | ||
網頁歸檔備份的工具比較。比較指標 (1)「內嵌連結的文字可以點選」、(2) 「保留存檔日期」、「保留原始網址」等基礎資訊是否保留、(3)以及資訊組織方式,例如透過標籤重新組織備份的網頁。 | |||
# 免費服務: 推薦 [http://archive.is/ Archive.is] 可以同時儲存網頁內嵌的圖,如果原始網頁遺失,還能保留完整資訊。其次則是 [https://archive.org/web/ Internet Archive: Wayback Machine] | {{LanguageSwitcher | content = [[Archive of webpage | EN]], [[網頁備份 | 漢字]] }} | ||
# 付費服務: 推薦 桌機版 [http://www.evernote.com/ Evernote],因為即使是需要登入帳號密碼的網頁,也可以順利擷取。如果單純備份公開網頁的書籤服務,則可以選擇 | |||
{{Tips}} | |||
# 免費服務: 推薦 [http://archive.is/ Archive.is] 可以同時儲存網頁內嵌的圖,如果原始網頁遺失,還能保留完整資訊。其次則是 [https://archive.org/web/ Internet Archive: Wayback Machine] 可查看不同時間的網頁版本存檔。 | |||
# 付費服務: 推薦 桌機版 [http://www.evernote.com/ Evernote],因為即使是需要登入帳號密碼的網頁,也可以順利擷取。如果單純備份公開網頁的書籤服務,則可以選擇 [https://app.raindrop.io/ Raindrop] 或 [http://pinboard.in/ Pinboard] ,加入書籤網址之後,則會'''自動'''擷取網頁內文與內嵌的圖。 | |||
== 比較說明 == | == 比較說明 == | ||
| Line 13: | Line 15: | ||
* 行動性:現有可以完整封裝成單一檔案的方案,都未額外內嵌「保留存檔日期」或者會漏失一些資訊。 | * 行動性:現有可以完整封裝成單一檔案的方案,都未額外內嵌「保留存檔日期」或者會漏失一些資訊。 | ||
== 需「維持網路連線」瀏覽網頁存檔的方案== | == 需「維持網路連線」瀏覽網頁存檔的方案== | ||
| Line 92: | Line 21: | ||
書籤網站或線上備份網頁的服務列表與比較 | 書籤網站或線上備份網頁的服務列表與比較 | ||
==== A: Archive.is ==== | |||
{{Gd}} [http://archive.is/ Archive.is - webpage capture] {{access | date = 2017-11-18}} | {{Gd}} [http://archive.is/ Archive.is - webpage capture] {{access | date = 2017-11-18}} | ||
* 檔案類型: 網頁 (例: [http://archive.is/B0qhH 維基百科的備份])、網頁樣式 {{Gd}} | * 檔案類型: 網頁 (例: [http://archive.is/B0qhH 維基百科的備份])、網頁樣式 {{Gd}} | ||
| Line 106: | Line 36: | ||
* 備註: (1) PTT 可能會備份失敗[https://archive.is/www.ptt.cc],備份到電腦網路內容分級的畫面 ([https://archive.is/ODmrW#selection-23.3-23.11 ex])。 (2) 如果是需要捲動網頁,才能看到的圖,備份的網頁可以順利顯示圖 [https://archive.is/R7oe4/4b913063476a2a08ad41243f3052f39edf3be731] | * 備註: (1) PTT 可能會備份失敗[https://archive.is/www.ptt.cc],備份到電腦網路內容分級的畫面 ([https://archive.is/ODmrW#selection-23.3-23.11 ex])。 (2) 如果是需要捲動網頁,才能看到的圖,備份的網頁可以順利顯示圖 [https://archive.is/R7oe4/4b913063476a2a08ad41243f3052f39edf3be731] | ||
==== D: Diigo ==== | |||
* 檔案類型: | [http://www.diigo.com/index Diigo] ''$''<ref>[http://help.diigo.com/premium-features/Cached-page Cached pages - Diigo help]</ref> {{access | date = 2017-11-18}} | ||
* 備份網頁原內嵌的圖: | * 檔案類型: 網頁、圖、PDF | ||
* 備份網頁原內嵌的圖: 備份網頁時,預設不會儲存圖檔,需要手動逐張儲存圖片至Diigo | |||
* 備份線上 PDF: 可 | |||
* 延緩載入的圖片 (lazy load images) : 可,圖片順利儲存 | |||
* 內嵌連結的文字可以點選: 可 | |||
* 保留存檔日期: 有 | * 保留存檔日期: 有 | ||
* 保留原始網址: 有 | * 保留原始網址: 有 | ||
* 備份需登入帳號的網頁: 不可 | |||
* 可瀏覽別人的備份: ''$'' 不可,並保留不同時間儲存的備份 {{Gd}} | |||
* [[Robots.txt]] 規則: 忽略 | |||
* 資料組織與利用: 加標籤(tags) /可加註解 <br />搜尋範圍: 網頁標題、標籤、註解、網頁網址、網域、快取的網頁內文。 | |||
==== E: Evernote ==== | |||
桌機版 [http://www.evernote.com/ Evernote] ''$'' {{access | date = 2018-12-06}} | |||
* 檔案類型: 網頁、PDF | |||
* 備份網頁原內嵌的圖: 圖會額外儲存一份。離線時,APP、桌面軟體仍可以讀取網頁圖片。 {{exclaim}}擷取的網頁版面,可能會跟原始網頁不同。 | |||
* 備份線上 PDF: 可 | |||
[http://www. | |||
* 檔案類型: | |||
* 備份網頁原內嵌的圖: | |||
* 備份線上 PDF: | |||
* 延緩載入的圖片 (lazy load images) : 可,圖片順利儲存 | * 延緩載入的圖片 (lazy load images) : 可,圖片順利儲存 | ||
* 內嵌連結的文字可以點選: 可 | * 內嵌連結的文字可以點選: 可 | ||
* 保留存檔日期: | * 保留存檔日期: 可。 查看方式: 檢視儲存的筆記: View note info --> Created (time) | ||
* 保留原始網址: | * 保留原始網址: 可。 查看方式: 檢視儲存的筆記: View note info --> URL | ||
* 備份需登入帳號的網頁: | * 備份需登入帳號的網頁: 桌機版可 {{Gd}}、手機版不可 | ||
* 可瀏覽別人的備份: | * 可瀏覽別人的備份: 部分可 (需別人授權) | ||
* [[Robots.txt]] 規則: | * [[Robots.txt]] 規則: 忽略 | ||
* 資料組織與利用: | * 資料組織與利用: (1) 搜尋內文、圖內文字(''$'') (2) 加標籤(tags) /可加註解 (3) 安裝桌面端軟體便可離線 (4) 複合書籤搜尋: 有。例如: 輸入 {{kbd | key=<nowiki>tag:TAG1 tag:TAG2 keywords</nowiki>}} 搜尋同時標籤 ''TAG1'' 和 ''TAG2'' ,並且包含關鍵字 ''keywords'' 的記事內容。 | ||
[ | ==== H: historio ==== | ||
[https://historio.us/ historio] {{access | date = 2020-10-18}} | |||
* 檔案類型: 網頁 | * 檔案類型: 網頁 | ||
* | * 備份網頁原內嵌的圖: 否 {{exclaim}} 圖使用原網站的圖檔 | ||
* 備份線上 PDF: | * 備份線上 PDF: 否,無法備份線上 PDF | ||
* 延緩載入的圖片 (lazy load images): | |||
* 延緩載入的圖片 (lazy load images) : | |||
* 內嵌連結的文字可以點選: 可 | * 內嵌連結的文字可以點選: 可 | ||
* 保留存檔日期: 可 | * 保留存檔日期: 可 | ||
* 保留原始網址: 可 | * 保留原始網址: 可 | ||
* 備份需登入帳號的網頁: | * 備份需登入帳號的網頁: | ||
* 可瀏覽別人的備份: | * 可瀏覽別人的備份: 可,需要先 publish | ||
* | * [[Robots.txt]] 規則: | ||
* | * 資料組織與利用: | ||
* API: | |||
==== I: Instapaper ==== | |||
[https://www.instapaper.com/ Instapaper] {{access | date = 2017-11-18}} | [https://www.instapaper.com/ Instapaper] {{access | date = 2017-11-18}} | ||
* 檔案類型: 網頁 | * 檔案類型: 網頁 | ||
| Line 181: | Line 94: | ||
* 資料組織與利用: | * 資料組織與利用: | ||
==== M: megalodon ==== | |||
[http://megalodon.jp/ ウェブ魚拓] (megalodon) {{access | date = 2017-11-18}} | |||
* 檔案類型: 網頁 | |||
* 備份網頁原內嵌的圖: 可。保存了圖片、網頁樣式 | |||
* 備份線上 PDF: | |||
* 延緩載入的圖片 (lazy load images) : 可,圖片順利儲存 | |||
* 內嵌連結的文字可以點選: 可 | |||
* 保留存檔日期: 可 | |||
* 保留原始網址: 可 | |||
* 備份需登入帳號的網頁: | |||
* 可瀏覽別人的備份: 可 | |||
* [[Robots.txt]] 規則: | |||
* 資料組織與利用: 可搜尋網址的備份,查詢語法 <nowiki>http://megalodon.jp/?url=網址</nowiki> e.g. [http://megalodon.jp/?url=http%3A%2F%2Ftw.yahoo.com] | |||
==== N: Notion ==== | |||
[https://www.notion.so/ notion.so]: [https://chrome.google.com/webstore/detail/notion-web-clipper/knheggckgoiihginacbkhaalnibhilkk Notion Web Clipper - Chrome 線上應用程式商店] {{chrome}} {{access | date = 2019-11-05}} | [https://www.notion.so/ notion.so]: [https://chrome.google.com/webstore/detail/notion-web-clipper/knheggckgoiihginacbkhaalnibhilkk Notion Web Clipper - Chrome 線上應用程式商店] {{chrome}} {{access | date = 2019-11-05}} | ||
* 檔案類型: 網頁、PDF | * 檔案類型: 網頁、PDF | ||
| Line 192: | Line 122: | ||
* 可瀏覽別人的備份: 部分可 (需別人授權) | * 可瀏覽別人的備份: 部分可 (需別人授權) | ||
* [[Robots.txt]] 規則: | * [[Robots.txt]] 規則: | ||
* 資料組織與利用: | * 資料組織與利用: | ||
==== O: OneNote ==== | |||
[https://onedrive.live.com/ Microsoft OneNote Online] {{access | date = 2018-09-15}} | |||
* 檔案類型: | * 檔案類型: 網頁、圖、PDF 都可 | ||
* 備份網頁原內嵌的圖: | * 備份網頁原內嵌的圖: 可 | ||
* 備份線上 PDF: | * 備份線上 PDF: | ||
* 延緩載入的圖片 (lazy load images) : | * 延緩載入的圖片 (lazy load images): | ||
* 內嵌連結的文字可以點選: 可 | * 內嵌連結的文字可以點選: 可 | ||
* 保留存檔日期: | * 保留存檔日期: 可 | ||
* 保留原始網址: | * 保留原始網址: 否 {{exclaim}} | ||
* 備份需登入帳號的網頁: | * 備份需登入帳號的網頁: 否 | ||
* 可瀏覽別人的備份: | * 可瀏覽別人的備份: 否 | ||
* [[Robots.txt]] 規則: 忽略 | * [[Robots.txt]] 規則: 忽略 | ||
* 資料組織與利用: | * 資料組織與利用: 筆記本、節 | ||
==== P: Pinboard, Perma, Pocket ==== | |||
[http://pinboard.in/ Pinboard] ''$'' {{access | date = 2017-11-18}} | [http://pinboard.in/ Pinboard] ''$'' {{access | date = 2017-11-18}} | ||
* 檔案類型: 網頁 | * 檔案類型: 網頁 | ||
| Line 235: | Line 155: | ||
* 資料組織與利用: 標籤; 搜尋範圍: 網頁標題、標籤、註解、快取的網頁內文、[http://pinboard.in/url 網頁網址](bug)。 [[Image:Icon exclaim.gif| ]]不包含網頁網址。 | * 資料組織與利用: 標籤; 搜尋範圍: 網頁標題、標籤、註解、快取的網頁內文、[http://pinboard.in/url 網頁網址](bug)。 [[Image:Icon exclaim.gif| ]]不包含網頁網址。 | ||
[ | [https://perma.cc/ Perma.cc] ([https://perma.cc/BM2W-X62C example]) {{access | date = 2020-10-18}} | ||
* 檔案類型: | * 檔案類型: 網頁、圖、PDF | ||
* 備份網頁原內嵌的圖: | * 備份網頁原內嵌的圖: 可 | ||
* 備份線上 PDF: | * 備份線上 PDF: 可 | ||
* 延緩載入的圖片 (lazy load images) : | * 延緩載入的圖片 (lazy load images): 可 | ||
* 內嵌連結的文字可以點選: 可 | * 內嵌連結的文字可以點選: 可 | ||
* 保留存檔日期: 可 | * 保留存檔日期: 可 | ||
| Line 246: | Line 166: | ||
* 可瀏覽別人的備份: 可 | * 可瀏覽別人的備份: 可 | ||
* [[Robots.txt]] 規則: | * [[Robots.txt]] 規則: | ||
* 資料組織與利用: | * 資料組織與利用: | ||
* API: 有 [https://perma.cc/docs/developer Perma.cc | Developer Docs] | |||
[http:// | [http://getpocket.com Pocket] {{access | date = 2017-11-18}} | ||
* 檔案類型: 網頁 | * 檔案類型: 網頁 | ||
* | * 網頁原內嵌的媒體(圖, flash等): 圖會額外儲存一份。離線時,APP仍可以讀取網頁圖片。 {{exclaim}} 擷取的網頁版面,可能會跟原始網頁不同。{{exclaim}} 付費會員才會有永久備份 | ||
* 備份線上 PDF: | * 備份線上 PDF: | ||
* 延緩載入的圖片 (lazy load images): | * 延緩載入的圖片 (lazy load images) : 圖片沒有儲存 {{exclaim}} | ||
* 內嵌連結的文字可以點選: 可 | * 內嵌連結的文字可以點選: 可 | ||
* 保留存檔日期: | * 保留存檔日期: 有 | ||
* 保留原始網址: | * 保留原始網址: 有 | ||
* 可瀏覽別人的備份: 否。發現 ptt 的文章雖然已經移除,但是加到 Pocket 後,還可以順利看到網頁,所以可能是不同使用者共用同一份網頁備份。 | |||
* 可瀏覽別人的備份: | * [[Robots.txt]] 規則: 忽略 | ||
* [[Robots.txt]] 規則: | * 匯出:匯出功能不包含網頁文字<ref>[https://support.mozilla.org/en-US/kb/exporting-your-pocket-list Exporting your Pocket saves | Pocket Help]</ref>,需要手動將逐一個別網頁另存檔案。 | ||
* 資料組織與利用: | * 資料組織與利用: (1)可以下 tag ,但是不建議在這個服務作組織分類,單純作為未讀文章列表的用途 (2)搜尋標題或網址、網域 (3) 複合書籤搜尋: [http://help.getpocket.com/customer/portal/articles/1564293-pocket-premium-full-text-search 有]''$'' | ||
==== R: Raindrop ==== | |||
[https://raindrop.io/ Raindrop.io] ''$'' 同時提供免費和付費方案,網頁備份是付費方案才有。{{access | date = 2025-02-04}} | |||
* 檔案類型:網頁、PDF、圖片、影片等。 | |||
* 備份網頁原內嵌的圖:可。付費方案的 Raindrop.io 會自動保存網頁的永久副本,包括內嵌圖片,即使原始網頁被刪除,仍可存取。<ref>[https://help.raindrop.io/permanent-copy Permanent copy ― Raindrop.io Help]</ref> | |||
* 備份線上 PDF:可。Raindrop.io 支援保存線上 PDF,並提供全文搜尋功能。 | |||
* 延緩載入的圖片 (lazy load images): | |||
* 備份需登入帳號的網頁:不可。Raindrop.io 無法保存需要登入才能訪問的網頁內容。 | |||
* 內嵌連結的文字可以點選:可。保存的網頁保留了內嵌連結,使用者可直接點選。 | |||
* 保留存檔日期:可。Raindrop.io 會記錄每個書籤的保存日期。 | |||
* 保留原始網址:可。每個書籤都保留了原始網址,方便未來訪問。 | |||
* 可瀏覽別人的備份:可。使用者可以將收藏夾設為公開,與他人分享,或進行協作。 | |||
* Robots.txt 規則: | |||
* 資料組織與利用:Raindrop.io 提供標籤和收藏夾功能,方便分類和組織書籤。搜尋範圍包括網頁標題、標籤、註解,以及保存的網頁全文內容。 | |||
[https:// | ==== W: Wayback Machine ==== | ||
* 檔案類型: | [https://archive.org/web/ Internet Archive: Wayback Machine] {{access | date = 2017-11-18}} | ||
* 備份網頁原內嵌的圖: | * 檔案類型: 網頁、部分網頁樣式,導致版面可能跟原本的不同 | ||
* 備份網頁原內嵌的圖: 否 | |||
* 備份線上 PDF: | * 備份線上 PDF: | ||
* 延緩載入的圖片 (lazy load images): | * 延緩載入的圖片 (lazy load images) : 部分圖片沒有儲存 {{exclaim}} | ||
* 內嵌連結的文字可以點選: 可 | * 內嵌連結的文字可以點選: 可 | ||
* 保留存檔日期: 可 | * 保留存檔日期: 可 | ||
* 保留原始網址: | * 保留原始網址: 可 | ||
* 備份需登入帳號的網頁: 否 | * 備份需登入帳號的網頁: 否 | ||
* 可瀏覽別人的備份: | * 可瀏覽別人的備份: 可 | ||
* [[ | * 資料組織與利用: 可搜尋網址、不可搜尋網域對應的網頁。 | ||
* 備註: PTT 可能會備份失敗,備份到電腦網路內容分級的畫面 | |||
Bookmarklets for Internet Archive's Wayback Machine: | |||
1. View all snapshots of the current webpage:<ref>[https://zh.wikipedia.org/wiki/Wikipedia:%E4%BD%BF%E7%94%A8%E6%97%B6%E5%85%89%E6%9C%BA 維基百科:使用時光機 - 維基百科,自由的百科全書]</ref> <ref>[https://gist.github.com/n-st/0dd03b2323e7f9acd98e Bookmarklet to view current page on the Internet Archive Wayback Machine (https://archive.org/)]</ref> | |||
<pre>javascript:location.href=%22http://web.archive.org/web/*/%22+location.href; | |||
</pre> | |||
or | |||
<pre> | |||
javascript:void(window.open('https://web.archive.org/web/*/'+location.href)); | |||
</pre> | |||
2. View the latest snapshot of the current webpage:<ref>[https://errerrors.blogspot.com/2024/09/quick-view-wayback-machine-page.html 快速看網路時光機器庫存頁面的瀏覽器按鈕 (bookmarklet)]</ref> | |||
<pre>javascript:void(window.open('https://web.archive.org/web/2if_/'+location.href)); | |||
</pre> | |||
Alternative version (includes a top navigation bar to browse other revisions): | |||
<pre>javascript:void(window.open('https://web.archive.org/web/2/'+location.href)); | |||
</pre> | |||
[ | ''服務暫停'' [http://www.webcitation.org/index WebCite] {{access | date = 2017-11-18}} | ||
* 檔案類型: | * 檔案類型: 網頁 (例: [http://www.webcitation.org/64fUtAo8R 維基百科的備份]) | ||
* | * 備份線上 PDF: | ||
* | * 備份網頁原內嵌的圖: ''無'', 使用原媒體的網址 | ||
* 延緩載入的圖片 (lazy load images): | * 延緩載入的圖片 (lazy load images) : | ||
* 內嵌連結的文字可以點選: 可 | * 內嵌連結的文字可以點選: 可 | ||
* 保留存檔日期: | * 保留存檔日期: 有 | ||
* 保留原始網址: | * 保留原始網址: 有, 可瀏覽不同時間的備份 | ||
* 備份需登入帳號的網頁: | * 備份需登入帳號的網頁: 不可 | ||
* 可瀏覽別人的備份: 可 | * 可瀏覽別人的備份: 可 | ||
* [[Robots.txt]] 規則: | * [[Robots.txt]] 規則: 遵守 | ||
* 資料組織與利用: | * 資料組織與利用: 可 [http://www.webcitation.org/query 搜尋網址的備份],查詢語法 http://www.webcitation.org/query.php?url=網址 ([http://www.webcitation.org/query.php?url=http://blog.pixnet.net/post/admin/3240566 ex]) The bookmarklet was as follows:<pre>javascript:location.href=%22http://www.webcitation.org/query.php?url=%22+location.href;</pre>;不可搜尋相同網域的備份。 | ||
[http://timetravel.mementoweb.org/ Time Travel] 可一次尋找多個網頁備份服務,例如:Internet Archive, Archive-It, British Library, archive.today {{access | date = 2020-01-26}} | [http://timetravel.mementoweb.org/ Time Travel] 可一次尋找多個網頁備份服務,例如:Internet Archive, Archive-It, British Library, archive.today {{access | date = 2020-01-26}} | ||
| Line 347: | Line 305: | ||
== 比較不同社群網站的文章備份結果 == | == 比較不同社群網站的文章備份結果 == | ||
Medium: | |||
* [https://web.archive.org/ Wayback Machine]:可能備份成功文字而缺少圖片。提供失敗[https://web.archive.org/web/*/https://medium.com/%E5%93%88%E5%98%8D-%E4%B8%96%E7%95%8C/%E9%AB%98%E6%95%88%E5%B7%A5%E7%A8%8B%E5%B8%AB-effective-engineer-%E9%87%8D%E9%BB%9E%E7%AD%86%E8%A8%98-ca66e589653c]與成功[https://web.archive.org/web/20130915000000*/https://policy.medium.com/medium-terms-of-service-9db0094a1e0f]的例子。 | |||
* [https://archive.today/ Webpage archive]:可能成功備份([https://archive.is/3qZZc 連結]),但遇過有文字但因為 Medium 需要「延緩載入的圖片」 (lazy load images) 變成模糊的例子 [https://archive.is/2017.01.29-002950/https://medium.com/@taylorhu/%E5%A5%87-app-%E5%85%B1%E8%B3%9E-%E5%A8%81%E7%A7%80%E5%BD%B1%E5%9F%8E-7d7971c5d421]。 | |||
* [https://perma.cc/ Perma.cc]:成功備份的[https://perma.cc/BM2W-X62C 例子]。 | |||
* [https://historio.us/ historio]:載入備份時有數秒可以看到備份內容,但是似乎跟 CSS 衝突,所以會看到空白。使用mhtml 格式才能閱讀備份。 | |||
PTT: | |||
* [https://web.archive.org/ Wayback Machine]:不同看板的 18+ 政策不同,如果有 18+ 政策,就會導致無法成功備份,而顯示 18+ 警告[https://web.archive.org/web/20240209204000/https://www.ptt.cc/ask/over18?from=%2Fbbs%2FGossiping%2FM.1707508785.A.344.html]。若該看板無 18+ 政策,就可以成功備份[https://web.archive.org/web/20130915000000*/https://www.ptt.cc/bbs/Boy-Girl/M.1378051232.A.3E0.html]。 | |||
* [https://archive.today/ Webpage archive]:成功備份。 | |||
* Perma.cc:因 18+ 警告導致備份失敗。 | |||
* historio:成功備份。 | |||
Facebook: | |||
* [https://web.archive.org/ Wayback Machine]:即使設定為公開,備份結果顯示登入畫面。 | |||
* [https://archive.today/ Webpage archive]:錯誤訊息「Not Found (yet?)」(尚未找到) | |||
* Perma.cc:顯示「You’re Temporarily Blocked」(您暫時被封鎖) 訊息。 | |||
* historio:使用書籤小工具無效,備份不成功。 | |||
Dcard | |||
* [https://web.archive.org/ Wayback Machine]:因[https://zh.wikipedia.org/zh-tw/HTTP_403 HTTP 403錯誤]導致備份失敗。 | |||
* [https://archive.today/ Webpage archive]:備份失敗[https://archive.is/yEJMT] | |||
YouTube | |||
* [https://web.archive.org/ Wayback Machine]: 備份失敗,無法播放影片,也看不到留言 [https://web.archive.org/web/*/https://www.youtube.com/watch?v=W95p-Ag4RMg] | |||
* [https://archive.today/ Webpage archive]: 備份失敗 (1) 無法播放影片,(2) 可能看到留言 [https://archive.is/EY1ZH]、也可能看不到,需要自行確認 | |||
[https://vocus.cc/become_creator 方格子 vocus] | |||
* [https://web.archive.org/ Wayback Machine]:可以備份文章內容,但是圖片因為「延緩載入的圖片」 (lazy load images) 變成模糊的 [https://wayback-api.archive.org/web/20240000000000*/https://vocus.cc/article/65a52de7fd8978000100820c 例子]。 | |||
* [https://archive.today/ Webpage archive]:成功備份。[https://archive.is/eheGP] | |||
== 可「離線」瀏覽網頁存檔的方案 == | |||
{{Gd}} 瀏覽器列印成 PDF | |||
* 檔案格式:PDF 單一檔案 | |||
* 保留存檔日期: yes | |||
* 保留原始網址: yes (列印選項,需要勾選「頁首及頁尾」,才會在頁頭頁尾顯示網頁標題、日期、網址等資訊。) | |||
* 效果: | |||
{{Gd}} [[Mozilla Firefox|Firefox]] + [https://addons.mozilla.org/zh-TW/firefox/addon/webscrapbook/ 網頁剪貼簿] | |||
* 檔案格式:(1) 資料夾、(2) MAFF 封存檔、(3) HTZ 封存檔、(4) 一個網頁檔 | |||
* 內嵌連結的文字可以點選: yes | |||
* 保留存檔日期: yes | |||
* 保留原始網址: yes | |||
{{Gd}} [[Mozilla Firefox|Firefox]] + [https://addons.mozilla.org/zh-TW/firefox/addon/single-file/ SingleFile 擴充套件] | |||
* 檔案格式: 一個網頁檔 | |||
* 內嵌連結的文字可以點選: yes | |||
* 保留存檔日期: yes | |||
* 保留原始網址: yes | |||
[https://pdfonfly.com/html-to-pdf HTML to PDF Conversion - PDFonFly.com] 輸入HTML文字,直接轉換成PDF | |||
* 檔案格式:PDF | |||
* 內嵌連結的文字可以點選: | |||
* 保留存檔日期: | |||
* 保留原始網址: | |||
[https://chrome.google.com/webstore/detail/mhabjpofjblpelkgmllkpcnlhgjpebko?hl=zh-TW# iWeb2x] for {{Chrome}} | |||
* 檔案格式:PDF 或圖片 | |||
* 內嵌連結的文字可以點選: yes | |||
* 保留存檔日期: no | |||
* 保留原始網址: no | |||
[http://www.sciweavers.org/free-online-html-to-pdf iWeb2Print]{{access | date = 2010-03-15 }} 教學:[http://briian.com/?p=7492 iWeb2Print 把你喜歡的網頁文章存成PDF檔] | |||
* 檔案格式: | |||
* 內嵌連結的文字可以點選: yes | |||
* 保留存檔日期: no | |||
* 保留原始網址: no | |||
[https://www.web2pdfconvert.com/ Convert Web Page to PDF for Free Online - #1 Web to PDF Converter] | |||
* | * 檔案格式:PDF | ||
* 保留存檔日期: yes ((檔案 metadata) | |||
* | * 保留原始網址: yes (檔案 metadata) | ||
[https://chrome.google.com/webstore/detail/mhabjpofjblpelkgmllkpcnlhgjpebko?hl=zh-TW# iWeb2x] for {{Chrome}} | |||
* 檔案格式:PDF 或圖片 | |||
* 內嵌連結的文字可以點選: yes | |||
* 保留存檔日期: no | |||
* 保留原始網址: no | |||
[https://www.zotero.org/ Zotero | Your personal research assistant] + [https://www.zotero.org/download/ Zotero Connector] | |||
* | * 檔案格式:網頁 (圖檔遺失) | ||
* | * 內嵌連結的文字可以點選: yes | ||
* | * 保留存檔日期: yes | ||
* | * 保留原始網址: yes | ||
[[Mozilla Firefox|Firefox]] v. 102.0: 另存新檔(網頁,完整封裝) | |||
* 檔案格式:網頁 + 相關圖片 檔案 | |||
* 保留存檔日期: yes | |||
* 保留原始網址: yes (檔案 metadata 內的來源欄位,有紀錄原始網址) | |||
* 效果: 部分圖片可能無法顯示 {{exclaim}} | |||
{{Fx}} v.15 + [https://addons.thunderbird.net/zh-tw/firefox/addon/mozilla-archive-format/?src=search Mozilla Archive Format, with MHT and Faithful Save :: Firefox 附加元件]([http://maf.mozdev.org/ MAF]) 2.x: Save as MAFF MHT Archive | |||
* 檔案格式:mht 單一檔案 | |||
* | * 保留存檔日期: yes | ||
* | * 保留原始網址: yes | ||
* | * 效果: 新版 Firefox v. 102.0 已經不支援該擴充套件 {{exclaim}} | ||
=== 備份網頁畫面圖檔 === | |||
* | * {{Gd}} [https://chrome.google.com/webstore/detail/save-to-google-drive/gmbmikajjgmnabiglmofipeabaddhgne Save to Google Drive] for {{Chrome}} | ||
* | * {{Gd}} [http://pearlcrescent.com/products/pagesaver/ Pearl Crescent Page Saver] for [[MozillaFirefox|Mozilla Firefox]] {{Fx}} | ||
* | * more on [[Screen Capture#網頁快照]] | ||
== 其他同類型服務或軟體 == | == 其他同類型服務或軟體 == | ||
| Line 448: | Line 440: | ||
* [https://blog.starrocket.io/posts/internet-archive-an-universal-access-to-all-knowledge/ 把知識從殿堂中解放出來,Internet Archive 要當人類文明的檔案管理員 | Star Rocket Blog] | * [https://blog.starrocket.io/posts/internet-archive-an-universal-access-to-all-knowledge/ 把知識從殿堂中解放出來,Internet Archive 要當人類文明的檔案管理員 | Star Rocket Blog] | ||
References | == References == | ||
<references/> | <references/> | ||
[[Category:Software]] [[Category:PKM]] [[Category:Backup]] | [[Category:Software]] [[Category:PKM]] [[Category:Backup]] | ||
Latest revision as of 19:04, 3 December 2025
網頁歸檔備份的工具比較。比較指標 (1)「內嵌連結的文字可以點選」、(2) 「保留存檔日期」、「保留原始網址」等基礎資訊是否保留、(3)以及資訊組織方式,例如透過標籤重新組織備份的網頁。
- 免費服務: 推薦 Archive.is 可以同時儲存網頁內嵌的圖,如果原始網頁遺失,還能保留完整資訊。其次則是 Internet Archive: Wayback Machine 可查看不同時間的網頁版本存檔。
- 付費服務: 推薦 桌機版 Evernote,因為即使是需要登入帳號密碼的網頁,也可以順利擷取。如果單純備份公開網頁的書籤服務,則可以選擇 Raindrop 或 Pinboard ,加入書籤網址之後,則會自動擷取網頁內文與內嵌的圖。
比較說明[edit]
- 「內嵌連結的文字可以點選」:這部分對其他軟體/服務多不是問題。但是PDF檔的「直接列印到PDF的虛擬印表機」的產生方式,其內嵌連結的文字是無法點選的,即導致網址資訊會消失。(除非直接寫上網址或購買Adobe Acrobat使用內建的PDFMaker)
- 「保留存檔日期」:由於檔案本身已經內建日期屬性(在檔案的圖示上,按右鍵選「內容」,就可以看到檔案的「建立日期」),但是很容易因為儲存或FTP到不同媒體時,導致存檔日期有所變動,而Firefox + ScrapBook的方案比較好,會將這項屬性資訊額外儲存。
- 「保留存檔日期」與「保留原始網址」:這兩項均與學術論文寫作(書目格式)有關,在論文的參考資料部分,如果有引用到網路資料,必須註明網址以及存取日期。
- 行動性:現有可以完整封裝成單一檔案的方案,都未額外內嵌「保留存檔日期」或者會漏失一些資訊。
需「維持網路連線」瀏覽網頁存檔的方案[edit]
工具列表[edit]
書籤網站或線上備份網頁的服務列表與比較
A: Archive.is[edit]
Archive.is - webpage capture [Last visited: 2017-11-18]
- 檔案類型: 網頁 (例: 維基百科的備份)、網頁樣式

- 備份網頁原內嵌的圖: 可,圖會額外儲存一份。
- 備份線上 PDF:
- 延緩載入的圖片 (lazy load images) : 可,圖片順利儲存
- 內嵌連結的文字可以點選: 可
- 保留存檔日期: 有
- 保留原始網址: 有
- 備份需登入帳號的網頁: 不可
- 可瀏覽別人的備份: 可
- 資料組織與利用: 搜尋特定網址或相同網域的備份: 可 ex: 列出 tw.yahoo.com 網域的網頁備份[1]。查詢語法
javascript:location.href=%22https://archive.is/%22+location.href;
- Robots.txt 規則: 忽略
- 備註: (1) PTT 可能會備份失敗[2],備份到電腦網路內容分級的畫面 (ex)。 (2) 如果是需要捲動網頁,才能看到的圖,備份的網頁可以順利顯示圖 [3]
D: Diigo[edit]
Diigo $[1] [Last visited: 2017-11-18]
- 檔案類型: 網頁、圖、PDF
- 備份網頁原內嵌的圖: 備份網頁時,預設不會儲存圖檔,需要手動逐張儲存圖片至Diigo
- 備份線上 PDF: 可
- 延緩載入的圖片 (lazy load images) : 可,圖片順利儲存
- 內嵌連結的文字可以點選: 可
- 保留存檔日期: 有
- 保留原始網址: 有
- 備份需登入帳號的網頁: 不可
- 可瀏覽別人的備份: $ 不可,並保留不同時間儲存的備份

- Robots.txt 規則: 忽略
- 資料組織與利用: 加標籤(tags) /可加註解
搜尋範圍: 網頁標題、標籤、註解、網頁網址、網域、快取的網頁內文。
E: Evernote[edit]
桌機版 Evernote $ [Last visited: 2018-12-06]
- 檔案類型: 網頁、PDF
- 備份網頁原內嵌的圖: 圖會額外儲存一份。離線時,APP、桌面軟體仍可以讀取網頁圖片。 https://www.planetoid.info/images/Icon_exclaim.gif擷取的網頁版面,可能會跟原始網頁不同。
- 備份線上 PDF: 可
- 延緩載入的圖片 (lazy load images) : 可,圖片順利儲存
- 內嵌連結的文字可以點選: 可
- 保留存檔日期: 可。 查看方式: 檢視儲存的筆記: View note info --> Created (time)
- 保留原始網址: 可。 查看方式: 檢視儲存的筆記: View note info --> URL
- 備份需登入帳號的網頁: 桌機版可 https://www.planetoid.info/images/Good.gif、手機版不可
- 可瀏覽別人的備份: 部分可 (需別人授權)
- Robots.txt 規則: 忽略
- 資料組織與利用: (1) 搜尋內文、圖內文字($) (2) 加標籤(tags) /可加註解 (3) 安裝桌面端軟體便可離線 (4) 複合書籤搜尋: 有。例如: 輸入 tag:TAG1 tag:TAG2 keywords 搜尋同時標籤 TAG1 和 TAG2 ,並且包含關鍵字 keywords 的記事內容。
H: historio[edit]
historio [Last visited: 2020-10-18]
- 檔案類型: 網頁
- 備份網頁原內嵌的圖: 否
圖使用原網站的圖檔 - 備份線上 PDF: 否,無法備份線上 PDF
- 延緩載入的圖片 (lazy load images):
- 內嵌連結的文字可以點選: 可
- 保留存檔日期: 可
- 保留原始網址: 可
- 備份需登入帳號的網頁:
- 可瀏覽別人的備份: 可,需要先 publish
- Robots.txt 規則:
- 資料組織與利用:
- API:
I: Instapaper[edit]
Instapaper [Last visited: 2017-11-18]
- 檔案類型: 網頁
- 備份網頁原內嵌的圖: 否
- 備份線上 PDF:
- 延緩載入的圖片 (lazy load images) : 可,圖片順利儲存
- 內嵌連結的文字可以點選:
- 保留存檔日期: 有
- 保留原始網址: 有
- 備份需登入帳號的網頁:
- 可瀏覽別人的備份: 否
- Robots.txt 規則:
- 資料組織與利用:
M: megalodon[edit]
ウェブ魚拓 (megalodon) [Last visited: 2017-11-18]
- 檔案類型: 網頁
- 備份網頁原內嵌的圖: 可。保存了圖片、網頁樣式
- 備份線上 PDF:
- 延緩載入的圖片 (lazy load images) : 可,圖片順利儲存
- 內嵌連結的文字可以點選: 可
- 保留存檔日期: 可
- 保留原始網址: 可
- 備份需登入帳號的網頁:
- 可瀏覽別人的備份: 可
- Robots.txt 規則:
- 資料組織與利用: 可搜尋網址的備份,查詢語法 http://megalodon.jp/?url=網址 e.g. [4]
N: Notion[edit]
notion.so: Notion Web Clipper - Chrome 線上應用程式商店 Chrome
[Last visited: 2019-11-05]
- 檔案類型: 網頁、PDF
- 備份網頁原內嵌的圖: 圖會額外儲存一份。離線時,APP、桌面軟體仍可以讀取網頁圖片。
- 備份線上 PDF: 不可
- 延緩載入的圖片 (lazy load images) :
- 內嵌連結的文字可以點選: 可
- 保留存檔日期: 可。 查看方式: 檢視儲存的筆記: 可
- 保留原始網址: 可。 查看方式: 檢視儲存的筆記: 可
- 備份需登入帳號的網頁: 否

- 可瀏覽別人的備份: 部分可 (需別人授權)
- Robots.txt 規則:
- 資料組織與利用:
O: OneNote[edit]
Microsoft OneNote Online [Last visited: 2018-09-15]
- 檔案類型: 網頁、圖、PDF 都可
- 備份網頁原內嵌的圖: 可
- 備份線上 PDF:
- 延緩載入的圖片 (lazy load images):
- 內嵌連結的文字可以點選: 可
- 保留存檔日期: 可
- 保留原始網址: 否

- 備份需登入帳號的網頁: 否
- 可瀏覽別人的備份: 否
- Robots.txt 規則: 忽略
- 資料組織與利用: 筆記本、節
P: Pinboard, Perma, Pocket[edit]
Pinboard $ [Last visited: 2017-11-18]
- 檔案類型: 網頁
- 備份網頁原內嵌的圖: 可。保存了圖片、網頁樣式(每個網頁32MB大小限制)

- 備份線上 PDF:
- 延緩載入的圖片 (lazy load images) :
- 備份網頁原內嵌的圖:
- 內嵌連結的文字可以點選: 可
- 保留存檔日期: 可
- 保留原始網址: 可
- 備份需登入帳號的網頁: 不可
- 可瀏覽別人的備份: 不可。只會留一份備份。

- Robots.txt 規則:
- 資料組織與利用: 標籤; 搜尋範圍: 網頁標題、標籤、註解、快取的網頁內文、網頁網址(bug)。
不包含網頁網址。
Perma.cc (example) [Last visited: 2020-10-18]
- 檔案類型: 網頁、圖、PDF
- 備份網頁原內嵌的圖: 可
- 備份線上 PDF: 可
- 延緩載入的圖片 (lazy load images): 可
- 內嵌連結的文字可以點選: 可
- 保留存檔日期: 可
- 保留原始網址: 可
- 備份需登入帳號的網頁:
- 可瀏覽別人的備份: 可
- Robots.txt 規則:
- 資料組織與利用:
- API: 有 Perma.cc | Developer Docs
Pocket [Last visited: 2017-11-18]
- 檔案類型: 網頁
- 網頁原內嵌的媒體(圖, flash等): 圖會額外儲存一份。離線時,APP仍可以讀取網頁圖片。
擷取的網頁版面,可能會跟原始網頁不同。
付費會員才會有永久備份 - 備份線上 PDF:
- 延緩載入的圖片 (lazy load images) : 圖片沒有儲存

- 內嵌連結的文字可以點選: 可
- 保留存檔日期: 有
- 保留原始網址: 有
- 可瀏覽別人的備份: 否。發現 ptt 的文章雖然已經移除,但是加到 Pocket 後,還可以順利看到網頁,所以可能是不同使用者共用同一份網頁備份。
- Robots.txt 規則: 忽略
- 匯出:匯出功能不包含網頁文字[2],需要手動將逐一個別網頁另存檔案。
- 資料組織與利用: (1)可以下 tag ,但是不建議在這個服務作組織分類,單純作為未讀文章列表的用途 (2)搜尋標題或網址、網域 (3) 複合書籤搜尋: 有$
R: Raindrop[edit]
Raindrop.io $ 同時提供免費和付費方案,網頁備份是付費方案才有。[Last visited: 2025-02-04]
- 檔案類型:網頁、PDF、圖片、影片等。
- 備份網頁原內嵌的圖:可。付費方案的 Raindrop.io 會自動保存網頁的永久副本,包括內嵌圖片,即使原始網頁被刪除,仍可存取。[3]
- 備份線上 PDF:可。Raindrop.io 支援保存線上 PDF,並提供全文搜尋功能。
- 延緩載入的圖片 (lazy load images):
- 備份需登入帳號的網頁:不可。Raindrop.io 無法保存需要登入才能訪問的網頁內容。
- 內嵌連結的文字可以點選:可。保存的網頁保留了內嵌連結,使用者可直接點選。
- 保留存檔日期:可。Raindrop.io 會記錄每個書籤的保存日期。
- 保留原始網址:可。每個書籤都保留了原始網址,方便未來訪問。
- 可瀏覽別人的備份:可。使用者可以將收藏夾設為公開,與他人分享,或進行協作。
- Robots.txt 規則:
- 資料組織與利用:Raindrop.io 提供標籤和收藏夾功能,方便分類和組織書籤。搜尋範圍包括網頁標題、標籤、註解,以及保存的網頁全文內容。
W: Wayback Machine[edit]
Internet Archive: Wayback Machine [Last visited: 2017-11-18]
- 檔案類型: 網頁、部分網頁樣式,導致版面可能跟原本的不同
- 備份網頁原內嵌的圖: 否
- 備份線上 PDF:
- 延緩載入的圖片 (lazy load images) : 部分圖片沒有儲存

- 內嵌連結的文字可以點選: 可
- 保留存檔日期: 可
- 保留原始網址: 可
- 備份需登入帳號的網頁: 否
- 可瀏覽別人的備份: 可
- 資料組織與利用: 可搜尋網址、不可搜尋網域對應的網頁。
- 備註: PTT 可能會備份失敗,備份到電腦網路內容分級的畫面
Bookmarklets for Internet Archive's Wayback Machine:
1. View all snapshots of the current webpage:[4] [5]
javascript:location.href=%22http://web.archive.org/web/*/%22+location.href;
or
javascript:void(window.open('https://web.archive.org/web/*/'+location.href));
2. View the latest snapshot of the current webpage:[6]
javascript:void(window.open('https://web.archive.org/web/2if_/'+location.href));
Alternative version (includes a top navigation bar to browse other revisions):
javascript:void(window.open('https://web.archive.org/web/2/'+location.href));
服務暫停 WebCite [Last visited: 2017-11-18]
- 檔案類型: 網頁 (例: 維基百科的備份)
- 備份線上 PDF:
- 備份網頁原內嵌的圖: 無, 使用原媒體的網址
- 延緩載入的圖片 (lazy load images) :
- 內嵌連結的文字可以點選: 可
- 保留存檔日期: 有
- 保留原始網址: 有, 可瀏覽不同時間的備份
- 備份需登入帳號的網頁: 不可
- 可瀏覽別人的備份: 可
- Robots.txt 規則: 遵守
- 資料組織與利用: 可 搜尋網址的備份,查詢語法 http://www.webcitation.org/query.php?url=網址 (ex) The bookmarklet was as follows:
javascript:location.href=%22http://www.webcitation.org/query.php?url=%22+location.href;
;不可搜尋相同網域的備份。
Time Travel 可一次尋找多個網頁備份服務,例如:Internet Archive, Archive-It, British Library, archive.today [Last visited: 2020-01-26]
(left blank intentionally)
服務名稱 * 檔案類型: 網頁、圖、PDF * 備份網頁原內嵌的圖: * 備份線上 PDF: * 延緩載入的圖片 (lazy load images): * 內嵌連結的文字可以點選: * 保留存檔日期: * 保留原始網址: * 備份需登入帳號的網頁: * 可瀏覽別人的備份: * [[Robots.txt]] 規則: * 資料組織與利用: * API:
不同服務的整合試用紀錄[edit]
使用 IFTTT (IFTTT recipe: If new link post at Facebook, then save for later) 備份自己 facebook 塗鴉牆張貼的連結的網頁全文: 稍後閱讀的服務,有協助抓全文。除了 Pocket 還有 instapaper 或 readability 可以選擇。另外,如果是書籤服務 diigo 或 pinboard 的付費會員,也可以協助儲存全文。不過,嘗試將這些稍後閱讀的服務界接到 Evernote 都沒法是全文。 [Last visited: 2014-12-11]
- 檔案類型: 網頁
- 備份網頁原內嵌的圖: 圖會額外儲存一份
- 內嵌連結的文字可以點選: 可
- 保留存檔日期: 有
- 保留原始網址: 有
- 備份需登入帳號的網頁: 可
- 可瀏覽別人的備份: 否
- 資料組織與利用:
Pocket + Evernote 整合的試用紀錄
- 使用手機上的 Pocket APP 分享到 Evernote APP:Evernote 結合 Pocket,無紙化也能擁有高效率
- 與Pocket儲存的網頁內容一致: 是
- 使用 IFTTT Create an Evernote when I fav an article in Pocket by neyal - IFTTT [Last visited: 2015-02-27]
- 與Pocket儲存的網頁內容一致: 否,僅有摘要(內文的前面部分)

- 與Pocket儲存的網頁內容一致: 否,僅有摘要(內文的前面部分)
- 使用 IFTTT When I favorite something in #Pocket, convert it to #PDF and put it in #Evernote by shanrep - IFTTT [Last visited: 2015-02-27]
- PDF沒有順利產生

- PDF沒有順利產生
停止的服務:
- BackupUrl.com, Yahoo My Web 2.0 Beta(中文)
- A Free Web & Mobile App for Reading Comfortably — Readability
比較不同社群網站的文章備份結果[edit]
Medium:
- Wayback Machine:可能備份成功文字而缺少圖片。提供失敗[5]與成功[6]的例子。
- Webpage archive:可能成功備份(連結),但遇過有文字但因為 Medium 需要「延緩載入的圖片」 (lazy load images) 變成模糊的例子 [7]。
- Perma.cc:成功備份的例子。
- historio:載入備份時有數秒可以看到備份內容,但是似乎跟 CSS 衝突,所以會看到空白。使用mhtml 格式才能閱讀備份。
PTT:
- Wayback Machine:不同看板的 18+ 政策不同,如果有 18+ 政策,就會導致無法成功備份,而顯示 18+ 警告[8]。若該看板無 18+ 政策,就可以成功備份[9]。
- Webpage archive:成功備份。
- Perma.cc:因 18+ 警告導致備份失敗。
- historio:成功備份。
Facebook:
- Wayback Machine:即使設定為公開,備份結果顯示登入畫面。
- Webpage archive:錯誤訊息「Not Found (yet?)」(尚未找到)
- Perma.cc:顯示「You’re Temporarily Blocked」(您暫時被封鎖) 訊息。
- historio:使用書籤小工具無效,備份不成功。
Dcard
- Wayback Machine:因HTTP 403錯誤導致備份失敗。
- Webpage archive:備份失敗[10]
YouTube
- Wayback Machine: 備份失敗,無法播放影片,也看不到留言 [11]
- Webpage archive: 備份失敗 (1) 無法播放影片,(2) 可能看到留言 [12]、也可能看不到,需要自行確認
- Wayback Machine:可以備份文章內容,但是圖片因為「延緩載入的圖片」 (lazy load images) 變成模糊的 例子。
- Webpage archive:成功備份。[13]
可「離線」瀏覽網頁存檔的方案[edit]
瀏覽器列印成 PDF
- 檔案格式:PDF 單一檔案
- 保留存檔日期: yes
- 保留原始網址: yes (列印選項,需要勾選「頁首及頁尾」,才會在頁頭頁尾顯示網頁標題、日期、網址等資訊。)
- 效果:
- 檔案格式:(1) 資料夾、(2) MAFF 封存檔、(3) HTZ 封存檔、(4) 一個網頁檔
- 內嵌連結的文字可以點選: yes
- 保留存檔日期: yes
- 保留原始網址: yes
- 檔案格式: 一個網頁檔
- 內嵌連結的文字可以點選: yes
- 保留存檔日期: yes
- 保留原始網址: yes
HTML to PDF Conversion - PDFonFly.com 輸入HTML文字,直接轉換成PDF
- 檔案格式:PDF
- 內嵌連結的文字可以點選:
- 保留存檔日期:
- 保留原始網址:
iWeb2x for Chrome
- 檔案格式:PDF 或圖片
- 內嵌連結的文字可以點選: yes
- 保留存檔日期: no
- 保留原始網址: no
iWeb2Print[Last visited: 2010-03-15] 教學:iWeb2Print 把你喜歡的網頁文章存成PDF檔
- 檔案格式:
- 內嵌連結的文字可以點選: yes
- 保留存檔日期: no
- 保留原始網址: no
Convert Web Page to PDF for Free Online - #1 Web to PDF Converter
- 檔案格式:PDF
- 保留存檔日期: yes ((檔案 metadata)
- 保留原始網址: yes (檔案 metadata)
iWeb2x for Chrome
- 檔案格式:PDF 或圖片
- 內嵌連結的文字可以點選: yes
- 保留存檔日期: no
- 保留原始網址: no
Zotero | Your personal research assistant + Zotero Connector
- 檔案格式:網頁 (圖檔遺失)
- 內嵌連結的文字可以點選: yes
- 保留存檔日期: yes
- 保留原始網址: yes
Firefox v. 102.0: 另存新檔(網頁,完整封裝)
- 檔案格式:網頁 + 相關圖片 檔案
- 保留存檔日期: yes
- 保留原始網址: yes (檔案 metadata 內的來源欄位,有紀錄原始網址)
- 效果: 部分圖片可能無法顯示

Firefox
v.15 + Mozilla Archive Format, with MHT and Faithful Save :: Firefox 附加元件(MAF) 2.x: Save as MAFF MHT Archive
- 檔案格式:mht 單一檔案
- 保留存檔日期: yes
- 保留原始網址: yes
- 效果: 新版 Firefox v. 102.0 已經不支援該擴充套件

備份網頁畫面圖檔[edit]
Save to Google Drive for Chrome
Pearl Crescent Page Saver for Mozilla Firefox Firefox
- more on Screen Capture#網頁快照
其他同類型服務或軟體[edit]
其他服務
其他同類型軟體
- 网博士(Websaver)
- fishCode Library .NET Professional
- CyberArticle(網際知識管家)
- myBase - Free-form Database, Research Database, Knowledge Base Software, Notes Manager & Information Organizer
砍站軟體:
HTTrack Website Copier 和 Teleport Pro 均無法處理簡體中文的目錄名稱和檔案名稱!
類似服務評比
- Top Web Annotation Tools: Annotate+Bookmark+Collaborate » MakeUseOf.com (中文翻譯)
- Social bookmarking for saving the copy of webpages or pdf files
相關文章[edit]
- 找不到網頁的可能解決方法
- 《純敏達康》 » Toread + Gmail:超快書籤儲存術 (last visited: 2007-01-28)
- (知識管理) Google Notebook (last visited: 2007-05-02)
- 資訊記錄管理軟體? - IT邦幫忙::IT知識分享社群 2008-12
- Web archiving - Wikipedia, the free encyclopedia
- 已知無法備份使用 canvas 的網頁,需要轉成圖檔 (Convert canvas to image)
- enpan's Patent & Linux practice: 用網路資料作為引證文件(有關Wayback Machine, MPEP2128)
- 將瀏覽過的網頁做最好的知識管理 - Soft & Share 線上課程資訊分享
- Downloading an Entire Web Site with wget | Linux Journal
- 把知識從殿堂中解放出來,Internet Archive 要當人類文明的檔案管理員 | Star Rocket Blog