網頁備份: Difference between revisions

Jump to navigation Jump to search
304 bytes added ,  18 February 2024
Tags: Mobile edit Mobile web edit
Tags: Mobile edit Mobile web edit
Line 94: Line 94:
書籤網站或線上備份網頁的服務列表與比較
書籤網站或線上備份網頁的服務列表與比較


==== A: Archive.is ====
{{Gd}} [http://archive.is/ Archive.is - webpage capture] {{access | date = 2017-11-18}}
{{Gd}} [http://archive.is/ Archive.is - webpage capture] {{access | date = 2017-11-18}}
* 檔案類型: 網頁 (例: [http://archive.is/B0qhH 維基百科的備份])、網頁樣式 {{Gd}}
* 檔案類型: 網頁 (例: [http://archive.is/B0qhH 維基百科的備份])、網頁樣式 {{Gd}}
Line 108: Line 109:
* 備註: (1) PTT 可能會備份失敗[https://archive.is/www.ptt.cc],備份到電腦網路內容分級的畫面 ([https://archive.is/ODmrW#selection-23.3-23.11 ex])。 (2) 如果是需要捲動網頁,才能看到的圖,備份的網頁可以順利顯示圖 [https://archive.is/R7oe4/4b913063476a2a08ad41243f3052f39edf3be731]
* 備註: (1) PTT 可能會備份失敗[https://archive.is/www.ptt.cc],備份到電腦網路內容分級的畫面 ([https://archive.is/ODmrW#selection-23.3-23.11 ex])。 (2) 如果是需要捲動網頁,才能看到的圖,備份的網頁可以順利顯示圖 [https://archive.is/R7oe4/4b913063476a2a08ad41243f3052f39edf3be731]


==== D: Diigo ====
[http://www.diigo.com/index Diigo] ''$''<ref>[http://help.diigo.com/premium-features/Cached-page Cached pages - Diigo help]</ref> {{access | date = 2017-11-18}}
* 檔案類型: 網頁、圖、PDF
* 備份網頁原內嵌的圖: 備份網頁時,預設不會儲存圖檔,需要手動逐張儲存圖片至Diigo
* 備份線上 PDF: 可
* 延緩載入的圖片 (lazy load images) : 可,圖片順利儲存
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 有
* 保留原始網址: 有
* 備份需登入帳號的網頁: 不可
* 可瀏覽別人的備份: ''$'' 不可,並保留不同時間儲存的備份 {{Gd}}
* [[Robots.txt]] 規則: 忽略
* 資料組織與利用: 加標籤(tags) /可加註解 <br />搜尋範圍: 網頁標題、標籤、註解、網頁網址、網域、快取的網頁內文。 
==== E: Evernote ====
桌機版 [http://www.evernote.com/ Evernote] ''$'' {{access | date = 2018-12-06}}
* 檔案類型: 網頁、PDF
* 備份網頁原內嵌的圖: 圖會額外儲存一份。離線時,APP、桌面軟體仍可以讀取網頁圖片。 {{exclaim}}擷取的網頁版面,可能會跟原始網頁不同。
* 備份線上 PDF: 可
* 延緩載入的圖片 (lazy load images) : 可,圖片順利儲存
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 可。 查看方式: 檢視儲存的筆記: View note info --> Created (time)
* 保留原始網址: 可。 查看方式: 檢視儲存的筆記: View note info --> URL
* 備份需登入帳號的網頁: 桌機版可 {{Gd}}、手機版不可
* 可瀏覽別人的備份: 部分可 (需別人授權)
* [[Robots.txt]] 規則: 忽略
* 資料組織與利用: (1) 搜尋內文、圖內文字(''$'') (2) 加標籤(tags) /可加註解 (3) 安裝桌面端軟體便可離線 (4) 複合書籤搜尋: 有。例如: 輸入 {{kbd | key=<nowiki>tag:TAG1 tag:TAG2 keywords</nowiki>}} 搜尋同時標籤 ''TAG1'' 和 ''TAG2'' ,並且包含關鍵字 ''keywords'' 的記事內容。
==== G: Google cache ====
Google 庫存頁面
Google 庫存頁面
* 檔案類型: 網頁
* 檔案類型: 網頁
Line 118: Line 148:
</pre>
</pre>


 
==== H: historio ====
[http://www.justaple.com/index.html Justaple] {{access | date = 2017-11-18}}
[https://historio.us/ historio] {{access | date = 2020-10-18}}  
* 檔案類型: 保存了圖片、大部分的Flash、網頁樣式
* 檔案類型: 網頁
* 備份網頁原內嵌的圖:
* 備份網頁原內嵌的圖: 否 {{exclaim}} 圖使用原網站的圖檔
* 備份線上 PDF:
* 備份線上 PDF: 否,無法備份線上 PDF
* 延緩載入的圖片 (lazy load images) : 可,圖片順利儲存
* 延緩載入的圖片 (lazy load images):  
* 內嵌連結的文字可以點選: 可
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 可
* 保留存檔日期: 可
* 保留原始網址: 可
* 保留原始網址: 可
* 備份需登入帳號的網頁:  
* 備份需登入帳號的網頁:  
* 可瀏覽別人的備份:
* 可瀏覽別人的備份: 可,需要先 publish
* [[Robots.txt]] 規則:
* [[Robots.txt]] 規則:  
* 資料組織與利用: 資料夾方式組織; 僅能有20個不公開的網頁存檔; iPhone app提供離線瀏覽功能 (access: 2011-10-27)
* 資料組織與利用:  
 
* API:
[http://getpocket.com Pocket] {{access | date = 2017-11-18}}
* 檔案類型: 網頁
* 網頁原內嵌的媒體(圖, flash等): 圖會額外儲存一份。離線時,APP仍可以讀取網頁圖片。 {{exclaim}} 擷取的網頁版面,可能會跟原始網頁不同。{{exclaim}} 付費會員才會有永久備份
* 備份線上 PDF:
* 延緩載入的圖片 (lazy load images) : 圖片沒有儲存 {{exclaim}}
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 有
* 保留原始網址: 有
* 可瀏覽別人的備份: 否。發現 ptt 的文章雖然已經移除,但是加到 Pocket 後,還可以順利看到網頁,所以可能是不同使用者共用同一份網頁備份。
* [[Robots.txt]] 規則: 忽略
* 匯出:匯出功能不包含網頁文字<ref>[https://support.mozilla.org/en-US/kb/exporting-your-pocket-list Exporting your Pocket saves | Pocket Help]</ref>,需要手動將逐一個別網頁另存檔案。
* 資料組織與利用: (1)可以下 tag ,但是不建議在這個服務作組織分類,單純作為未讀文章列表的用途 (2)搜尋標題或網址、網域 (3) 複合書籤搜尋:  [http://help.getpocket.com/customer/portal/articles/1564293-pocket-premium-full-text-search 有]''$''


[https://archive.org/web/ Internet Archive: Wayback Machine]  {{access | date = 2017-11-18}}
* 檔案類型: 網頁、部分網頁樣式,導致版面可能跟原本的不同
* 備份網頁原內嵌的圖: 否
* 備份線上 PDF:
* 延緩載入的圖片 (lazy load images) : 部分圖片沒有儲存 {{exclaim}}
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 可
* 保留原始網址: 可
* 備份需登入帳號的網頁: 否
* 可瀏覽別人的備份: 可
* 資料組織與利用: 可搜尋網址、不可搜尋網域對應的網頁。查詢語法<ref>https://zh.wikipedia.org/wiki/Wikipedia:%E4%BD%BF%E7%94%A8%E6%97%B6%E5%85%89%E6%9C%BA</ref><ref>[https://gist.github.com/n-st/0dd03b2323e7f9acd98e Bookmarklet to view current page on the Internet Archive Wayback Machine (https://archive.org/)]</ref>: <pre>javascript:location.href=%22http://web.archive.org/web/*/%22+location.href; 或 javascript:void(window.open('https://web.archive.org/web/*/'+location.href));</pre>
* 備註: PTT 可能會備份失敗,備份到電腦網路內容分級的畫面
''服務暫停'' [http://www.webcitation.org/index WebCite] {{access | date = 2017-11-18}}
* 檔案類型: 網頁 (例: [http://www.webcitation.org/64fUtAo8R 維基百科的備份])
* 備份線上 PDF:
* 備份網頁原內嵌的圖: ''無'', 使用原媒體的網址
* 延緩載入的圖片 (lazy load images) :
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 有
* 保留原始網址: 有, 可瀏覽不同時間的備份
* 備份需登入帳號的網頁: 不可
* 可瀏覽別人的備份: 可
* [[Robots.txt]] 規則: 遵守
* 資料組織與利用: 可 [http://www.webcitation.org/query 搜尋網址的備份],查詢語法 http://www.webcitation.org/query.php?url=網址  ([http://www.webcitation.org/query.php?url=http://blog.pixnet.net/post/admin/3240566 ex]) The bookmarklet was as follows:<pre>javascript:location.href=%22http://www.webcitation.org/query.php?url=%22+location.href;</pre>;不可搜尋相同網域的備份。


==== I: Instapaper ====
[https://www.instapaper.com/ Instapaper] {{access | date = 2017-11-18}}
[https://www.instapaper.com/ Instapaper] {{access | date = 2017-11-18}}
* 檔案類型: 網頁
* 檔案類型: 網頁
Line 184: Line 178:
* 資料組織與利用:  
* 資料組織與利用:  


[https://www.notion.so/ notion.so]: [https://chrome.google.com/webstore/detail/notion-web-clipper/knheggckgoiihginacbkhaalnibhilkk Notion Web Clipper - Chrome 線上應用程式商店] {{chrome}} {{access | date = 2019-11-05}}
* 檔案類型: 網頁、PDF
* 備份網頁原內嵌的圖: 圖會額外儲存一份。離線時,APP、桌面軟體仍可以讀取網頁圖片。
* 備份線上 PDF: 不可
* 延緩載入的圖片 (lazy load images) :
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 可。 查看方式: 檢視儲存的筆記: 可
* 保留原始網址: 可。 查看方式: 檢視儲存的筆記: 可
* 備份需登入帳號的網頁: 否 {{exclaim}}
* 可瀏覽別人的備份: 部分可 (需別人授權)
* [[Robots.txt]] 規則:
* 資料組織與利用:


 
==== J: Justaple ====
桌機版 [http://www.evernote.com/ Evernote] ''$'' {{access | date = 2018-12-06}}
[http://www.justaple.com/index.html Justaple] {{access | date = 2017-11-18}}
* 檔案類型: 網頁、PDF
* 檔案類型: 保存了圖片、大部分的Flash、網頁樣式
* 備份網頁原內嵌的圖: 圖會額外儲存一份。離線時,APP、桌面軟體仍可以讀取網頁圖片。 {{exclaim}}擷取的網頁版面,可能會跟原始網頁不同。
* 備份網頁原內嵌的圖:
* 備份線上 PDF:
* 備份線上 PDF:
* 延緩載入的圖片 (lazy load images) : 可,圖片順利儲存
* 延緩載入的圖片 (lazy load images) : 可,圖片順利儲存
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 可。 查看方式: 檢視儲存的筆記: View note info --> Created (time)
* 保留原始網址: 可。 查看方式: 檢視儲存的筆記: View note info --> URL
* 備份需登入帳號的網頁: 桌機版可 {{Gd}}、手機版不可
* 可瀏覽別人的備份: 部分可 (需別人授權)
* [[Robots.txt]] 規則: 忽略
* 資料組織與利用: (1) 搜尋內文、圖內文字(''$'') (2) 加標籤(tags) /可加註解 (3) 安裝桌面端軟體便可離線 (4) 複合書籤搜尋: 有。例如: 輸入 {{kbd | key=<nowiki>tag:TAG1 tag:TAG2 keywords</nowiki>}} 搜尋同時標籤 ''TAG1'' 和 ''TAG2'' ,並且包含關鍵字 ''keywords'' 的記事內容。
[http://www.diigo.com/index Diigo] ''$''<ref>[http://help.diigo.com/premium-features/Cached-page Cached pages - Diigo help]</ref> {{access | date = 2017-11-18}}
* 檔案類型: 網頁、圖、PDF
* 備份網頁原內嵌的圖: 備份網頁時,預設不會儲存圖檔,需要手動逐張儲存圖片至Diigo
* 備份線上 PDF: 可
* 延緩載入的圖片 (lazy load images) : 可,圖片順利儲存
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 有
* 保留原始網址: 有
* 備份需登入帳號的網頁: 不可
* 可瀏覽別人的備份: ''$'' 不可,並保留不同時間儲存的備份 {{Gd}}
* [[Robots.txt]] 規則: 忽略
* 資料組織與利用: 加標籤(tags) /可加註解 <br />搜尋範圍: 網頁標題、標籤、註解、網頁網址、網域、快取的網頁內文。 
[http://pinboard.in/ Pinboard] ''$''  {{access | date = 2017-11-18}}
* 檔案類型: 網頁
* 備份網頁原內嵌的圖: 可。保存了圖片、網頁樣式(每個網頁32MB大小限制) {{Gd}}
* 備份線上 PDF:
* 延緩載入的圖片 (lazy load images) :
* 備份網頁原內嵌的圖:
* 內嵌連結的文字可以點選: 可
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 可
* 保留存檔日期: 可
* 保留原始網址: 可
* 保留原始網址: 可
* 備份需登入帳號的網頁: 不可
* 備份需登入帳號的網頁:  
* 可瀏覽別人的備份: 不可。只會留一份備份。 {{exclaim}}
* 可瀏覽別人的備份:
* [[Robots.txt]] 規則:  
* [[Robots.txt]] 規則:
* 資料組織與利用: 標籤; 搜尋範圍: 網頁標題、標籤、註解、快取的網頁內文、[http://pinboard.in/url 網頁網址](bug)。 [[Image:Icon exclaim.gif| ]]不包含網頁網址。
* 資料組織與利用: 資料夾方式組織; 僅能有20個不公開的網頁存檔; iPhone app提供離線瀏覽功能 (access: 2011-10-27)


==== M: megalodon ====
[http://megalodon.jp/ ウェブ魚拓] (megalodon) {{access | date = 2017-11-18}}
[http://megalodon.jp/ ウェブ魚拓] (megalodon) {{access | date = 2017-11-18}}
* 檔案類型: 網頁
* 檔案類型: 網頁
Line 250: Line 206:
* [[Robots.txt]] 規則:  
* [[Robots.txt]] 規則:  
* 資料組織與利用: 可搜尋網址的備份,查詢語法 <nowiki>http://megalodon.jp/?url=網址</nowiki> e.g. [http://megalodon.jp/?url=http%3A%2F%2Ftw.yahoo.com]
* 資料組織與利用: 可搜尋網址的備份,查詢語法 <nowiki>http://megalodon.jp/?url=網址</nowiki> e.g. [http://megalodon.jp/?url=http%3A%2F%2Ftw.yahoo.com]
==== N: Notion, NTUWAS ====
[https://www.notion.so/ notion.so]: [https://chrome.google.com/webstore/detail/notion-web-clipper/knheggckgoiihginacbkhaalnibhilkk Notion Web Clipper - Chrome 線上應用程式商店] {{chrome}} {{access | date = 2019-11-05}}
* 檔案類型: 網頁、PDF
* 備份網頁原內嵌的圖: 圖會額外儲存一份。離線時,APP、桌面軟體仍可以讀取網頁圖片。
* 備份線上 PDF: 不可
* 延緩載入的圖片 (lazy load images) :
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 可。 查看方式: 檢視儲存的筆記: 可
* 保留原始網址: 可。 查看方式: 檢視儲存的筆記: 可
* 備份需登入帳號的網頁: 否 {{exclaim}}
* 可瀏覽別人的備份: 部分可 (需別人授權)
* [[Robots.txt]] 規則:
* 資料組織與利用:


[http://webarchive.lib.ntu.edu.tw/default.asp Web Archive -- 國立臺灣大學網站典藏庫(NTU Web Archiving System, NTUWAS)] {{access | date = 2018-03-25}} {{exclaim}} 由台大決定哪些網站要備份
[http://webarchive.lib.ntu.edu.tw/default.asp Web Archive -- 國立臺灣大學網站典藏庫(NTU Web Archiving System, NTUWAS)] {{access | date = 2018-03-25}} {{exclaim}} 由台大決定哪些網站要備份
Line 263: Line 234:
* [[Robots.txt]] 規則:  
* [[Robots.txt]] 規則:  
* 資料組織與利用:  
* 資料組織與利用:  
==== O: OneNote ====


[https://onedrive.live.com/ Microsoft OneNote Online] {{access | date = 2018-09-15}}  
[https://onedrive.live.com/ Microsoft OneNote Online] {{access | date = 2018-09-15}}  
Line 276: Line 249:
* [[Robots.txt]] 規則: 忽略
* [[Robots.txt]] 規則: 忽略
* 資料組織與利用: 筆記本、節
* 資料組織與利用: 筆記本、節
==== P: Pinboard, Perma, Pocket ====
[http://pinboard.in/ Pinboard] ''$''  {{access | date = 2017-11-18}}
* 檔案類型: 網頁
* 備份網頁原內嵌的圖: 可。保存了圖片、網頁樣式(每個網頁32MB大小限制) {{Gd}}
* 備份線上 PDF:
* 延緩載入的圖片 (lazy load images) :
* 備份網頁原內嵌的圖:
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 可
* 保留原始網址: 可
* 備份需登入帳號的網頁: 不可
* 可瀏覽別人的備份: 不可。只會留一份備份。 {{exclaim}}
* [[Robots.txt]] 規則:
* 資料組織與利用: 標籤; 搜尋範圍: 網頁標題、標籤、註解、快取的網頁內文、[http://pinboard.in/url 網頁網址](bug)。 [[Image:Icon exclaim.gif| ]]不包含網頁網址。


[https://perma.cc/ Perma.cc] ([https://perma.cc/BM2W-X62C example]) {{access | date = 2020-10-18}}  
[https://perma.cc/ Perma.cc] ([https://perma.cc/BM2W-X62C example]) {{access | date = 2020-10-18}}  
Line 291: Line 280:
* API: 有 [https://perma.cc/docs/developer Perma.cc | Developer Docs]
* API: 有 [https://perma.cc/docs/developer Perma.cc | Developer Docs]


[https://historio.us/ historio] {{access | date = 2020-10-18}}  
 
[http://getpocket.com Pocket] {{access | date = 2017-11-18}}
* 檔案類型: 網頁
* 檔案類型: 網頁
* 備份網頁原內嵌的圖: {{exclaim}} 圖使用原網站的圖檔
* 網頁原內嵌的媒體(圖, flash等): 圖會額外儲存一份。離線時,APP仍可以讀取網頁圖片。 {{exclaim}} 擷取的網頁版面,可能會跟原始網頁不同。{{exclaim}} 付費會員才會有永久備份
* 備份線上 PDF: 否,無法備份線上 PDF
* 備份線上 PDF:
* 延緩載入的圖片 (lazy load images):  
* 延緩載入的圖片 (lazy load images) : 圖片沒有儲存 {{exclaim}}
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 有
* 保留原始網址: 有
* 可瀏覽別人的備份: 否。發現 ptt 的文章雖然已經移除,但是加到 Pocket 後,還可以順利看到網頁,所以可能是不同使用者共用同一份網頁備份。
* [[Robots.txt]] 規則: 忽略
* 匯出:匯出功能不包含網頁文字<ref>[https://support.mozilla.org/en-US/kb/exporting-your-pocket-list Exporting your Pocket saves | Pocket Help]</ref>,需要手動將逐一個別網頁另存檔案。
* 資料組織與利用: (1)可以下 tag ,但是不建議在這個服務作組織分類,單純作為未讀文章列表的用途 (2)搜尋標題或網址、網域 (3) 複合書籤搜尋:  [http://help.getpocket.com/customer/portal/articles/1564293-pocket-premium-full-text-search 有]''$''
 
 
==== W: Wayback Machine ====
[https://archive.org/web/ Internet Archive: Wayback Machine]  {{access | date = 2017-11-18}}
* 檔案類型: 網頁、部分網頁樣式,導致版面可能跟原本的不同
* 備份網頁原內嵌的圖: 否
* 備份線上 PDF:
* 延緩載入的圖片 (lazy load images) : 部分圖片沒有儲存 {{exclaim}}
* 內嵌連結的文字可以點選: 可
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 可
* 保留存檔日期: 可
* 保留原始網址: 可
* 保留原始網址: 可
* 備份需登入帳號的網頁:  
* 備份需登入帳號的網頁:
* 可瀏覽別人的備份: 可,需要先 publish
* 可瀏覽別人的備份:
* [[Robots.txt]] 規則:  
* 資料組織與利用: 可搜尋網址、不可搜尋網域對應的網頁。查詢語法<ref>https://zh.wikipedia.org/wiki/Wikipedia:%E4%BD%BF%E7%94%A8%E6%97%B6%E5%85%89%E6%9C%BA</ref><ref>[https://gist.github.com/n-st/0dd03b2323e7f9acd98e Bookmarklet to view current page on the Internet Archive Wayback Machine (https://archive.org/)]</ref>: <pre>javascript:location.href=%22http://web.archive.org/web/*/%22+location.href; 或 javascript:void(window.open('https://web.archive.org/web/*/'+location.href));</pre>
* 資料組織與利用:  
* 備註: PTT 可能會備份失敗,備份到電腦網路內容分級的畫面
* API:
 
''服務暫停'' [http://www.webcitation.org/index WebCite] {{access | date = 2017-11-18}}
* 檔案類型: 網頁 (例: [http://www.webcitation.org/64fUtAo8R 維基百科的備份])
* 備份線上 PDF:
* 備份網頁原內嵌的圖: ''無'', 使用原媒體的網址
* 延緩載入的圖片 (lazy load images) :
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 有
* 保留原始網址: 有, 可瀏覽不同時間的備份
* 備份需登入帳號的網頁: 不可
* 可瀏覽別人的備份: 可
* [[Robots.txt]] 規則: 遵守
* 資料組織與利用: 可 [http://www.webcitation.org/query 搜尋網址的備份],查詢語法 http://www.webcitation.org/query.php?url=網址  ([http://www.webcitation.org/query.php?url=http://blog.pixnet.net/post/admin/3240566 ex]) The bookmarklet was as follows:<pre>javascript:location.href=%22http://www.webcitation.org/query.php?url=%22+location.href;</pre>;不可搜尋相同網域的備份。
 
 


[http://timetravel.mementoweb.org/ Time Travel] 可一次尋找多個網頁備份服務,例如:Internet Archive, Archive-It, British Library, archive.today {{access | date = 2020-01-26}}  
[http://timetravel.mementoweb.org/ Time Travel] 可一次尋找多個網頁備份服務,例如:Internet Archive, Archive-It, British Library, archive.today {{access | date = 2020-01-26}}  

Navigation menu