網頁備份: Difference between revisions

From LemonWiki共筆
Jump to navigation Jump to search
Line 189: Line 189:


== 需「維持網路連線」瀏覽網頁存檔的方案==
== 需「維持網路連線」瀏覽網頁存檔的方案==
'''比較表'''
'''摘要'''
{| border="1"
| <b>核取</b> || <b>方法</b> || <b>檔案類型</b> || <b>網頁原內嵌的媒體(圖等)</b> || <b>內嵌連結的文字可以點選</b> || <b>保留存檔日期</b> || <b>保留原始網址</b> || <b>資料組織與利用</b>
|-
| || [http://www.diigo.com/index Diigo] (不含圖檔) ''$'' || html
|class="no" | ''無'', 使用原媒體的網址 (可手動逐張儲存圖片至Diigo)
|class="yes" | yes
|class="yes" | yes
|class="yes" | yes
|| 組織: 加標籤(tags) /可加註解 <br />搜尋範圍: 網頁標題、標籤、註解、網頁網址、快取的網頁內文。  {{access | date= 2012-02-24}}
|-
| || [http://www.evernote.com/ Evernote]  || html
|class="no" | '''有'''
|class="yes" | yes
|class="yes" | yes
|class="yes" | yes
|| 搜尋 /加標籤(tags) /可加註解/ 安裝桌面端軟體便可離線
|-
| || [http://www.justaple.com/index.html Justaple] || html
|class="yes" | yes, 保存了圖片、大部分的Flash、網頁樣式
|class="yes" |yes
|class="yes" | yes
|class="yes" | yes
|| 資料夾方式組織; 僅能有20個不公開的網頁存檔; iPhone app提供離線瀏覽功能 (access: 2011-10-27)
|-
| || [http://pinboard.in/ Pinboard] ''$'' || html
|class="yes" | yes, 保存了圖片、網頁樣式(每個網頁32MB大小限制)
|class="yes" | yes
|class="yes" | yes
|class="yes" | yes
|| 組織方式: 標籤; <br />搜尋範圍: 網頁標題、標籤、註解、快取的網頁內文、[http://pinboard.in/url 網頁網址](bug)。 [[Image:Icon exclaim.gif| ]]不包含網頁網址。 {{access | date= 2011-12-25}}
|-
| ☆ || [http://toread.cc/ toread] (不含圖檔, 部份中文字呈現亂碼) || html(Email)
|class="no" | ''無'', 使用原媒體的網址(相對路徑的圖形才能順利顯示)
|class="yes" |yes
|class="yes" | yes
|class="yes" | yes
|| 建議結合Gmail的標籤(label), 啟用Gmail POP3即可下載離線; 網頁擷取自瀏覽器的'''網頁暫存'''(local cache),可結合[http://karmatics.com/aardvark/ Aardvark Firefox Extension]選取網頁中要備份的特定區域。
|-
| || [http://www.webcitation.org/index WebCite] || html
|class="no" | ''無'', 使用原媒體的網址
|class="yes" | yes
|class="yes" | yes
|class="yes"| yes
|| 可瀏覽不同時間的備份
|-
|}


# 免費服務中最好的是 [http://archive.is/ Archive.is] 可以同時儲存網頁內嵌的圖,如果原始網頁遺失,還能保留完整資訊。
# 付費書籤服務首選[http://www.evernote.com/ Evernote],因為即使是需要登入帳號密碼的網頁,也可以順利擷取。如果單純備份公開網頁的書籤服務,則可以選擇 [http://pinboard.in/ Pinboard] ,加入書籤網址之後,則會自動擷取網頁內文與內嵌的圖。


[http://archive.is/ Archive.is - webpage capture] {{access | date = 2014-02-28}}
'''書籤網站列表與比較'''
 
{{Gd}} [http://archive.is/ Archive.is - webpage capture] {{access | date = 2014-02-28}}
* 檔案類型: 網頁 (例: [http://archive.is/B0qhH 維基百科的備份])
* 檔案類型: 網頁 (例: [http://archive.is/B0qhH 維基百科的備份])
* 網頁原內嵌的媒體(, flash等): 圖會額外儲存一份, flash不會。
* 備份網頁原內嵌的圖: 圖會額外儲存一份, flash不會。
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 有
* 保留原始網址: 有
* 備份需登入帳號的網頁: 不可
* 資料組織與利用:
 
[http://www.justaple.com/index.html Justaple] {{access | date = 2011-10-27}}
* 檔案類型: 保存了圖片、大部分的Flash、網頁樣式
* 備份網頁原內嵌的圖: 可
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 可
* 保留原始網址: 可
* 備份需登入帳號的網頁:
* 資料組織與利用: 資料夾方式組織; 僅能有20個不公開的網頁存檔; iPhone app提供離線瀏覽功能 (access: 2011-10-27)
 
[http://www.webcitation.org/index WebCite] {{access | date=2015-06-28}}
* 檔案類型: 網頁 (例: [http://www.webcitation.org/64fUtAo8R 維基百科的備份])
* 備份網頁原內嵌的圖: ''無'', 使用原媒體的網址
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 有
* 保留原始網址: 有, 可瀏覽不同時間的備份
* 備份需登入帳號的網頁: 不可
* 資料組織與利用: 可透過搜尋 [http://www.webcitation.org/query WebCite query page]
 
[http://toread.cc/ toread] (不含圖檔, 部份中文字呈現亂碼)
* 檔案類型: 網頁(Email 方式)
* 備份網頁原內嵌的圖: ''無'', 使用原媒體的網址(相對路徑的圖形才能順利顯示)  
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 有
* 保留原始網址: 有
* 備份需登入帳號的網頁:
* 資料組織與利用: 建議結合Gmail的標籤(label), 啟用Gmail POP3即可下載離線; 網頁擷取自瀏覽器的'''網頁暫存'''(local cache),可結合[http://karmatics.com/aardvark/ Aardvark Firefox Extension]選取網頁中要備份的特定區域。
 
使用 IFTTT  (IFTTT recipe: [https://ifttt.com/recipes/228265-if-new-link-post-at-facebook-then-save-for-later If new link post at Facebook, then save for later]) 備份自己 facebook 塗鴉牆張貼的連結的網頁全文: 稍後閱讀的服務,有協助抓全文。除了 Pocket 還有 instapaper 或 readability 可以選擇。另外,如果是書籤服務 diigo 或 pinboard 的付費會員,也可以協助儲存全文。不過,嘗試將這些稍後閱讀的服務界接到 Evernote 都沒法是全文。 {{access | date=2014-12-11}}
* 檔案類型: 網頁
* 備份網頁原內嵌的圖: 圖會額外儲存一份
* 內嵌連結的文字可以點選: 可
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 有
* 保留存檔日期: 有
* 保留原始網址: 有
* 保留原始網址: 有
* 備份需登入帳號的網頁: 可
* 資料組織與利用:
* 資料組織與利用:


[http://www.evernote.com/ Evernote] ''$'' {{access | date= 2015-06-28}}
* 檔案類型: 網頁、PDF
* 備份網頁原內嵌的圖: 圖會額外儲存一份
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 可
* 保留原始網址: 可
* 備份需登入帳號的網頁: 可 {{Gd}}
* 資料組織與利用: 搜尋 /加標籤(tags) /可加註解/ 安裝桌面端軟體便可離線
[http://www.diigo.com/index Diigo] ''$'' {{access | date= 2015-06-28}}
* 檔案類型: 網頁、圖、PDF
* 備份網頁原內嵌的圖: 備份網頁時,預設不會儲存圖檔,需要手動逐張儲存圖片至Diigo
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 有
* 保留原始網址: 有
* 備份需登入帳號的網頁: 不可
* 資料組織與利用: 加標籤(tags) /可加註解 <br />搜尋範圍: 網頁標題、標籤、註解、網頁網址、快取的網頁內文。 
[http://pinboard.in/ Pinboard] ''$''  {{access | date= 2015-06-28}}
* 檔案類型: 網頁
* 備份網頁原內嵌的圖: 可。保存了圖片、網頁樣式(每個網頁32MB大小限制)
* 內嵌連結的文字可以點選: 可
* 保留存檔日期: 可
* 保留原始網址: 可
* 備份需登入帳號的網頁: 不可
* 資料組織與利用: 標籤; 搜尋範圍: 網頁標題、標籤、註解、快取的網頁內文、[http://pinboard.in/url 網頁網址](bug)。 [[Image:Icon exclaim.gif| ]]不包含網頁網址。


使用 IFTTT 備份自己 facebook 塗鴉牆張貼的連結的網頁全文
(left blank intentionally)
* 稍後閱讀的服務,有協助抓全文。除了 Pocket 還有 instapaper 或 readability 可以選擇。另外,如果是書籤服務 diigo 或 pinboard 的付費會員,也可以協助儲存全文。不過,嘗試將這些稍後閱讀的服務界接到 Evernote 都沒法是全文。 {{access | date=2014-12-11}}
<pre>
* IFTTT recipe: [https://ifttt.com/recipes/228265-if-new-link-post-at-facebook-then-save-for-later If new link post at Facebook, then save for later]
服務名稱
* 檔案類型: 網頁、圖、PDF
* 備份網頁原內嵌的圖:
* 內嵌連結的文字可以點選:  
* 保留存檔日期:
* 保留原始網址:
* 備份需登入帳號的網頁:
* 資料組織與利用:
</pre>


停止的服務: BackupUrl.com, [http://myweb2.search.yahoo.com/myweb?ei=UTF-8 Yahoo My Web 2.0 Beta]([http://tw.myweb2.search.yahoo.com/myweb 中文])
停止的服務: BackupUrl.com, [http://myweb2.search.yahoo.com/myweb?ei=UTF-8 Yahoo My Web 2.0 Beta]([http://tw.myweb2.search.yahoo.com/myweb 中文])

Revision as of 13:27, 28 June 2015

網頁歸檔備份的工具:

  • 比較網頁儲存及歸檔的不同方案是否「內嵌連結的文字可以點選」、「保留存檔日期」、「保留原始網址」等基礎資訊是否保留? (English version: Archive of webpage)
  • 將不同網站網頁資料,透過標籤方式重新組織。

比較說明

  • 「內嵌連結的文字可以點選」:這部分對其他軟體/服務多不是問題。但是PDF檔的「直接列印到PDF的虛擬印表機」的產生方式,其內嵌連結的文字是無法點選的,即導致網址資訊會消失。(除非直接寫上網址或購買Adobe Acrobat使用內建的PDFMaker)
  • 「保留存檔日期」:由於檔案本身已經內建日期屬性(在檔案的圖示上,按右鍵選「內容」,就可以看到檔案的「建立日期」),但是很容易因為儲存或FTP到不同媒體時,導致存檔日期有所變動,而Firefox + ScrapBook的方案比較好,會將這項屬性資訊額外儲存。
  • 「保留存檔日期」與「保留原始網址」:這兩項均與學術論文寫作(書目格式)有關,在論文的參考資料部分,如果有引用到網路資料,必須註明網址以及存取日期。
  • 行動性:現有可以完整封裝成單一檔案的方案,都未額外內嵌「保留存檔日期」或者會漏失一些資訊。

可「離線」瀏覽網頁存檔的方案

複合方案: 手機APP+線上服務

Pocket

Evernote

  • 檔案類型: 網頁
  • 網頁原內嵌的媒體(圖, flash等): 圖會額外儲存一份。離線時,APP、桌面軟體仍可以讀取網頁圖片。 https://planetoid.info/images/Icon_exclaim.gif擷取的網頁版面,可能會跟原始網頁不同。
  • 內嵌連結的文字可以點選: 可
  • 保留存檔日期: 有
  • 保留原始網址: 有
  • 資料組織與利用: (1)可以下 tag (2)搜尋內文、圖內文字($)
  • 複合書籤搜尋: 有。例如: 輸入 tag:TAG1 tag:TAG2 keywords 搜尋同時標籤 TAG1TAG2 ,並且包含關鍵字 keywords 的記事內容。

Pocket + Evernote 整合的試用紀錄

  1. 使用手機上的 Pocket APP 分享到 Evernote APP:Evernote 結合 Pocket,無紙化也能擁有高效率
    • 與Pocket儲存的網頁內容一致: 是
  2. 使用 IFTTT Create an Evernote when I fav an article in Pocket by neyal - IFTTT [Last visited: 2015-02-27]
    • 與Pocket儲存的網頁內容一致: 否,僅有摘要(內文的前面部分) Icon_exclaim.gif
  3. 使用 IFTTT When I favorite something in #Pocket, convert it to #PDF and put it in #Evernote by shanrep - IFTTT [Last visited: 2015-02-27]
    • PDF沒有順利產生 Icon_exclaim.gif

桌面軟體

比較表

核取 方法 檔案類型 網頁原內嵌的媒體(圖, flash等) 內嵌連結的文字可以點選 保留存檔日期 保留原始網址 資料組織與利用
Fx 2.0: 另存新檔(網頁,完整封裝) html 另有目錄儲存 yes yes no
Fx 2.0: 另存新檔(網頁,只存html) html , 未儲存 yes yes no
Fx 3.6 + ScrapBook 1.3.7 html 另有目錄儲存 yes yes* yes 搜尋/加註解; 結合ScrapBox.net可上傳至網路儲存空間, 詳bobchao說明 (網頁相關檔案數若太多,上傳時間較久)
Firefox browser_firefox.png v.15 + MAF 2.x: Save as MAFF MHT Archive mht 內嵌在單一檔案內 yes yes yes
Fx 2.0 + Google Toolbar for Firefox 3: Send with Gmail html , 使用原媒體的網址 yes yes yes 搜尋/加標籤(label)
Zotero 3.x for Firefox browser_firefox.png v.10 html 另有目錄儲存(不儲外連的CSS檔) yes yes* yes 搜尋/ 分類/標籤(tag)/ 加註解/ 書目格式輸出
IE 6.0.x: Save as MHT mht 內嵌在單一檔案內 yes yes yes
Acrobat PDFMaker 7.0.5 pdf 內嵌在單一檔案內 yes yes yes
列印到 Adobe Acrobat Printer虛擬印表機 pdf 內嵌在單一檔案內 no yes yes
Google chrome瀏覽器 v.26+ (預設啟用的plugin: Chrome PDF Viewer) pdf 內嵌在單一檔案內 yes yes yes 列印選項,「邊界」要選預設,才會在頁頭頁尾顯示日期、網址等資訊。
列印到 pdfFactory Pro v2.45 虛擬印表機 pdf 內嵌在單一檔案內 no yes yes
IE + Adobe Acrobat 7: 直接轉換網頁為PDF pdf 內嵌在單一檔案內 yes yes no
Unipage Unifier 1.0 RC3(網頁完整封裝)(中文說明) html 內嵌在單一檔案內 yes yes no

線上網頁轉檔成PDF服務

核取 方法 檔案類型 網頁原內嵌的媒體(圖, flash等) 內嵌連結的文字可以點選 保留存檔日期 保留原始網址 資料組織與利用
Convert Web/HTML to PDF Free Online by Nitro PDF Software 線上直接轉換網頁為PDF pdf 內嵌在單一檔案內 yes yes no last visited: 2009-03-29
Web2PDF 線上直接轉換網頁為PDF pdf 內嵌在單一檔案內 yes no no last visited: 2010-07-24
PDF Converter, HTML to PDF Converter For Free線上直接轉換網頁為PDF pdf 內嵌在單一檔案內 no yes no last visited: 2009-06-02
WebKut(中文說明) 直接轉換網頁或選取網頁區域為PDF pdf 內嵌在單一檔案內 no yes no last visited: 2009-04-02

其他


  • 桌面軟體可結合Desktop search建立索引檔,利於再使用。

需「維持網路連線」瀏覽網頁存檔的方案

摘要

  1. 免費服務中最好的是 Archive.is 可以同時儲存網頁內嵌的圖,如果原始網頁遺失,還能保留完整資訊。
  2. 付費書籤服務首選Evernote,因為即使是需要登入帳號密碼的網頁,也可以順利擷取。如果單純備份公開網頁的書籤服務,則可以選擇 Pinboard ,加入書籤網址之後,則會自動擷取網頁內文與內嵌的圖。

書籤網站列表與比較

Good.gif Archive.is - webpage capture [Last visited: 2014-02-28]

  • 檔案類型: 網頁 (例: 維基百科的備份)
  • 備份網頁原內嵌的圖: 圖會額外儲存一份, flash不會。
  • 內嵌連結的文字可以點選: 可
  • 保留存檔日期: 有
  • 保留原始網址: 有
  • 備份需登入帳號的網頁: 不可
  • 資料組織與利用:

Justaple [Last visited: 2011-10-27]

  • 檔案類型: 保存了圖片、大部分的Flash、網頁樣式
  • 備份網頁原內嵌的圖: 可
  • 內嵌連結的文字可以點選: 可
  • 保留存檔日期: 可
  • 保留原始網址: 可
  • 備份需登入帳號的網頁:
  • 資料組織與利用: 資料夾方式組織; 僅能有20個不公開的網頁存檔; iPhone app提供離線瀏覽功能 (access: 2011-10-27)

WebCite [Last visited: 2015-06-28]

  • 檔案類型: 網頁 (例: 維基百科的備份)
  • 備份網頁原內嵌的圖: , 使用原媒體的網址
  • 內嵌連結的文字可以點選: 可
  • 保留存檔日期: 有
  • 保留原始網址: 有, 可瀏覽不同時間的備份
  • 備份需登入帳號的網頁: 不可
  • 資料組織與利用: 可透過搜尋 WebCite query page

toread (不含圖檔, 部份中文字呈現亂碼)

  • 檔案類型: 網頁(Email 方式)
  • 備份網頁原內嵌的圖: , 使用原媒體的網址(相對路徑的圖形才能順利顯示)
  • 內嵌連結的文字可以點選: 可
  • 保留存檔日期: 有
  • 保留原始網址: 有
  • 備份需登入帳號的網頁:
  • 資料組織與利用: 建議結合Gmail的標籤(label), 啟用Gmail POP3即可下載離線; 網頁擷取自瀏覽器的網頁暫存(local cache),可結合Aardvark Firefox Extension選取網頁中要備份的特定區域。

使用 IFTTT (IFTTT recipe: If new link post at Facebook, then save for later) 備份自己 facebook 塗鴉牆張貼的連結的網頁全文: 稍後閱讀的服務,有協助抓全文。除了 Pocket 還有 instapaper 或 readability 可以選擇。另外,如果是書籤服務 diigo 或 pinboard 的付費會員,也可以協助儲存全文。不過,嘗試將這些稍後閱讀的服務界接到 Evernote 都沒法是全文。 [Last visited: 2014-12-11]

  • 檔案類型: 網頁
  • 備份網頁原內嵌的圖: 圖會額外儲存一份
  • 內嵌連結的文字可以點選: 可
  • 保留存檔日期: 有
  • 保留原始網址: 有
  • 備份需登入帳號的網頁: 可
  • 資料組織與利用:

Evernote $ [Last visited: 2015-06-28]

  • 檔案類型: 網頁、PDF
  • 備份網頁原內嵌的圖: 圖會額外儲存一份
  • 內嵌連結的文字可以點選: 可
  • 保留存檔日期: 可
  • 保留原始網址: 可
  • 備份需登入帳號的網頁: 可 Good.gif
  • 資料組織與利用: 搜尋 /加標籤(tags) /可加註解/ 安裝桌面端軟體便可離線

Diigo $ [Last visited: 2015-06-28]

  • 檔案類型: 網頁、圖、PDF
  • 備份網頁原內嵌的圖: 備份網頁時,預設不會儲存圖檔,需要手動逐張儲存圖片至Diigo
  • 內嵌連結的文字可以點選: 可
  • 保留存檔日期: 有
  • 保留原始網址: 有
  • 備份需登入帳號的網頁: 不可
  • 資料組織與利用: 加標籤(tags) /可加註解
    搜尋範圍: 網頁標題、標籤、註解、網頁網址、快取的網頁內文。

Pinboard $ [Last visited: 2015-06-28]

  • 檔案類型: 網頁
  • 備份網頁原內嵌的圖: 可。保存了圖片、網頁樣式(每個網頁32MB大小限制)
  • 內嵌連結的文字可以點選: 可
  • 保留存檔日期: 可
  • 保留原始網址: 可
  • 備份需登入帳號的網頁: 不可
  • 資料組織與利用: 標籤; 搜尋範圍: 網頁標題、標籤、註解、快取的網頁內文、網頁網址(bug)。 Icon exclaim.gif不包含網頁網址。

(left blank intentionally)

服務名稱
* 檔案類型: 網頁、圖、PDF
* 備份網頁原內嵌的圖:
* 內嵌連結的文字可以點選: 
* 保留存檔日期: 
* 保留原始網址: 
* 備份需登入帳號的網頁: 
* 資料組織與利用: 

停止的服務: BackupUrl.com, Yahoo My Web 2.0 Beta(中文)

其他同類型軟體

砍站軟體:


相關文章: