網頁備份
Jump to navigation
Jump to search
網頁歸檔備份的工具:
- 比較網頁儲存及歸檔的不同方案是否「內嵌連結的文字可以點選」、「保留存檔日期」、「保留原始網址」等基礎資訊是否保留? (English version: Archive of webpage)
- 將不同網站網頁資料,透過標籤方式重新組織。
比較說明
- 「內嵌連結的文字可以點選」:這部分對其他軟體/服務多不是問題。但是PDF檔的「直接列印到PDF的虛擬印表機」的產生方式,其內嵌連結的文字是無法點選的,即導致網址資訊會消失。(除非直接寫上網址或購買Adobe Acrobat使用內建的PDFMaker)
- 「保留存檔日期」:由於檔案本身已經內建日期屬性(在檔案的圖示上,按右鍵選「內容」,就可以看到檔案的「建立日期」),但是很容易因為儲存或FTP到不同媒體時,導致存檔日期有所變動,而Firefox + ScrapBook的方案比較好,會將這項屬性資訊額外儲存。
- 「保留存檔日期」與「保留原始網址」:這兩項均與學術論文寫作(書目格式)有關,在論文的參考資料部分,如果有引用到網路資料,必須註明網址以及存取日期。
- 行動性:現有可以完整封裝成單一檔案的方案,都未額外內嵌「保留存檔日期」或者會漏失一些資訊。
可「離線」瀏覽網頁存檔的方案
複合方案: 手機APP+線上服務
- 檔案類型: 網頁
- 網頁原內嵌的媒體(圖, flash等): 圖會額外儲存一份。離線時,APP仍可以讀取網頁圖片。 https://planetoid.info/images/Icon_exclaim.gif擷取的網頁版面,可能會跟原始網頁不同。
- 內嵌連結的文字可以點選: 可
- 保留存檔日期: 否

- 保留原始網址: 有
- 資料組織與利用: (1)可以下 tag ,但是不建議在這個服務作組織分類,單純作為未讀文章列表的用途 (2)搜尋標題或網址
- 檔案類型: 網頁
- 網頁原內嵌的媒體(圖, flash等): 圖會額外儲存一份。離線時,APP、桌面軟體仍可以讀取網頁圖片。 https://planetoid.info/images/Icon_exclaim.gif擷取的網頁版面,可能會跟原始網頁不同。
- 內嵌連結的文字可以點選: 可
- 保留存檔日期: 有
- 保留原始網址: 有
- 資料組織與利用: (1)可以下 tag (2)搜尋內文、圖內文字($)
桌面軟體
比較表
| 核取 | 方法 | 檔案類型 | 網頁原內嵌的媒體(圖, flash等) | 內嵌連結的文字可以點選 | 保留存檔日期 | 保留原始網址 | 資料組織與利用 |
| Fx 2.0: 另存新檔(網頁,完整封裝) | html | 另有目錄儲存 | yes | yes | no | ||
| Fx 2.0: 另存新檔(網頁,只存html) | html | 無, 未儲存 | yes | yes | no | ||
| ☆ | Fx 3.6 + ScrapBook 1.3.7 | html | 另有目錄儲存 | yes | yes* | yes | 搜尋/加註解; 結合ScrapBox.net可上傳至網路儲存空間, 詳bobchao說明 (網頁相關檔案數若太多,上傳時間較久) |
| ☆ | Firefox v.15 + MAF 2.x: Save as MAFF MHT Archive |
mht | 內嵌在單一檔案內 | yes | yes | yes | |
| Fx 2.0 + Google Toolbar for Firefox 3: Send with Gmail | html | 無, 使用原媒體的網址 | yes | yes | yes | 搜尋/加標籤(label) | |
| ☆ | Zotero 3.x for Firefox v.10 |
html | 另有目錄儲存(不儲外連的CSS檔) | yes | yes* | yes | 搜尋/ 分類/標籤(tag)/ 加註解/ 書目格式輸出 |
| ☆ | IE 6.0.x: Save as MHT | mht | 內嵌在單一檔案內 | yes | yes | yes | |
| Acrobat PDFMaker 7.0.5 | 內嵌在單一檔案內 | yes | yes | yes | |||
| 列印到 Adobe Acrobat Printer虛擬印表機 | 內嵌在單一檔案內 | no | yes | yes | |||
| Google chrome瀏覽器 v.26+ (預設啟用的plugin: Chrome PDF Viewer) | 內嵌在單一檔案內 | yes | yes | yes | 列印選項,「邊界」要選預設,才會在頁頭頁尾顯示日期、網址等資訊。 | ||
| 列印到 pdfFactory Pro v2.45 虛擬印表機 | 內嵌在單一檔案內 | no | yes | yes | |||
| IE + Adobe Acrobat 7: 直接轉換網頁為PDF | 內嵌在單一檔案內 | yes | yes | no | |||
| Unipage Unifier 1.0 RC3(網頁完整封裝)(中文說明) | html | 內嵌在單一檔案內 | yes | yes | no |
線上網頁轉檔成PDF服務
| 核取 | 方法 | 檔案類型 | 網頁原內嵌的媒體(圖, flash等) | 內嵌連結的文字可以點選 | 保留存檔日期 | 保留原始網址 | 資料組織與利用 |
| Convert Web/HTML to PDF Free Online by Nitro PDF Software 線上直接轉換網頁為PDF | 內嵌在單一檔案內 | yes | yes | no | last visited: 2009-03-29 | ||
| Web2PDF 線上直接轉換網頁為PDF | 內嵌在單一檔案內 | yes | no | no | last visited: 2010-07-24 | ||
| PDF Converter, HTML to PDF Converter For Free線上直接轉換網頁為PDF | 內嵌在單一檔案內 | no | yes | no | last visited: 2009-06-02 | ||
| WebKut(中文說明) 直接轉換網頁或選取網頁區域為PDF | 內嵌在單一檔案內 | no | yes | no | last visited: 2009-04-02 |
其他
- iWeb2x for Chrome
- 內嵌連結的文字可以點選: yes
- 保留存檔日期: no
- 保留原始網址: no
- Create PDF Online - HTML to PDF Conversion 輸入HTML文字,直接轉換成PDF
- iWeb2Print[Last visited: 2010-03-15] 教學:iWeb2Print 把你喜歡的網頁文章存成PDF檔
- 內嵌連結的文字可以點選: yes
- 保留存檔日期: no
- 保留原始網址: no
- 桌面軟體可結合Desktop search建立索引檔,利於再使用。
需「維持網路連線」瀏覽網頁存檔的方案
比較表
| 核取 | 方法 | 檔案類型 | 網頁原內嵌的媒體(圖等) | 內嵌連結的文字可以點選 | 保留存檔日期 | 保留原始網址 | 資料組織與利用 |
| Diigo (不含圖檔) $ | html | 無, 使用原媒體的網址 (可手動逐張儲存圖片至Diigo) | yes | yes | yes | 組織: 加標籤(tags) /可加註解 搜尋範圍: 網頁標題、標籤、註解、網頁網址、快取的網頁內文。 [Last visited: 2012-02-24] | |
| Evernote | html | 有 | yes | yes | yes | 搜尋 /加標籤(tags) /可加註解/ 安裝桌面端軟體便可離線 | |
| Justaple | html | yes, 保存了圖片、大部分的Flash、網頁樣式 | yes | yes | yes | 資料夾方式組織; 僅能有20個不公開的網頁存檔; iPhone app提供離線瀏覽功能 (access: 2011-10-27) | |
| Pinboard $ | html | yes, 保存了圖片、網頁樣式(每個網頁32MB大小限制) | yes | yes | yes | 組織方式: 標籤; 搜尋範圍: 網頁標題、標籤、註解、快取的網頁內文、網頁網址(bug)。 不包含網頁網址。 [Last visited: 2011-12-25] | |
| ☆ | toread (不含圖檔, 部份中文字呈現亂碼) | html(Email) | 無, 使用原媒體的網址(相對路徑的圖形才能順利顯示) | yes | yes | yes | 建議結合Gmail的標籤(label), 啟用Gmail POP3即可下載離線; 網頁擷取自瀏覽器的網頁暫存(local cache),可結合Aardvark Firefox Extension選取網頁中要備份的特定區域。 |
| ☆ | Yahoo My Web 2.0 Beta(中文) (不含圖檔) | html | 無, 使用原媒體的網址 | yes | yes | yes | 搜尋/加標籤(Tags)/加註解 |
| WebCite | html | 無, 使用原媒體的網址 | yes | yes | yes | 可瀏覽不同時間的備份 |
Archive.is - webpage capture [Last visited: 2014-02-28]
- 檔案類型: 網頁 (例: 維基百科的備份)
- 網頁原內嵌的媒體(圖, flash等): 圖會額外儲存一份, flash不會。
- 內嵌連結的文字可以點選: 可
- 保留存檔日期: 有
- 保留原始網址: 有
- 資料組織與利用:
停止的服務: BackupUrl.com
其他同類型軟體
- 网博士(Websaver)
- fishCode Library .NET Professional
- CyberArticle(網際知識管家)
- myBase - Free-form Database, Research Database, Knowledge Base Software, Notes Manager & Information Organizer
砍站軟體:
相關文章:
- 罐頭文章: Social bookmarking for saving the copy of webpages or pdf files
- 找不到網頁的可能解決方法
- 《純敏達康》 » Toread + Gmail:超快書籤儲存術 (last visited: 2007-01-28)
- (知識管理) Google Notebook (last visited: 2007-05-02)
- 資訊記錄管理軟體? - IT邦幫忙::IT知識分享社群 2008-12