PChome Mypaper RSS

From LemonWiki共筆
Jump to navigation Jump to search
icon_lemonade.png PChome新聞台自 2008-09-15 提供RSS訂閱功能,本文章停止更新。


使用Feed43 (Feed For Free) 服務,擷取PC home Online 個人新聞台最新文章資訊,產生RSS(預覽哈燒文章區RSS個站RSS)。

更簡單的替代方案:用Dapper輸出Mypaper的RSS (由於PCHome變更過內容樣式,下列搜尋語法可能需要略微更新)


步驟1. 指定網頁網址(Specify source page address (URL))[edit]

這個步驟指定網頁網址,建議選擇顯示最新文章列表網頁或索引頁面,通常是首頁。

  • 網址(Address)*: 輸入個站的網址。
  • 編碼(Encoding)*: 輸入big5-eten (香港文字編碼: big5-hkscs,關於Feed43 支援的編碼說明)
  • 載入網頁(Reload): 點選Reload按鈕,預覽是否順利載入


步驟2. 設定擷取方式(Define extraction rules)[edit]

RSS的組成通常是文章標題、網址及文章內容,因為個站首頁僅有文章標題及網址,所以個站RSS最後只會呈現這兩項。在這個步驟要定義出這個擷取區域。

  • 項目列表出現區域的搜尋語法(Item (repeatable) Search Pattern)*: 最新文章項目出現的區域(詳說明)。輸入下行設定後(如果您想要擷取其他個站,請自行將rxoaat更換成其他會員帳號。),按Extract按鈕,預覽是否順利載入。
 <a href="http://mypaper.pchome.com.tw/news/rxoaat/3/{%1}" title="{%2}"> {%2} </a><br/>
  1. {*} 代表任意字元。
  2. {%} 代表想要擷取的變數。
    1. 第一個{%}(以下稱{%1})是最新文章的部份網址(個人新聞台文章的靜態網址格式為 http://mypaper.pchome.com.tw/news/會員帳號/3/ㄧ連串的數字 )。
    2. 第二個{%}(以下稱{%2})是最新文章的標題。
如果按Extract按鈕後發生One of search patterns is too heavy or malformed錯誤訊息,建議過一段時間再點選一次按鈕或者精簡語法(詳說明)。


  • Extract成功會在Clipped Data文字方框出現 {%1} 與 {%2}。

步驟3. 設定輸出格式(Define output format)[edit]

資料來源的屬性(RSS feed properties)[edit]

  • 資料來源的標題(Feed Title)*: 輸入個站的名稱 (中文會出現亂碼)
  • 資料來源的網址(Feed Link)*: 輸入個站首頁的網址
  • 資料來源的描述(Feed Description)*: 輸入個站的描述 (中文會出現亂碼)

最新文章項目的屬性(RSS item properties)[edit]

  • 標題項目的樣式(Item Title Template)*: {%2}
  • 網址項目的樣式(Item Link Template)*: http://mypaper.pchome.com.tw/news/rxoaat/3/{%1}/ (如果您想要擷取其他個站,請自行將rxoaat更換成其他會員帳號。)
  • 內容項目的樣式(Item Content Template)*: 因為個站首頁僅有文章標題及網址,所以內容部分僅是重新組合文章的標題與網址。
 <a href="http://mypaper.pchome.com.tw/news/rxoaat/3/{%1}" title="{%2}"> {%2} </a><br/> 
  • 點選預覽(Preview)按鈕,看RSS是否順利呈現。

步驟4. 取得RSS資料來源(Get your RSS feed)[edit]


其他: 哈燒文章區RSS[edit]

哈燒文章區RSS的Item (repeatable) Search Pattern為

{%}</a>{*}"t12g">{%}...{*}table


相關文章/服務

RSS是一種XML格式,提供網站最近更新頁面中的資訊


RSS相關的外部連結