ろじっくぱらだいす全文配信フィードをPipesで書いた
CSSばっかりだったと思ったら、もうPipes以外の創作意欲がわいてきません。ってなワケでで、ろじっくぱらだいすの全文配信フィードを書いてみました。ちなみに8/31の日想にRSS対応って書いてあったんですが、なんかうまく受信できないので、自分で作りました。
http://pipes.yahoo.com/momizine/logic
実構成は、ろじぱらの構成はnameタグのアンカーがメインなので、そこに合わせたitem.link調整をおこなっていくのがポイントでしょうか。
流れ
1.Fetch Page
Fetch Pageで日想の一覧データを取得し、</a>タグごとにぶったぎる。
0.content:2008年10月上旬 1.content:2008年10月中旬 2.content:2008年10月下旬 3...
2.Regex
Regexで切ったタグのうちのhref="hogehoge"のhogehogeだけ抽出
0.content:http://logipara.com/daytalk/200810a.html 1.content:http://logipara.com/daytalk/200810b.html 2.content:http://logipara.com/daytalk/200809a.html 3...
3.Filter
Filterでhttp://を抽出して上記のhogehogeがないものを削除する
10月下旬の削除(下旬はまだ日想がないため、<a>タグを探してnullを返している(ような気がするから)
4.Rename
Renameで上で作ったものをlinkと名前を変更する
content→link
5.Loop処理でFetch Page
Loop処理でFetch Pageをまわし、linkと名づけたhttp://hogehogeのページをそれぞれ全部参照して、さらに日ごとの日想でぶった切る。
0.content 日想全部 1.content 日想全部 2.content 日想全部 3...
6.Rename
Renameでcontentとなっている部分にそれぞれtitleとdescriptionと名づける
0.title 日想全部 0.description 日想全部 1.title 日想全部 1.description 日想全部 2.title 日想全部 2.description 日想全部 3...
7.Regex
Regexでtitle部分を見出しの日付に修正し、descriptionの部分を正規表現で整形する。
0.title 日想の見出し(日付) 0.description 日想の見出しに合わせた本文 1.title 日想の見出し(日付) 1.description 日想の見出しに合わせた本文 2...
8.Rename
Renameでtitleをlinkにコピーする
title(2008.10.05とか)をlinkにコピー 上のほうで作ったlinkはすでにcontent時に破棄済み
9.Regex
Regexでlinkをそれぞれ、置き換える。
-4桁の0-9の数字かつ2桁で0-9の数字かつ0と0-9の数字なら2桁で0-9の数字かつ0と0-9の数字の後ろにaをつける -4桁の0-9の数字かつ2桁で0-9の数字かつ1と0-9の数字なら2桁で0-9の数字かつ1と0-9の数字の後ろにbをつける -4桁の0-9の数字かつ2桁で0-9の数字かつ2か3と0-9の数字なら2桁で0-9の数字かつ2か3と0-9の数字の後ろにcをつける
10.Reverse
Reverseをなんとなくいれてみる。
まとめながら意味は無いような気がしている。
11.loop処理でURL Bulider
loop処理でURL Buliderをまわして、作ったlinkの頭にhttp://loggipara.comをつけてお尻に.html#を追加し、nameタグを追加して絶対パスのlinkを作成する。
http://loggipara.com/daytalk/作ったlinkアドレス[アルファベット].html#タイトル(アンカーリンク)
12.Sort
Sortでlinkアイテムを降順に並び替えて最新のものが上になるようにする。
所感
ぱっとみると明らかにdescriptionの正規表現のところがショボいです。あとはpubDateについてですが、どうしてもエラーから抜け出せないので作るのをやめました。
簡単に正規表現を書くツールなんてないかな。オススメお待ちしております。