ろじっくぱらだいす全文配信フィードをPipesで書いた

CSSばっかりだったと思ったら、もうPipes以外の創作意欲がわいてきません。ってなワケでで、ろじっくぱらだいすの全文配信フィードを書いてみました。ちなみに8/31の日想RSS対応って書いてあったんですが、なんかうまく受信できないので、自分で作りました。
http://pipes.yahoo.com/momizine/logic

実構成は、ろじぱらの構成はnameタグのアンカーがメインなので、そこに合わせたitem.link調整をおこなっていくのがポイントでしょうか。

流れ

1.Fetch Page

Fetch Pageで日想の一覧データを取得し、</a>タグごとにぶったぎる。

0.content:2008年10月上旬
1.content:2008年10月中旬
2.content:2008年10月下旬
3...
2.Regex

Regexで切ったタグのうちのhref="hogehoge"のhogehogeだけ抽出

0.content:http://logipara.com/daytalk/200810a.html
1.content:http://logipara.com/daytalk/200810b.html
2.content:http://logipara.com/daytalk/200809a.html
3...
3.Filter

Filterでhttp://を抽出して上記のhogehogeがないものを削除する

10月下旬の削除(下旬はまだ日想がないため、<a>タグを探してnullを返している(ような気がするから)
4.Rename

Renameで上で作ったものをlinkと名前を変更する

content→link
5.Loop処理でFetch Page

Loop処理でFetch Pageをまわし、linkと名づけたhttp://hogehogeのページをそれぞれ全部参照して、さらに日ごとの日想でぶった切る。

0.content 日想全部
1.content 日想全部
2.content 日想全部
3...
6.Rename

Renameでcontentとなっている部分にそれぞれtitleとdescriptionと名づける

0.title 日想全部
0.description 日想全部

1.title 日想全部
1.description 日想全部

2.title 日想全部
2.description 日想全部

3...
7.Regex

Regexでtitle部分を見出しの日付に修正し、descriptionの部分を正規表現で整形する。

0.title 日想の見出し(日付)
0.description 日想の見出しに合わせた本文

1.title 日想の見出し(日付)
1.description 日想の見出しに合わせた本文

2...
8.Rename

Renameでtitleをlinkにコピーする

title(2008.10.05とか)をlinkにコピー
上のほうで作ったlinkはすでにcontent時に破棄済み
9.Regex

Regexでlinkをそれぞれ、置き換える。

-4桁の0-9の数字かつ2桁で0-9の数字かつ0と0-9の数字なら2桁で0-9の数字かつ0と0-9の数字の後ろにaをつける
-4桁の0-9の数字かつ2桁で0-9の数字かつ1と0-9の数字なら2桁で0-9の数字かつ1と0-9の数字の後ろにbをつける
-4桁の0-9の数字かつ2桁で0-9の数字かつ2か3と0-9の数字なら2桁で0-9の数字かつ2か3と0-9の数字の後ろにcをつける
10.Reverse

Reverseをなんとなくいれてみる。

まとめながら意味は無いような気がしている。
11.loop処理でURL Bulider

loop処理でURL Buliderをまわして、作ったlinkの頭にhttp://loggipara.comをつけてお尻に.html#を追加し、nameタグを追加して絶対パスのlinkを作成する。

http://loggipara.com/daytalk/作ったlinkアドレス[アルファベット].html#タイトル(アンカーリンク)
12.Sort

Sortでlinkアイテムを降順に並び替えて最新のものが上になるようにする。

所感

ぱっとみると明らかにdescriptionの正規表現のところがショボいです。あとはpubDateについてですが、どうしてもエラーから抜け出せないので作るのをやめました。
簡単に正規表現を書くツールなんてないかな。オススメお待ちしております。