真夜中のプロジェクト

国立研究開発法人ジプシーのぼんやりした日記

Yahoo! Pipes

仕事でRSS未配信サイトからの情報取得で入り用になったので使ってみた。
出来たっぽいので情報共有メモ

  • 参考リンク

Yahoo! Pipesを知るためのエントリ詰め合わせ
全部は読んでないけど、リンク先にあるように上の5,6個のサイトを読めば概要が判って使えるようになるかと。
8番目のリンクが自分にとっては有用でした。正規表現のワナ的な部分の解説があったので。

  • 概要

INCFのサイトのUpcoming Eventsの更新情報を自動取得する

  • RSS未配信のページの場合はfetchモジュールとRegexモジュールの使い方が肝。ソースの閲覧は誰でもできるようなので参考までに。
    • コピーして使うこともできるのかな?
  • 元のHTMLソースを読んで繰り返しの部分を利用してFetchモジュールで記事毎に分解する
    • h3 class="resourcesTitle"からh5 class="hiddenStructure"までとした
  • Filterモジュールで記事毎の要らない部分をカット
    • ここはもしかしたらFetchモジュールでも出来るのかも?
  • RenameモジュールでRSS用にtitleとlinkとdescriptionにitem.contentsから割り当てる
    • 全部CopyだとContentというのが記事に残るので最後の一つはCopyではなくRenameにした方が良いかも?
  • Regexモジュールで正規表現を使って置換というか要らない部分をまた捨てる
    • titleもlinkも同じ物を割り当てているので捨てる部分が少し違う
    • descriptionはもう少し整形しても良いかな?とは思うけどまぁ良いや、自動的に取ってくるのが目的だし。
  • はまったのはRegexモジュールでの正規表現でlinkが取り出せる記事と出来ない記事が出てきて違いが良く判らなかったのですがどうやらルールを記述するボックスに無駄なスペースが入っていたためみたい。これに気づくのに大分掛かった・・・

V2エンジンだとなんか動かないのでV1エンジンで作成、動作確認。
職場はXOOPS Cubeでサイト構築しているのでできあがったPipeをd3pipesモジュールに入力しておしまい。
向こうが更新したらこちらのサイトでも情報が更新されるので便利