今治市水道局水源状況の内容をPlaggerで自動保存する

2006-09-13を参考にCustomFeed::Configを使ったら一応できた。

author: wireself
match: http://www\.imabari-suidou\.jp/left\.html
extract: <title>(.*?)</title>.*?<body bgcolor="#FFFFFF" MARGINWIDTH="8" MARGINHEIGHT="0" LEFTMARGIN="8" TOPMARGIN="0">(.*?)</body>
extract_capture: title body
global:
  plugin_path:
    - C:\Perl\site\lib\Plagger\Plugin
  assets_path: C:\Perl\site\lib\Plagger\assets
  timezone: Asia/Tokyo
  log:
    level: info
  cache:
    base: C:\plagger

plugins:
  - module: Subscription::Config
    config:
      feed:
        - http://www.imabari-suidou.jp/left.html

  - module: CustomFeed::Config

  - module: Filter::Rule
    rule:
      module: Deduped
      compare_body: 1
      path: C:\plagger\dedupe-tamagawadam.db

  - module: Publish::Gmail
    config:
      mailto:   hoge+tamagawadam@gmail.com
      mailfrom: hoge@gmail.com
      mailroute:
        via: smtp_tls
        host: smtp.gmail.com:587
        username: hoge@gmail.com
        password: PASSWORD

でもってコマンドプロンプト

C:\>schtasks /create /SC DAILY /ST 18:00:00 /TR "plagger.bat -c c:\plagger\config-tamagawadam.yaml" /TN 玉川ダム

てな感じで毎日18時に実行するようにしてみた。


しかしまあ、見ての通りひとつのページのbodyタグの中身を全部すっぱりメールで送ってるだけなワケで、これがPlaggerでできること、というかPlaggerでないとできないことなのか?とか尋ねられるまでもなく甚だ疑問だったりもするがそんなことは考えてはいけない。