2002-12-02
_ フリーの編集者?
この天然さん(http://masao2002.tdiary.net/20021201.html)はいったい何ものなんだろう? フリーの編集者っぽい記述が見受けられるけど、この対人スキルのひどさで編集なんて出来るのか? それにしてもさいたまー!病院(http://www.aiseikai.or.jp/)を彷彿とさせるホームページ(http://www.masao-k.net/)だ。
_ いつまで経っても治らない
頭痛とだるさが全然取れないので今日は休み。この体調不良いつまで経っても治らないな。普通に安静に暖かくして熟睡して、大汗をかいてすっきり快癒したと思っても、ちょっと涼しいと感じるとすぐに元の木阿弥になる。なんか風邪とかではなく根本的な体調不良のような気がしてきた。といいつつ病院には行っていないんだけど。派手な症状がないとどうも病院に行く気がしないんだよなー。
_ TrackBackを実装する 2
TrackBackを実装するの続きを考えてみる。
情報を受け取るインターフェースと情報を受け渡すインターフェースは、その実装(管理)責任者が異なるため、分けて考えた方がいいだろう。同じシステム同士でのやりとりならば統一して考えることが出来るが、ひとまずはシステムに縛られない汎用的なインターフェースとして考えてみる。
情報を受け取るインターフェースというのは、
のが目的。
自システムの「どの記事(記事ID)」に対して、「どのような反応(外部サイトのURL、コメント本文、反応者情報(名前、メールアドレス、url))」を受けたかを受信し、記録する。具体的な処理に関しては、受信処理と記録処理の2段階に分けて考えた方がいいだろう。さまざまな拡張情報を受信しうるが、そのすべてを記録するとは限らないし、受け取った情報にシステムでさらに独自情報を付加して記録することもありうる。
情報を受け渡すインターフェースというのは、
- TrackBack通知を発信する
- TrackBackされる情報元として、情報ソース(引用文)を発信する
という2パターンがありそう。
後者はTrackBack関連のインターフェースというよりは、RSSとか2chのdat直読みみたいな、コンテンツのrawデータ(通常のWebブラウザ向けではないコンピュータ同士の通信用フォーマット)を受け渡す仕組みみたいなものなんで、そっち方面の機能として考えた方がいいのかもしれない。具体的な機能としては、あるURL(外部サイトの特定の記事を差す)を指定すると、自動的(ネットワーク経由で)にその本文を取り込んで、その記事を引用したコメントを記述するフォームが表示される、といったイメージ。もちろんその他TrackBack通知に必要な情報も自動的に取り込む。
そして前者がTrackBackの基本となる通知側の仕組み。いまいち把握し切れていないけれども、Movable Typeでは他のサイトへのTrackBack通知を送る仕組みは、あんまり洗練されたものが用意されていない気配。それはちょっといまいち。出来ればある記事urlを指定して「この記事にTrackBack通知する」みたいなコマンドを発行すると、付加情報を入力するフォームが表示されて、それをPOSTすると自動的にTrackBack通知が行われるみたいな感じになっているといいな。
もちろん上記みたいな流れはTrackBack通知専用のフォームという訳ではなく、自サイトのシステムで他のサイトの記事への反応記事を書くときに、反応元URLとしてTrackBack対応サイトのurlを書いておくと、そのurl文字列から自動的にTrackBackインターフェースの有無の問い合わせを行い、もしもTrackBackインターフェースが用意されていたら、自サイトの記事としての投稿処理を行う裏タスクで、反応元サイトへのTrackBack通知も行われる感じ。
現在のWikiLikeでは反応元を明示したblockquoteは使えないけれど、hnf互換コマンドを実装した場合は、たとえば、
CITE http://somedomain.com/somepath/?id=123 引用元名称 引用文引用文引用文引用文引用文引用文引用文 /CITE コメント本文コメント本文コメント本文コメント本文コメント本文コメント本文
みたいな記事をPOSTしたら、somedomain.com/somepath/に対してTrackBackインターフェースの存在確認を行い、もしも存在したらそのTrackBack受信インターフェースに対して、http://somedomain.com/somepath/trackback.cgi?id=123;author=someont;url=someurl;comment=somecomment;みたいな通知が自動的に行われる(という仕様には具体的にはいろいろ穴があるので要検討)。
データに関しては、最初は気軽にGET、POSTして引数渡しするのが手軽かなーと思っていたんだけど、本当に汎用インターフェースとして考えた場合に、日本語文字コードの問題とかが結構ややこしいことになりそうだ。Googleみたいにie=***;oe=***で文字コードを指定する手軽な実装方法もあるだろうけど、ここは逆にxmlで文字コード宣言をちゃんと行って、受信側が文字コードを適切に解釈すべしとしておいた方が、逆にあとあと面倒が少ないのかも。
_ コンテンツの分散管理 (13:48)
Web日記サービスみたいなもので、集中サーバーでデータの管理をしつつ、そのコンテンツの配信は各ユーザーがそれぞれアカウントをもつ個人サーバー領域で行う、って形式には需要があるのかなー。
たとえばtDiary.netみたいなところでは、コンテンツの管理から配信まで全部サービスしてくれるけれども、コンテンツの管理自体はtDiary.netでやりつつも、その最新日記ページおよび過去ログページについては、ftp経由で各ユーザーの個人サーバー領域に(差分)アップロードして、一般閲覧者はそっちを見るという形にしてしまうパターン。
メリット、デメリットを並べてみると、
- メリット
- サービスを提供するサーバーの負荷が大幅に低減できる
- サービスが終了してもユーザーには自分の管理サーバーに過去ログhtmlデータが残る
- 自分のページのurlを自分で選べる(日記ページだけ別サーバーとかならなくて済む)
- デメリット
- ユーザーのftpアカウントの管理を行うというセキュリティ的なリスクを管理者が負わなければならない
- 自動ftp関連の設定がちょっと(一般ユーザーには)難しいかも
ちょっと考えてみる価値があるサービス形態なのかも。特にASP(アプリケーションサービスプロバイダーの方ね)とかで商売をやる際に、こういうやり方でいけるものも結構ありそうだな。
_ 2003年F1エントリーリスト発表
- Arrows refused entry! Into the 2003 season - http://f1.racing-live.com/en/headlines/news/detail/021202113540.shtml
あらアロウズは申込みはしたけど、FIA側から断られてしまったのね。というのはまあどうでもよくって、ジョーダンのセカンドドライバーはまだTBA(to be announced:後日発表)なのね。佐藤琢磨はちょっとキビシイかもなー。スポンサー集めに走り回るようなタイプにはあんまり見えないし、いまどきの日本企業はF1スポンサー候補としてはいまいちだし。
2003-12-02
_ BkASPilからPOPFileに移行した (13:51)
スパムフィルターとして、BkASPil for Becky!2(http://b2antispam.s33.xrea.com/)をしばらく使っていたんだけど、仕事で頻繁にWindowsを落として(ブルースクリーン)いたら、そのたびに確実にBecky!が起動しなくなる原因がBkASPilにある(データファイルが一度壊れると致命的エラーになって起動しないっぽい)ことに気付き、しょうがないんでほかのスパムフィルターに移行することにした。で、ちょうどそこここで話題になっていたPOPFile(http://popfile.sourceforge.net/)を使ってみることにした。
ちなみにBkASPilは、インターネット上に公開されているスパムの送信元アドレスのブラックリストを使ってスパムを判別しつつ、またユーザー宛に来たスパムを簡単にブラックリストに登録することが出来る機能を用意することで、ブラックリストの鮮度を保つ仕組みになっている。結構大きなDBにネットワーク越しにアクセスするせいか、起動が重いという欠点があったけれども、スパム判別性能は結構良かった。特に海外スパム系の判別に強い。反面、国内スパムの判別にはちょっと弱いかも。
で、POPFileの方はスパムフィルターとしてはもはや定番になりつつある、ベイジアン理論を使ったソフト。ベイジアン理論ってのは、過去の統計から未来を予測するという、至極まっとうな理屈をコンピュータ上に載っけるための理論、だったはず(うろ覚え&確認なし)。
スパムフィルターなんかで使う場合は、メールのカテゴライズ(簡単にはスパムかスパムでないか)を人手によって行いつつ、そのメール中にどういう単語が含まれていたかを蓄積学習していき、その蓄積された情報を使って、新しいメールに含まれる単語情報から、そのメールがどのようにカテゴライズされるべきかを推測する、といった感じで使われる。
って仕組みなんで、別にスパムを判別するためだけにしか使えないわけではない。「文章中に含まれる単語(文章の構成要素)から、その文章をカテゴライズする」ことが可能なんで、汎用的なメール分類のためにも使える。というか、私の場合はPOPFileをスパムフィルターというよりは、スパムも判別してくれるメール分類ツールとして使っている。POPFileを使い始めてからは、今までBecky!のフィルタリングマネージャでいろいろ分類していたのをすっぱりやめて、すべてPOPFileに分類してもらうようにしてしまった(POPFileで分類された結果を、さらにフィルタリングマネージャで分類したりはしているけど)。
POPFileのインストールは、インストールマニュアル(http://popfile.sourceforge.net/manual/jp/manual.html)が充実しているんで、言うとおりに作業するだけで簡単に使えるだろう。ただ、結構仕組みはややこしいんで、使いこなすにはそれなりの知識が必要かも。
POPFileは、POP(メール受信プロトコル)のプロキシーサーバーとして自分のPC上で動作し、メールクライアントはまずPOPFileにアクセスし、POPFileが実際のメールサーバーにアクセスしてメールを取得し、妥当なフィルタリング(=加工)を行ってから、メールクライアントにメールを渡す、といった動作をするようになる。だから、メールクライアントの種類は選ばない。ただ、POPFile側の設定とメールクライアント側の設定の両方が必要。POPFileの設定はWebブラウザで出来るようになっている。単に動かすだけならばマニュアル通りにやればいいけど、理解して設定するにはそれなりの知識が必要だろう。
ちなみにベイジアンフィルターの説明のところで書いたように、この仕組みでは基本的に「まずユーザーがメールを手動で判別し、それによって学習した成果を利用して、新しいメールを自動的に分類する」ということになるんで、使い始めてしばらくの間は積極的にユーザーが判別情報を学習させる必要がある。作業としては、Webブラウザにメールのタイトル一覧が表示されるんで、それぞれのメールの種別をドロップダウンリストから選択していけばいい。
学習データが出来ると、POPFileはそれを元に自動判別を試みるようになる。けれど、最初のうちは情報が少ないんで結構間違える。間違っているものは正しい判別に修正して学習させると、次からは判別の精度が上がる。それを繰り返していくうちに、ほぼ自動的に正しい判別をしてくれるようになっていく。
POPFileでは、判別の種類は自由に設定できる。一番簡単な種類の設定としては、「スパム」「スパム以外」だろうけど、せっかく「あいまいっぽい」判別を行ってくれる仕組みがあるんだから、自分で便利なようにいろいろ種類を設定してしまったほうが楽しい。ポイントとしては、
- 文字列一致などで確実に判別できるものは、POPFileで判別させる必要がない(メーラーの標準機能で判別できるだろう)
- 単語要素があまりにも似通っていそうな分類は、POPFileは不得意そうなので、実用的にならないかも(やってみたら結構いけるかもしれないけど)
- 学習によって精度を高めていく仕組みなんで、後から判別種類を大幅に変えてしまったりしたら、学習のやり直しになってしまう。ある程度長いスパンで使えるような分類にした方がいいかも
- ベイジアンフィルターは結構負荷が高い処理らしいんで、あんまり無茶な数の分類にはしない方がいい(でも10個くらいなら平気そうだ)
ちなみに私は、「business」「personal」+[「admin」]+「commercial」「ml」「spam」「virus」+[「other」]+という分類で使ってみている。対象のメールアカウントは、私用・仕事あわせた全てのアカウント5個分。この分け方を使っていてうれしいのは、スパムとウイルスを判別してくれることと、正規の広告系メールをうまく分類してくれること。あと、仕事アドレスに来た私用メールとか、私用アドレスに来た仕事メールを分類してくれることも。このあたりが、通常の文字列一致系分類ではうまくいかなかったところ。
ただ残念なのは、POPFileは現時点ではAPOPには対応していないことか。せっかくうちのサーバーをAPOPサーバーにしたのにな。
2005-12-02
_ パワプロクンポケット8 (14:10)
絢爛舞踏祭は時間がなくて全然やらなかったし、久しぶりのゲームだなー。パワプロ自体はニンテンドー64版以来か。ゲーム自体はパワプロなんでふつうに楽しいんだけど、ニンテンドーDSってあんまり操作性よくないな。L、Rを間違って押しがちだし、移動ボタンももうちょっと押しやすくてもいいんじゃないかって感じ。今まで脳を鍛える大人のDSトレーニングしかやってなかったからコントローラ部って使ってなかったんだよな。あとあまりにもゲームが久しぶりすぎてアクションゲームが結構難しい。しょぼい横スクロールアクションゲームをクリアするのに3回もゲームオーバーになっちゃったよ。もしかしてシューティングゲームの弾避けとかもできなくなってるのかな?


_ uk [POPFileはAPOPに対応しています。 http://popfile.sourceforge.net/cgi-b..]
_ ishinao [実はもうPOPFileを使ってないのです……。 でもまた使うときがあるかもしれないので、そのときのためにAPOPが使..]