2003-02-11 [長年日記]
_ 書評リンクの話 3 (20:11)
ISBNはキーとして使えるのか、という話について。以下ISBN絡みについてのまとまった資料へのリンク。
- 日本図書コードの仕組み - http://member.nifty.ne.jp/rain/misc/isbn.html
まれに同一のISBNが別の書籍に振られている場合があるらしいけれども、楽天みたいに「出版日が新しいものを優先」ってことで、古い方は対象外にしてしまって構わない気がする。どうしても扱いたいならば、存在しないはずのISBN(風コード)を生成して無理矢理それで代替させるとか。
目的が「完璧な書誌データDBを作成すること」ではなく、「書評リンク集の基盤として使えるレベルの書誌データDBが欲しい」ならば、ISBNをキーに作成した書誌データDBでも十分に実用に耐えるだろう。イレギュラーなデータに対しては、運用でカバー(イレギュラーな対応を用意)で問題なさそう。
ISBNが不明な段階での書誌データ(主に新作を想定)に関しては、別テーブルにいったんデータを蓄えて、ISBNが定まった時点でメインのテーブルにデータを移行。ただし、書名や著者名による検索に関しては、そのテーブルに対してもメインテーブルと同様に(透過的に)行えるようにする。なんて感じでどうだろう?
あと、データフォーマットの話。タブ区切りテキストとかCSVとかだと、1フィールドに複数の情報をもたせるのがやりにくいのがガンなんだよな。適当なフィールド内区切り文字を予約して、それを使って表現することは可能だけど、そういう拡張をごちゃごちゃ考えるくらいだったら、はじめからその辺りまで吸収できるフォーマット(XMLとか)を採用した方が幸せになれる気がする。
というのは、そのデータフォーマットを再利用性のあるものとして扱いたい場合の話で、そこまで考えないならば、タブ区切りテキストとかCSVでも十分だと思う。その場その場で必要な情報を盛り込んだデータフォーマットを使うのは問題ないけれども、バックエンドで管理するデータに関しては多少リッチな情報をもっておいた方がいいよね、という話。いつでもリッチな表現(=解釈にかかるコストが大きい)を使うのはバカらしいけど、後付けで必要になってずるずる仕様を拡張するのも大変だしね。
_ Amazon.com Webサービスを試してみた (20:11)
Amazon.comのWebサービス(XML Webサービスの方ね)を試してみた。PHPからアクセスするのも簡単そう、というか環境設定の敷居が低そうなんで、いろんなサーバーで使えそうだ。Amazon.co.jpでも始まってくれたら、自前のDBに情報が見つからなかった場合は、自動的にAmazon.co.jpにアクセスして必要な情報をもってくるような、書誌データ集約サーバーとか簡単に作れそうなのに(という利用法はグレイっぽいけれども、まあ言い訳を用意するのもそんなに難しくないだろう)。Amazon.co.jpの方でWebサービスをはじめる予定はないのかなー。
_ 特に使うあてのないWiki (20:11)
特に使うあてのないWikiをPukiWikiで立ててみました。使いたい方がいれば適当に使ってください。情報集積所とか意見交換所とか。

