分類の難しさ。

ブログというのは、結構雑多な内容になりがちである。

日記や、本来的な意味でのブログ(weblog)は、ほぼ内容が統一されているが、実際には、日記あり、ウェブログあり、エッセイあり、憤慨してみたり、アイデアの断片を書いてみたり、とぐちゃぐちゃである。さらに、主題別に分類すると、たとえば、このブログでは、音楽やら、図書館・情報やらに分かれる。

問題は、ある記事を分類する際に、一つにしぼれない、という点である。

まず、前述のように、記事の体裁と主題で分けると、ある記事をどちらに分類するか迷う。

(音楽に関わる日記は「音楽」か「日記」か)

さらに、主題別分類でも、2つ以上の主題に関わる内容だと、これまた迷う。

(ネットでの音楽の流通について書いた記事は「音楽」か「情報」か)

当然、紙媒体の資料を扱う、図書館の分類でもこの問題があり、分類を行うものの裁量で、この中から1つを選ぶ(それ以外を補記する場合も)。よって、利用者が考える分類との齟齬が起こると、なかなか資料を見つけられない事もある。

で、現在では、googleの台頭もあり、恣意的な分類より、全文検索が一般的になっている。これはこれで、特に探し物には便利なのだが、「読み物」を探すには、意外と不便である。

探したいものが漠然としているために、的確な検索ワードが思いつかないのだ。

そのため、比較的関連性の高い語で検索するわけだが、そうした語はしばしば汎用的で抽象的なために、結果は茫漠としている。

昔から、優良なコンテンツ群(特定のコンテンツでなく、ブログや、Webサイトなど、ある程度大きなまとまり)を見つける、もっとも信頼できる情報源は、個人のリンク集である。

良質なリンク集は、無駄を省き、厳選されたコンテンツ群へリンクしている。あえて網羅的でない点が良い。

しかし、ブログやwikiが普及し、なんだか個人のwebの存在感が薄れ、リンク集を見る事も少なくなってきている。あるにはあるんだろうが、見つけられない。

最近はWeb上でブックマークを共有するサービスもあるようなので、リンク集に変わる存在になるのかもしれない。

googleはサーバに保存する個人のブックマークサービスを行っているが、これ、膨大なリンク集をgoogleが持ってるということになる。ブックマークを利用しても、公開はされないので、公開ブックマークサービスにくらべ、より、通常のブックマークに近いデータが得られる。

こうして得たデータは、個人を特定せず、システムによって最適化したかたちで、利用される、あるいはすでに利用されているだろう。どこまでも周到な人たちである。

かなり横道にそれたが、ブログの記事のカテゴライズ。

一つの記事に複数のタグをつけるのが一番いいだろうと思う。

flickrのように不特定多数がタグをつけるのもよいが、大多数の個人ブログではあまり意味がなさそう。

自分でつけるのもよいが、過去の記事にタグをつけるはめんどくさそう。

NDCみたいな分類表から選ぶのがいいだろうか。ううむ。

さっさと意味解析のシステムが一般化してほしいものだ。

*文ぐちゃぐちゃですいません。

気が向いたら推敲します(たぶんしない)。