2008-02-07

The Structure of Collaborative Tagging Systems

前回の続きとして、hp Labで拾った興味深い論文の翻訳を記録用に掲示しておきます。

--------------------------------------------

2タギングと分類

支持者は、特にブログコミュニティーにおいて、しばし共同タグ付けのことについて分類システムに基づくラベル化を引き合いに出す。後者は階層的であり、排他的である。前者は非階層的であり、包括的である。同類による分類法は動植物のリンネ分類学や書籍においてのヂュイナー十進法(米国の十進分類法)、また電子書類を整理するためのファイルシステムを含む。それらのシステムにおいて、動物や本、ファイルなどは明確なカテゴリーに属し、そしてさらに普遍的なカテゴリーにも属している。例えば、ライオンや虎はヒョウ属である。猫はネコ属である。しかし、ヒョウ属と猫属のどちらもがネコ科に属し、ライオン、虎、猫のすべてがその一員である。同様にアフリカ地理学の本はヂュイナー分類法では916に該当し、南アメリカの方は918に該当する。しかし、どちらも地理学全般を含む900番分類に組み込まれている。
それと比べると、タグ付けは排他的でもなければ、階層的でもない。故にいくつかの状況では上記の階層的分類法より優れている。例として、ある研究者がアフリカ特有の猫に対する論文をダウンロードしたとしよう。もしこの研究者が手に入ったすべての論文を整理しようとしたら、ファイルシステムにはいくつかの想像しうる選択肢があり、そのうちの4つを検討するとしよう。
1. c:\書類\猫         すべての書類は「猫」フォルダーに入れる
2. c:\書類\アフリカ      すべての書類は「アフリカ」フォルダーに入れる
3. c:\書類\アフリカ\猫    すべての書類は「アフリカ」フォルダーの中の「猫」フォルダーに入れる
4. c:\書類\猫\アフリカ    すべての書類は「猫」フォルダーの中の「アフリカ」フォルダーに入れる

それぞれの選択は各々の特徴の相対的な重要度を反映している。フォルダー名と階層はその中ではラベルのように有益で、その範囲内で持っている情報の内容を示している。先に上げたフォルダー1番や2番は「猫」と「アフリカ」に対する重要な事実を作るが、しかし、ほかのすべての分類情報を無視している。
3番と4番は両方のカテゴリーを使ってファイルを分類しているが、最初のカテゴリを主要的に際立たせ、次のカテゴリーを従属的あるいは具体的なものとさせている。しかし、3番のフォルダーに入っているファイルを4番で探すことは無意味であり、複数の場所をチェックする必要が出てくる。
これらの限界にも関わらず、このような階層を課すのにいくつかのよい理由もある。特にフォルダーを無計画に作ることで、多くのものが階層にあることになるにもかかわらず、能率的に制作された階層はきちんと、そして明瞭にファイルの中身を反映する。キーワード検索のように、利用者が一つの問いに対して、すべての物があることを確信できないのとは違って、階層構造は検索者に含まれる物がすべて安定したところにあることを保証する。
階層型ファイルシステムとは対照的に、排他的ではない並列的なタグシステムは上述したシステムと違って、論文を同時に多様なキーワードで特定することができる。そこには「アフリカ」と「猫」のみならず、全般的な「動物」やさらに具体的な「チータ」をも含むことができる。

ベン図のように、猫とアフリカの両方のタグをつけた物は性格に一様に交差している。すなわち、アフリカの猫とタグ付けされた書類である。しかし、これも完璧ではない。例えば、「チータ」とだけタグ付けされた文書は恐らくそうであるべきなのに、「アフリカ」と「猫」の交差では見つけられない。上記の収納の例では検索者は依然複数の場所を探す必要がある。
別の見方をすれば、タグはフィルターのようである。すべてのタグをつけられた、可能性のある書類(あるいはそれ以外のもの)から、フィルター(すなわちタグ)はあるタグをつけたものだけを返してくる。
実施と質問に従いタグは交差を提供する代わりにタグの組み合わせを提供することができる。それはすべての与えられたタグに対応するものというよりむしろ、そのうちのどれかのタグに対応する全てのものを返す。利用者の展望から見て、タグによる誘導はキーワード検索することと似ている。実施に関係なく、ユーザーは適切な物を手に入れるための明確な記述項目を与えられる。

0 件のコメント: