Wikipedia:井戸端/subj/カテゴリの「上位」「下位」とは何を意味するのか

カテゴリの「上位」「下位」とは何を意味するのか[編集]

現在WikipediaではCategory:主要カテゴリを頂点とするヒエラルキー構造を持ったカテゴリ群によって各項目を分類しています。私はこうした分類において上位カテゴリは下位カテゴリの内容を包含するものだと理解していたのですが、実際の運用では必ずしもそのようにはなっていないようです。しかしカテゴリ相互の上下関係が包含関係を意味しないのだとすれば、カテゴリ全体の構造は順序集合の三つの公理を満たさなくなり、「上位」や「下位」といった概念自体が意味をなさないものになってしまいます。
この種の分類というのは論理的な整合性を確保しておかなければ却って混乱が生じる元であり、私としてはいい加減にやるくらいならむしろ何もしない方がましだと思っています。もちろん世界に存在する森羅万象を取り扱う百科事典である以上判断に苦慮する境界線上の事象も必ず生じますので集合論的な意味での厳密さを要求するべきではありませんが、こうした分類が項目の内容の理解を深めるものであるためには(比喩的な表現を用いるなら)測度ゼロの例外を除いて上位カテゴリが下位カテゴリを包含するようになっているべきだと思うのですが。
少なくとも私には「クラシック音楽家> ピアニスト > ジャズピアニスト」という並びは気持ち悪くて仕方ありません。このあたりについてみなさんはどのようにお考えでしょうか。よろしければご意見をお聞かせ下さい。(なおこうしたことを考えるきっかけになったのはノート:ターヤ・トゥルネンにおける議論です。初めの方は取り敢えずここで議論したいのとは別の論点ですので、アルビレオさんの7月1日付のご発言くらいから後を参照して下さい。)--sergei 2008年7月16日 (水) 14:00 (UTC)[返信]

必ずしも完全な包含関係を強いるものとは思いませんが、しかし奏者の分類であるピアニストの上位にジャンルの分類であるクラシック音楽家が置かれるのは変だと思います。ピアニストの下位には現代音楽のピアニストもありますし。この場合は例えばクラシックピアニストのようなカテゴリを設け、クラシック音楽家およびピアニストの下位カテゴリとする(クラシック音楽家ピアニスト)とするのが適切だと思います。- NEON 2008年7月16日 (水) 14:41 (UTC)[返信]
何かおかしいと思えば、修正すれば良いと思います。カテゴリ論ならWikipedia:カテゴリの方針等があります。(英語版ではピアニストの下位にあるCategory:分野別のピアニストにクラシックやジャズなど(下位18カテゴリ)を含んでいるようです。)--Frozen-mikan 2008年7月16日 (水) 14:59 (UTC)[返信]
ご意見ありがとうございます。取り敢えずもう少し様子を見て、自分の感覚があまりにコミュニティーの総意からかけ離れているというわけではないことが確認できたらCategory:ピアニストから変更を行っていこうかと思います。--sergei 2008年7月17日 (木) 12:02 (UTC)[返信]
Sergeiさんはウィキペディアのカテゴリの一般論の話をしたいのでしょうか、それともCategory:ピアニストについての各論の話をしたいのでしょうか? タイトルでは一般論の話のようですが、お書きになった内容では各論の話をしようとされているように読めます。実際にNEONさん、Frozen-mikanさんは各論の話だと受け止められたようです。
私の指摘は、一般論としてカテゴリの上下関係は、直接その上下のカテゴリだけで考えるべきであり、上下関係を集合のような包含関係として考えるべきではないということです。具体例として、「地理 > 都市」と「都市 > 都市伝説」のカテゴリ上下関係はそれぞれ成立する一方、それを組み合わせた「地理 > 都市伝説」は成り立たない(がそれで問題ない)を提示しています。
各論の話であれば、あくまで個々のカテゴリで考えることであり、おかしいところはどんどん修正していけば良い話です。ピアニストについては、修正すべきほどのものとは思いませんが、修正することに反対はしません。--アルビレオ 2008年7月17日 (木) 23:24 (UTC)[返信]
一般論としては形式概念分析が示す様に束論でとらえられる問題であって、推移律を期待するのは妥当だと思います (それが概念としてのカテゴリなら)。各論になりますが、「都市 > 都市伝説」というカテゴライズは概念としては不適切であって、むしろ推移律が成立していないカテゴライズについて妥当なカテゴライズになっているかどうか検証すべきでしょう。その意味で、推移律は検証手法の一つと考えることができます。--Jms 2008年7月17日 (木) 23:44 (UTC)[返信]
とりあえず各論の方が先に片付きそうだったので、そちらに言及しました。一般にカテゴリの上下関係について、カテゴリの方針において "ウィキペディア全体を意識した一貫性や無矛盾性" が要求されているところ、Jms氏が述べている推移律の充足を考慮すべきという方向性は正しいものと思います。むしろ、一つキーワード(この場合は「都市」)を介して迂回すれば上下ないしは包含関係を回避可、とする根拠が不明瞭です。都市と都市伝説の例はせいぜい関連カテゴリであって、直接の上下関係を成すものでは無いと思います。- NEON 2008年7月18日 (金) 02:16 (UTC)[返信]
私が議論を提起したかったのはWikipediaにおけるカテゴリの一般論についてです。Category:ピアニストの件は例示として挙げたに過ぎません。これについては変更を行う方向で考えていますが、推移律を期待すべきかどうかなど一般論については引き続き各位のご意見を拝聴できれば、と存じます。--sergei 2008年7月18日 (金) 09:08 (UTC)[返信]
では一般論を。データの関係はデータモデルで表せますが、大きく分けると階層型データモデル関係モデルに分けられます。階層型データモデルはデータを木構造で表現したもので、おそらくSergeiさんたちは暗黙的にこのモデルでカテゴリを考えているのではないでしょうか。
一方関係モデルはデータとデータの関係を考えるもので、データは必ずしも木構造では表せず、ネットワーク型の構造になることが普通です。
Wikipedia:カテゴリの方針では「親カテゴリが複数あって構いません」とされており、カテゴリは木構造ではないことになっています。カテゴリがネットワーク型構造であれば、データの特定の関係については包含関係が成り立ちますが、複数の関係を纏めて考えたときに包含関係や推移律が成り立つ保証はありません。(実際にはむしろ包含関係が階層になっていない関係や、推移律が成り立たない複数の関係をモデル化したものがネットワーク型データモデルであり、さらにそれを一般化したものが関係モデルなのですが)
ここで間違えないでほしいのですが、関係モデルでも「一貫性や無矛盾性」は要求されているのです。矛盾する関係が許されるわけではありません。たとえばループするような関係は認められません。但し、階層型モデルに比べて検証は困難です。
また、カテゴリの方針では「関連が深いキーワード」もカテゴリとして認められているので、そもそも上下のカテゴリは必ずしも包含関係には限定されていないことになります。
傍証としてCategory:都市を例にとると、そもそも親カテゴリが「社会」と「地理」の二つがあり、さらにサブカテゴリには「社会」や「地理」には含まれないカテゴリが複数存在しています。たとえばCategory:歴史上の都市Category:テーマ史を介してCategory:歴史に関連付けられていますが、「社会」にも「地理」にも含まれていません。
この例でも、部分的には推移律が成立しています(歴史 > テーマ史 > 歴史上の都市)が、任意の上下関係から演繹される関係には成立しないものが沢山あります。「地理 > 歴史上の都市」などは成立していないでしょう。
それでもネットワーク型データとしては許容される関係であり、カテゴリとしては問題ない構造です。
以下は私見になりますが、そもそも現実世界やそれをモデル化した日本語自体が階層型モデルで表現できるほど単純ではないので、それを分類するカテゴリも階層型モデルでは表現しきれないのだと思います。--アルビレオ 2008年7月19日 (土) 23:10 (UTC)--アルビレオ 2008年7月19日 (土) 23:10 (UTC)[返信]
前提としているのは木ではなく束です。順序があるかどうかが本質的であって、リレーショナルモデルかどうかは関係しません。「ループするような関係は認められません」というのは順序の存在ならびに上限と下限の存在を含意しているので束であり、結局は同じ事です。--Jms 2008年7月19日 (土) 23:23 (UTC)[返信]
カテゴリの上下関係には複数のルートが許されていて、そのルートの中では包含関係があるが、違うルートでは包含関係を持たないことがある、ということで合意されたと考えてよいでしょうか?--アルビレオ 2008年7月20日 (日) 01:19 (UTC)[返信]
「違うルートでは包含関係を持たないことがある」というのが半順序であって全順序でない、という意味ならそうですが、違うことをおっしゃっているのではないかと危惧します。--Jms 2008年7月20日 (日) 01:34 (UTC)[返信]
順序集合には詳しくないので誤解があれば指摘してください。私が前回言ったのは、カテゴリの上下関係に複数ルートがある場合の違うルートはそもそも上下関係が定義できない、です。カテゴリ全体の集合は順序集合ではない、ということになると思います。
前回の例を繰り返すと、(地理 > 都市)であり、(都市 > 歴史上の都市)ですが、(地理 > 歴史上の都市)でも(歴史上の都市 > 地理)でもなく、そもそも地理と歴史上の都市には上下関係はありません。--アルビレオ 2008年7月20日 (日) 03:15 (UTC)[返信]
「カテゴリの上下関係に複数ルートがある場合の違うルートはそもそも上下関係が定義できない」というのを、もっと丁寧に考える必要があります。A > X という包含関係と、B > X という包含関係があったとして、A と B の間に包含関係があるとは限らない、というのは全順序ではないということです。しかし、A と B の間に包含関係がなくとも、包含関係によってこれらは半順序集合になっています。推移律で問題とされているのは、A > P という包含関係と P > X という包含関係があった場合に、A > P > X となるべきだということであって、おっしゃっている事と直接の関係はありません。A > B という関係がさらに存在するなら別ですが、それをおっしゃっているわけではないでしょう。従って、推移律に関する今回の議論とは無関係なことを述べていらっしゃると考えます。
「地理」と「歴史上の都市」が上下関係にないとは、どういうことでしょうか。地理とは無関係に、すなわち、地理的座標系に置き得ないところに「歴史上の都市」が存在するということでしょうか。その都市はどんな都市なのでしょう、架空の都市でしょうか。その場合、地理の下に「架空の地理」というワンクッションをいれてその下に「架空の都市」とすべきであって、「歴史上の都市」とは違う扱いになるでしょう。都市伝説の場合は、都市という文字列でつながっているだけの、不適切なカテゴライズであることは既に述べた通りです。--Jms 2008年7月20日 (日) 03:36 (UTC)[返信]
順序集合によると、順序集合では推移律が成立していることが条件であり、カテゴリには推移律が成立しないケースがあるので、カテゴリは順序集合ではないことになります。順序集合でないものに対して全順序や半順序を考えるのは意味がないのではありませんか?
次に「地理」と「歴史上の都市」の関係について説明します。まず「歴史上の都市」は、そのまま「歴史上かつて存在した都市(都市遺跡)に関するカテゴリ。」です。従ってカテゴリとして「都市 > 歴史上の都市」であることは明白です。一方、歴史上の都市は現存する都市ではないので「地理」には含まれません。「歴史上の都市」に含まれる記事として、例えば十三湊がありますが、これは中世から近世にかけてあった湊であり、「歴史」で扱いますが、「地理」では扱わないのです。カテゴリに推移律が成り立たない場合の一例ですね。
なお、発散するのを避けるために前回はコメントしませんでしたが、カテゴリに「関連が深いキーワード」が認められているので、「都市伝説」が「都市」と文字列でつながっているだけでもカテゴリの関係として「都市 > 都市伝説」は不適切ではない、というのが私の立場です。--アルビレオ 2008年7月20日 (日) 11:30 (UTC)[返信]

どうも話がかみ合わない様です。包含関係は一般に順序を導入しますから、おっしゃっていることは、カテゴリは他のカテゴリを含んではいけないということを意味してしまいます。それでよろしいでしょうか、まさかそういう事を意図していらっしゃるとは思えないのですが。地理では過去の事象は扱わないということはないでしょうし、また、「都市」が都市伝説に対する「関連が深いキーワード」だというのも誤解でしょう。なお、形式概念分析的には「関連が深いキーワード」なカテゴライズもまた概念束に含まれます。--Jms 2008年7月20日 (日) 11:55 (UTC)[返信]

二点ほど。えーと、私(たち)が提起しているのはカテゴリの上下関係は推移律を満たしているべきであり、そうなっていないものがあるならそれは見直す必要があるのではないか、ということです。現状のカテゴリがそういう運用になっていないということはこの論点を無意味にするものではありません。順序関係も二項関係の一種ですのでネットワーク型データモデルと特に矛盾するものではないはずです。
それから各カテゴリのページには一番上にサブカテゴリ、一番下に親カテゴリがそれぞれ何の関連性もなく別個に表示されているだけです。したがって「A > X > B」というのは単に「A > X かつ X > B」の略記でしかなく、「A > X > B」かつ「C > X > D」は「A > X かつ X > B かつ C > X かつ X > D」を意味するに過ぎないと思います。ですから(一応{{Pathnav}}というものもありますが)アルビレオさんの仰る「ルート」という概念には意味がないのではないでしょうか。--sergei 2008年7月20日 (日) 14:48 (UTC)[返信]
推移律を満たさないカテゴリには上位ならびに下位カテゴリを設けない、というあたりが現実的妥協点かもしれません。そろそろWikipedia‐ノート:カテゴリの方針へ移った方が良かろうとつらつら見るに、Wikipedia‐ノート:カテゴリの方針#本項目と同名カテゴリ:Category:イギリスのバンド > Category:ビートルズ > ビートルズ を例として似た議論がなされています。もっともビートルズの方はラッセルのパラドックスに通ずる部分もあるので、より深刻ですが…。
いや、カテゴリって難しいですね…。Wikipedia:カテゴリの方針に問題があるとすればどこなんだろう、と眺めてみましたが、十分よくできた文書だとしか思えませんでした。強いて言えば「関連が深いキーワード」の部分でしょうか。この部分はカテゴリと項目の関係について言及しており、カテゴリとカテゴリの関係には適用されないとも解釈できると思います。項目の下には何かが属するということがないので、そう解釈すれば何か曖昧な関連性に基づいてカテゴライズが行われてもその曖昧さがほかへ拡散するのは防ぐことができます。関連性が深くても一方が他方を含む関係になっていないカテゴリ同士に上下関係を設定するというのは混乱の元でしかないように思います。
なお例示されている濃縮ウランは現在扱いが変わっているのでコメントアウトの形で注意を喚起しておきました。--sergei 2008年7月23日 (水) 16:21 (UTC)[返信]

話を整理したいのですが、今ひとつ理解しきれません。 SergeiさんやJmsさんはカテゴリは全体で推移律を満たしているべき、という主張だと思うのですが、それはカテゴリが木構造であるべきだ、という主張ではないのでしょうか。木構造ではなくネットワーク構造である、ということは、推移律を満たしていない部分がある、ということと等価だと思うのですが。--アルビレオ 2008年7月26日 (土) 00:46 (UTC)[返信]

推移律を満たしていて、木構造を満たしていない構造があります。たとえば束はそうした構造です。「ネットワーク構造である、ということは、推移律を満たしていない部分がある、ということと等価」というのはまったくの誤謬です。循環のない有向グラフならば、順序関係を持ちます。木であるかどうか、循環があるかどうか、順序があるかどうか、というのを混同していらっしゃるのではないかと思います。--Jms 2008年7月26日 (土) 01:42 (UTC)[返信]

正直言ってよくわかっていません。具体的に木構造ではないが全体で推移律を満たしている例を挙げて頂けませんか?--アルビレオ 2008年7月26日 (土) 03:20 (UTC)[返信]
既に述べた形式概念分析に例があります。必要な情報はすでに出ていますので、「よくわかっていません」の前に既に示されている資料を検討してから議論していただければ幸いです。--Jms 2008年7月26日 (土) 03:38 (UTC)[返信]