Wiktionary・トーク:カテゴリの付け方

出典: フリー多機能辞典『ウィクショナリー日本語版(Wiktionary)』
ナビゲーションに移動 検索に移動

このページの議論は Wiktionary:居酒屋 2006年8月4日 (金) 11:07:51 (UTC) の版、 Wiktionary:編集室 2007年2月12日 (月) 14:48:18 (UTC) の版、および、 Wiktionary‐ノート:カテゴリの方針 2007年10月24日 (水) 12:43:59 (UTC) の版の文章を含みます。

これまでの議論[編集]


新しい議論はここより下へ


「言語・品詞のカテゴリ」について[編集]

議論の整理お疲れ様です。

さて、2点ほど、

1.ラテン・アルファベット(に限った話ではないんですが)に別途ソートキーを入れる必要があるか?

日本語の場合はふりがなでもなければ、ソートの法則性が単純でないためちょっと困りますが、アルファベットのものはソートキーがなくても、とりあえずその順番には並んでくれるので、入力の手間がそれだけ省けます。確かに、大文字/小文字で分かれるというのは、好みに合わない人もあるかと思いますが、語頭が大文字であれば、固有名詞、略語とか、ドイツ語の名詞とか、法則性を持って分けられるので余り雑然とした印象はありません。

2.日本語のソートキーを[[Category:日本語|せきふん せきぶん 積分]]のようにする必要があるか?

これは、あまりにも面倒です。確かにカテゴリーの並びの趣味はあるかと思いますが、執筆者にとって負担感が大きいと思います。ちょっと気持ち悪いかと思いますが、原則ふりがなのみ(但し、濁点等除く)程度にしないと運用が期待されません。過去の議論をよく読んでなくて恐縮なのですが、多分、「索引」ページでなく「カテゴリ」を利用しようという結論になったのは、記事を起こすたびに、執筆者が「索引」に追加するのだと面倒とのことかとも思います。上記1.も併せて、執筆(かつ辞書編纂)の敷居はなるべく低くしておいた方が良いのではないでしょうか(そういう意味では、西洋語標準発音のIPA/X-SAMPA表示だとか、漢字標準の筆順とかは敷居が高いなあと思います)。    ---Mtodo 2005年9月1日 (木) 13:32 (UTC)
(本人コメント)当時はよく理解できませんでしたが、清濁が並ぶ場合この方法によるべきと現在は考えています。--Mtodo 2008年3月14日 (金) 18:00 (UTC)
  1. たとえば、英語を学習したての人にとってSaturdayなど、文頭が大文字で始まるとわかりにくいものもあります。つづりも日本語の意味もわからず、読みだけがわかるという状況はあまり無いかもしれませんが、並べられるならそれに越したことは無いと思います。法則性といっても、それらにはより細かいカテゴリがありますし。
  2. この方法を提案したNJTさんによると、徹底できなくとも大きな不都合が出ないことがこの方法の利点とのことです(漢字はNJTさん提案ではないですが)。つまり、一番前のふりがなだけ書いてくれれば後は任意というようなことを、この案に決定すれば後々書こうと思っています。とりあえず、今のところそこは一番目だけに変えておきます。
カズ 2005年9月2日 (金) 12:51 (UTC)
ローマン・アルファベットのページ(ドイツ語の名詞や固有名詞など大文字が原則の場合など特別な例はさておき)はいちいち総て大文字にしてソートする必要はないと思います。貼るだけでいいので。ダイアクリティカルマークや合字はどうでしょう?今手持ちの辞書がドイツ中心のドイツ語しかないので、言語的中立なソート方法はわからないのですが、ドイツ語ではウムラウトはダイアクリティカル・マークを抜いた字の次に、ßはssの次にという感じでした。--Shin-改 2005年9月4日 (日) 16:45 (UTC)

言語別分野別カテゴリ[編集]

Wiktionary‐ノート:カテゴリの方針 より転記。元々は Wiktionary:居酒屋 より。

分野別カテゴリも全部言語別にした方が良いかもしれないと思い始めました。例えばCategory:生物学とか複数言語が入り乱れると結局分割しなければならなくなると思います。cat:生物学の言語間リンクをたどってみた限りでは、まだどの言語版も確立したシステムがあるわけではないようです。英語版では Category:bs:Biology というものがあったりしますが。とりあえず案をあげますと:

  1. 品詞と同じようにする。[[Category:{{langcode}}_分野]]
  2. 日本語以外に言語コードをつける。例えば Category:bs:生物学。
  3. 日本語や英語など、語彙数がおおいものだけ用意しておく。

といったところです。1が統一できるし品詞と同じ形式でなじみやすいと思いますがどうでしょうか。e-Goat 2005年12月23日 (金) 16:33 (UTC)

分野カテゴリが[[Category:分野]]ですので、それのサブカテゴリということで[[Category:分野_言語名]]としたほうが直感的でわかりやすいかもしれません。言語コードを使うと編集するほうには便利ですが、閲覧者がわかるとは限らないので避けたほうがよいかと思います。--Brevam 2005年12月23日 (金) 19:16 (UTC)
とりあえず分野_言語の順にしようと思います。それで、言語の付け方の選択肢がいくつかあります。
  1. 日本語はつけない
  2. 全言語でつける
  3. 日本語や英語など項目の多いものにつける
これらについてはどうでしょうか。多言語かつウィキであることを考えると3かなと思っています。つまり、そのカテゴリである言語の単語が多くなったら(なりそうだったら)言語別に分割すると。e-Goat 2006年1月5日 (木) 11:47 (UTC) 2006年1月16日 (月) 21:34 (UTC)

ここまでの議論に対し、約一年後、Wiktionary:編集室2007-02-12T14:48:18 UTC 版にて

どうも最初の提案のように、[[Category:分野_言語名]]より[[Category:{{langcode}}_分野]]の方が統一されていて良さそうです。電気山羊 2007年2月12日 (月) 14:48 (UTC)

という見解が示され、これに異論が付かず、現時点での合意になっているようです。本方針 Wiktionary:カテゴリの付け方#言語・分野のカテゴリ に反映しておきました。節名も「分野のカテゴリ」から「言語・分野のカテゴリ」に変更しました。私自身、本方針と異なる慣行に戸惑っておりましたが、編集室をよく読んでこの合意事項に気付いた次第です。 --Kanjy 2007年10月6日 (土) 17:59 (UTC)

と思ったら Category:数学_英語 Category:数学_中国語 Category:数学_朝鮮語 がありますね。どうしましょう。既存の「分野_言語」型カテゴリは「言語_分野」型へ移行すればよいでしょうか。 --Kanjy 2007年10月6日 (土) 18:54 (UTC)

基本的に「言語_分野」へ移行で良いと思います。「分野_言語」が提案されたのは、「分野」からたどるとこちらの方が自然という感覚からだったのではないかと思いますが、「分野>言語_分野」というパスでも問題はなさそうです。分野_言語と言語_品詞が混ざると混乱しやすいので、言語ではじめる方が良いと思います。ところでWiktionary:カテゴリの方針Wkitionary:カテゴリの付け方は統合した方がよさそうですね。e-Goat 2007年10月7日 (日) 06:21 (UTC)

二つの文書を混同してしまい、すみませんでした。統合した方がよいかもしれませんね。あるいは、必ず守ってほしい最低限のルールを方針に、柔軟に対応すべき余地のある目安をガイドラインに、と整理して二つに分けた方がよいかもしれませんね。ところで、あちらの文書名が "Wik..." でなく "Wki..." なのはなぜでしょう。単に起草時の誤記だったのでしょうか。統合を検討する前に、あちらのノートで改名提案を出してみます。 --Kanjy 2007年10月18日 (木) 18:19 (UTC)

Categoryのツリー構成について[編集]

Wiktionary‐ノート:カテゴリの方針 より転記。元々は Wiktionary:居酒屋 より。

Categoryの品詞の構成がはっきりしていませんので、ここで議論したいと思います。

現在Categoryは以下のような構成になっています(例は日本語)。

  • 日本語
    • 動詞
      • (活用の種類ごと)
    • 名詞
      • サ変動詞
      • 色名
      • 固有名詞
    • 固有名詞
    • 季語
      • (季節ごと)
    • 代名詞
    • 副詞
    • 形容動詞
    • 形容詞
    • 助動詞
      • 未然
    • 助数詞
    • 助詞
      • 副助詞
      • 終助詞
    • 同音異義語
    • 感動詞
    • 慣用句
    • 成句
      • 努力
      • 友情
      • 生死
      • 肉親
    • 接尾辞
    • 接続詞
    • 接頭辞
    • 方言
    • 略語
    • 造語成分
    • 連体詞
    • 間投詞
    • 古語
      • 動詞
        • (活用の種類ごと)
      • 代名詞
      • 副詞
      • 形容詞
      • 助動詞
        • (接続の種類ごと)
      • 助詞
      • 枕詞

ここでいくつか問題かなと思うところがありますので挙げますと、

  1. 「固有名詞」は「名詞」の下位カテゴリにするか、「名詞」と同位にするかはっきりしていない
  2. 「数詞」は「名詞」の下位カテゴリにするか、「名詞」と同位にするか
    1. 英語では数詞を形容詞として使うこともあり、どう統一させるのか
  3. 「古語」は現代「名詞」などと同位カテゴリでいいのか、「古典日本語」(「古英語」とか)とするか
    1. 「方言」も同様
  4. 「成句」のジャンル分けはこれでいいのか(このわけ方の根拠は何なのか)
  5. 「慣用句」と「成句」
  6. 「季語」はどの階層に入れるべきか
    1. 「暦」と同じく「カテゴリ」の直下
    2. 「日本語」の直下
    3. 「名詞」の直下
  7. 「同音異義語」は必要か

まだあると思いますが、とりあえずこんなところで。他の言語との整合性(?)も考えてコメントしていただければうれしいです。--Ninomy-chat 2006年3月9日 (木) 09:07 (UTC)

品詞別のカテゴリは本当に必要だったのでしょうかね。季語はまとまっていることに意味があると思うのですが、動詞や形容詞をカテゴライズするのに意味があるのかやはり疑問です。活用する人がいないのであれば、メンテナンスしてくださっている方の手間になるばかりなので、やめてしまってもよいかなと思います。--Brevam 2006年4月9日 (日) 05:33 (UTC)
品詞別のカテゴリは、読むのにも編集に貢献するのにもとても役に立っていますので、止めないで頂きたいものです。--Midville 2006年5月15日 (月) 15:38 (UTC)

そうですね。とりあえずもう少しその当たりは様子を見ようかと思います。それから、一つ思ったのですが、日本語の難しい点でもある敬語のカテゴリが今はありません。敬語についてまとめたカテゴリがあってもいいと思ったのですが、いかがでしょうか。特に、誤用に関してまとめたページがあったらいいかなと思いました。--Ninomy-chat 2006年5月15日 (月) 06:59 (UTC)

敬語はちょこちょこ始めた段階で、まだお役に立ててなくて恐縮です……。話は変わりますが、日本語漢語と中国語の方でお決まりの「部首別索引」「画数索引」「音韻索引」と「ピンイン索引」の「声調あり版」と「声調なし版」を作りたいのですが、現行の Unicode 順に並んじゃうカテゴリの仕組みでもがんばればなんとかできますかね。将来的には CJKV 音韻対応表みたいなもので自動化できないかと。中国語の発音表記もまだないですね……。Danke--Midville 2006年5月15日 (月) 15:38 (UTC)
声調言語において、声調は単語構成要素の主要なものの一つなので、「声調なし版」は不要。―Soldupessi 2006年10月7日 (土) 01:01 (UTC)

古代日本語/和語 vs 日本語#語源 or #古語[編集]

Wiktionary‐ノート:カテゴリの方針 より転記。元々は Wiktionary:居酒屋 より。

議題をいくつも立てていて恐縮です。今のところアイヌ語を中心に貢献していますが、私の専門は古代日本語(古代和語)です。上代(古事記・日本書紀の時代)より前のことを指します。日本語の起源を探るための基礎資料となるもので、「日本語は○○語と関係がある」といった意見の分かれる少しアヤシイ議論とは異なります。例えば、火は上代には「ヒ(乙)fï」で、日「ヒ(甲)fi」とは区別されていた。さらに火の語幹が「fö」であるため、古代には「*föi<*pöi」という形をしていたと推定される(* は祖語推定形を表す記号、<は右が古い形と示す記号)、と議論を進める確立した学問です。これらを見出し語に語彙を追加したいのですが、イ段・エ段・オ段にそれぞれ甲乙二種類の発音がある8母音であって、必然的に現在の五十音では表せないので、例のように「ヒ(乙)」とか、さらに現在1モーラとなっている音節が二重母音であって、()付きカナでも書けず、例のように「föi」などとしか書けないものがあります。そこで、

  1. これらを「日本語 {{ja}}」として扱ってよいものか。
アルファベットが前に来るので日本語の索引が煩わしくなる。
すべてが語源でもないし、古語というにはいわゆる「平安時代のことば」より古すぎる。
必然的に、「ほのお(炎・焔)」の語源は fö-nö-wö「火の尾」と分かるし、「かがみ」の語源は kaga-mi「影見」と分かる場合もあるけれども。
  1. それとも「古代日本語」or「古代和語」として別立てするか。
「日本」という国号が立つ前の時代である。
  1. 現代日本語と調和する見出し語の立て方は。

など、みなさんのご意見を伺いたく。--Midville 2006年5月4日 (木) 18:33 (UTC)

現在、平安時代や奈良時代程度までを見た「古典日本語」というセクションがあります。カテゴリはCategory:日本語_古語です。お話しはそのさらに昔の言葉をどうするかということですね?
  1. 「日本語」としてよいのか
    いいんじゃないかと思います。アルファベットが気になるのであれば、日本語と別にCategory:古代日本語(仮)を作ればいいかと。また、見出し語も「ヒ」から「古代日本語」セクションの中で発音ごと分けて記述するのもありかと思います。多少発音が反映できていなくても{{pron}}で解説すればいいかと思いますし。
…わかりづらい意見ですね^^; --Ninomy-chat 2006年5月5日 (金) 02:47 (UTC)
ご指摘ありがとうございます。しかしながら残念なことに、学者の間でも、例えば /o/ と /ö/ の音価は何で、どう違っていたのかということは同定されておらんのです。ただ、違っていたということが分かるだけで。ですから、{{pron}} の中で、古事記の時代の人間ではない私は違いを具体的に説明できません。私なりに仮説はあるのですが、wik* でそれを書いてはいけないでしょう。Thanks--Midville 2006年5月5日 (金) 16:32 (UTC)
アルファベットで日本語カテゴリ内がごちゃごちゃになる気がするので、Category:古代日本語がよいのではないでしょうか?表記に使用する文字も違うようですし。その場合、古語と間違えられる方が出てくるかもしれませんので、カテゴリに注釈:上代より前の古い日本語と注釈を入れたほうがいいと思います。--Monaneko 2006年5月5日 (金) 15:53 (UTC)
Monaneko さん、はじめまして。関心を持って頂いて、ありがとうごさいます。アルファベットの件はやはりそうですよね。後段は、Category:日本語_古代 も望ましくない、ということを含意されていますよね。実際には、「上代以前(上代を含む)の日本語」です。全部、漢字(万葉仮名)で書かれていた時代の語彙、中国の史書に現れる和語の語彙、現代の方言に残っている古い形などが対象になります。Thanks--Midville 2006年5月5日 (金) 16:32 (UTC)
日本語と扱うかどうかですが、カテゴリとしては、分けるべき(サブカテゴリとするのは構わない)と考えます。カテゴリの中を一覧したときに、現代日本語の語彙でないものが混入してしまうのを避けたいからです。
jaの一部に入るかどうかについては、w:ISO_636を見ると、古英語や中英語には3文字コードが割り振られている一方、古典日本語や上代日本語には割り振られていません。その他の言語として扱うことも可能ですが、整理としては、文化的連続性もあるため、日本語の一種として扱うのがよいと思います。古英語も最近はアングロサクソン語と呼ぶよりは、連続性を重視して古英語と呼ぶ方が多いようですし。
名称については、Category:日本語_古代でもCategory:古代日本語のどちらの形式でもよいかと思いますが、古代と言うと中古すなわちいわゆる古語の時代まで含んでしまうため、古代ではなく上代または上古とするのがよいように思います。
なお、上記は見出し語として立てる必要があるという前提で書いています。現代日本語の見出し語の語源のセクションにおさまってしまうのであれば、それも一案かと思います。
そういえば、日本語のバリエーションをどう扱うかという点では、別項で話題にあがっている方言の取り扱いとも関連しますね。--NJT 2006年5月9日 (火) 20:48 (UTC)

分野のカテゴリについて[編集]

分野のカテゴリについて、言語名_分野 で定着しつつありますが、予防線的に。

「法律」「経済」といった、社会科学分野については言語分類は、あまり賛成できません。社会科学の分野については、互いの概念を参照しつつ、多言語が同一の集団にあることが有用なのです。例えば、法学だと、これは、ある一個の概念であっても日本法に至るのにローマ法、フランス法、ドイツ法の各々の概念の継承であって、さらに、現代的解釈にアメリカ法を参照するということは珍しくなく、このような場合は、雑然と法律用語ということで並んでいた方が参照しやすかったりします。他の分野のカテゴリーの振りなおしには、口は出しませんが、社会科学用語のカテゴリのふりなおしには、このことをご配慮いただきたいと思います。--Mtodo 2007年10月6日 (土) 18:21 (UTC)

「分野」から「言語_分野」への移行に(少なくとも社会科学分野では)反対ということですね。では、「言語」と「言語_品詞」を併存させているように、「分野」を残したまま「言語_分野」を追加するなら OK でしょう。社会科学分野に限らず全分野に適用してよいでしょう。
私自身も「分野」から「言語_分野」への移行が進む様子を見ながら、分野内で全言語をごちゃ混ぜに文字コード順に並べたカテゴリを残しておく必要があるかないか考えたことがあります。そして、ややこしいだけで特に役に立たないだろう、誰も必要としないだろうと思っていました。 Mtodo さんの説明を伺っても、なぜ全言語をごちゃ混ぜに文字コード順に並べなければならないのか、今の私にはまだ理解できませんが、ニーズが実在することは認知しました。そして、程度の差はあれ、おそらく社会科学分野に限った話ではなかろうと思います。
一方、「言語_分野」カテゴリはぜひ欲しいです。分野に属する語数が 3-400 程度なら「分野」でも大丈夫だろうと思いますが、千語を超えるような分野でドイツ語や英語やフランス語やイタリア語がもし混在していたら、おそらく探しにくくなるのではないかと、架空の愚考をしております。あるいは、言語で分けるより分野を細分してゆく方が筋がよいのでしょうか。 --Kanjy 2007年10月18日 (木) 18:20 (UTC)
「分野」から「言語_分野」への移行という方向だったのを、「分野」と「言語_分野」の併存に切り替えることを、改めて提案します。 --Kanjy 2007年11月11日 (日) 14:20 (UTC)

分野のみカテゴリの復活案[編集]

上の提案にご意見が頂けないまま、どうしようかと思っていたら年が明けてしまいましたね。もしこのまま異論がないようなら、一週間後に、本文の「言語・分野のカテゴリ」節に対し、以下の二点の修正を施したいと思います。

  1. 現状の「言語_分野」カテゴリの記述を残したまま「分野」カテゴリの記述を復活する。
  2. 節題を「言語・分野のカテゴリ」から「分野のカテゴリ」に戻す。

本文にある「積分」の例では「日本語」「日本語_名詞」「数学」「日本語_数学」の四カテゴリに入れます。なお、現状は本ノートの #言語別分野別カテゴリ (元、2007年10月頃の Wiktionary‐ノート:カテゴリの方針#言語別分野別カテゴリ にあるように、過去の議論と慣行に従って「分野」カテゴリから「言語_分野」カテゴリに移行することになっていたものです。

というわけで、あと一週間待って異論がなければ、上記二点の修正を施したいと思います。 --Kanjy 2008年1月24日 (木) 10:58 (UTC)

私は、Kanjyさんの2007年10月18日 (木) 18:20 (UTC)の「私自身も分野から・・・」の段落の考えに同意し、カテゴリページが煩雑になるため、分野のみは不要と考えます。--Soldupessi 2008年1月24日 (木) 11:57 (UTC)

Soldupessi さんのご意見は了解しました。ただ、ちょっと説明不足だったような気もしますので、この案をもう少し弁護させてください。

多言語混合カテゴリは、西欧語等が辞書順に並ばないこともあり、収録語彙数が増えるにつれ使い物にならなくなります。しかし、上で述べたように、多言語混合の分野カテゴリも、収録語彙数が少なく 1, 2 頁に収まる程度なら、悪くないと思っています。特に、一頁に収まる程度の多言語混合なら無いより有る方が便利、という話は私にも理解できます。例えば Category:法律 は現時点で154項目です。

さりとて「収録語彙数が少ないうちは〔分野〕とし、増えたら〔言語_分野〕に切り替える」のも今ひとつです。なぜなら分野カテゴリの収録語彙数は、細分化によって減ることもあるからです。したがって、一律に〔分野〕と〔言語_分野〕の並存を標準スタイルと決めておいた方が便利ではないか、と考えています。いかがでしょう。 --Kanjy 2008年1月29日 (火) 04:03 (UTC)

改名提案 (Wki... → Wik...)[編集]

この「カテゴリの付け方」文書のページ名が "Wki..." であって "Wik..." でないのは何故でしょう。単に起草時の誤記だったのでしょうか。内容的には辞典の見出し語ではなくプロジェクト文書ですが、基本名前空間に属していますね。ややこしいので "Wki..." から "Wik..." に移動してもよいでしょうか。跡地に出来るリダイレクトは削除せず残しておいてよいと思います。もちろんノートも "ノート:Wki..." から "Wiktonary‐ノート:..." に移動しましょう。 --Kanjy 2007年10月18日 (木) 18:20 (UTC)

あと一週間ほど様子を見て異議がないようなら移動したいと思います。本文とノートのリンク元は原則として修正しますが、過去ログからのリンクもあるでしょうから、跡地のリダイレクトは削除せず残しておくことにしましょう。 --Kanjy 2007年10月23日 (火) 12:31 (UTC)

タイプミスでしょうね。移動に賛成です。Wiktionary:カテゴリの方針が作られたのはここがns:0にあって見落とされたのが原因のような気もします。別件ですが、文書はできるだけシンプルにしていきたいので、統合がいいなと思います。e-Goat 2007年10月23日 (火) 13:38 (UTC)
統合に賛成 --Lemonsquash 2007年10月23日 (火) 14:51 (UTC)

日本語の固有名詞のカテゴリについて[編集]

Category:日本語 固有名詞Category:日本語 名詞 固有名詞 なのですが、同一目的のカテゴリですよね。統合すべきと思うのですが。いかがでしょうか --Lemonsquash 2007年10月19日 (金) 11:11 (UTC)

Category‐ノート:固有名詞も参照してください。この作業、ちょくちょくやってはいるんですがまだ終わってません。--Soldupessi 2007年10月20日 (土) 00:28 (UTC)
了解しました--Lemonsquash 2007年10月20日 (土) 01:57 (UTC)

慣例の明記[編集]

Wiktionary‐ノート:カテゴリの方針 より転記。

現在慣例となっているカテゴリ付けも、成るべく明記した方が良い筈ですので、それぞれの慣例を記して頂き、それを検討して戴ければ幸いです。

  • 屈折語の変化形には言語名のカテゴリのみを置く、動詞の変化形には「Category:{{言語}} 動詞 定形」を置く。細則向け。利用者‐会話:Lemonsquash#カテゴリより。
  • 朝鮮語のソートキーは、ハングル表記・漢字表記に関らず、ハングルの最初の一文字を初声・中声・終声に分解。二文字目以降はその儘。ソートキー>朝鮮語向け。
  • 中国語のソートキーは、ピンイン表記、声調は数字で表す。軽声は数字を付けない。ソートキー>中国語向け。
    • 語頭大文字は固有名詞にしか利用されていませんが、カテゴリもありますし、総て小文字にした方が良いのでは。
    • 広東語等の中国語の方言とされる語は項目自体が少ない。

--kahusi (會話) 2007年10月24日 (水) 12:43 (UTC)

統合案[編集]

この「カテゴリの付け方」文書(以下〈付け方〉)の改名も無事に済み、Wiktionary:カテゴリの方針(以下〈方針〉)との統合に異論もないようですので、統合に向けて具体的に検討しましょう。 どちら向きに統合すべきか、両文書に書かれた既存の文言をどう扱うか、といった検討が必要です。とりあえず叩き台として、以下の Kanjy-1 案 を提案します。

  1. 〈付け方〉側に統合し、〈方針〉はリダイレクト化します。
  2. いったん〈方針〉の内容をすべて〈付け方〉に転記(カット・ペースト)し、直後に以下のとおり融合させます。
    • 旧〈付け方〉にあった内容は、統合の際は暫定的にそのまま残します。〈方針〉側は使える文言をなるべく活かしつつも大胆に整理します。
    • 前文は〈付け方〉側を活かし、〈方針〉側からは草案テンプレートだけ頂きます。
    • 〈方針#カテゴリの種類〉節は暫定的にそのまま活かし、前文の直後に挿入。
    • 〈方針#カテゴリの構成〉節は重複するのでほぼ廃止し、〈付け方〉側の記述を存続。ただし "その他文法的分類" の説明「日本語で言えば季語や……」だけは活かして〈付け方#言語・品詞のカテゴリ〉内の「……とします。」の直後に挿入。
    • 〈方針#カテゴリの名称〉節も同じくほぼ廃止。ただし "分野別カテゴリ" の説明だけは活かして〈付け方#言語・分野のカテゴリ〉内の末尾に挿入。
    • 〈方針#ソートキー〉節はそのまま活かし〈付け方#さいごに〉節の前に挿入。
  3. 以上を統合完了時点の暫定的な内容としましょう。整理不十分な点は、内容改善と併せ、追い追い整理しましょう。
  4. ノートも以下のとおり統合します。
    • 〈方針ノート〉最新版の内容をすべて、〈付け方ノート〉に転記(カット・ペースト)し、〈方針ノート〉はリダイレクト化します。
    • 節単位で時系列(節内冒頭の発言日時が早い順)に並べます。
    • 転記した節は、転記したことを明記しておきます(各節見出しの直下に斜体で)。

以上の機械的な切り貼り作業で、体裁がまあまあ整うかと思います。もしかすると e-Goat さんも腹案をお持ちかもしれないと期待しております。 --Kanjy 2007年11月7日 (水) 12:39 (UTC)

あと一週間ほど待って異論がなければ、上記の統合案を実施したいと思います。 --Kanjy 2007年11月11日 (日) 14:20 (UTC)

統合のご提案どうもありがとうございます。異論ありません。まずは切り貼りで対処するのがよいかと思います。それ以上の案は今のところとりたててもっていませんし、いちど統合してから改訂した方が経緯が分かりやすくて良いように思いました。e-Goat 2007年11月11日 (日) 17:03 (UTC)

有難うございます。統合しました。 --Kanjy 2007年11月20日 (火) 18:40 (UTC)

○○語起原(由来)××語[編集]

英語版から単語記事を翻訳している所ですが、あちらで使われているテンプレートだと、「Category:(言語コード):Latin derivations」又は「en:Category:Latin derivations」というカテゴリが設定されております。直訳すれば「Category:ラテン語起原(又は由来)××語」又は「Category:ラテン語起原(又は由来)」となりますが、日本語版ではどうしましょうか? 同様にギリシャ語由来の単語も結構ありますので、「Category:○○語起原(又は由来)××語」といったカテゴリを作るのか作らないのか、作るのならどのようなカテゴリ名にするのか、「○○語」の後ろに半角空白を入れるかどうかといった所まで、きちんと基準を決めておいた方がいいと思います。--Game-M 2008年3月26日 (水) 06:42 (UTC)

言語別分野別カテゴリあれこれ[編集]

上記「#分野のみカテゴリの復活案」節の件、おもて側に長らく「提案」テンプレートを貼りっぱなしにしてしまいましたが、支持が頂けないようですので、そろそろ剥がそうかと思います。記事を親子カテゴリに同時に属させるのは、そもそも例外的でしょうし、このような凝ったことは程々に留めるのがよいのでしょう。分野のみのカテゴリは徐々に言語別分野別カテゴリへと分割を進めてゆく、という方向性を受け入れるとしましょう。

ところで、言語別分野別カテゴリは、言語カテゴリ内にあったり、言語_名詞カテゴリ内にあったりしますね。現在、例えば「Category:英語_生物学」は「Category:英語」内、「Category:英語_動物」は「Category:英語_名詞」内です。

後者、つまり言語_名詞カテゴリ内に言語別分野別カテゴリを置くのは、違和感を感じます。動物分野では名詞がほとんどだとしても、 avian (鳥の、鳥類の)や equine (馬の、ウマ科の)といった動物分野の形容詞まで「英語_名詞」傘下に入ったら変ですよね。言語別分野別カテゴリは、言語_名詞カテゴリ内ではなく、言語カテゴリ直下に置くことを原則にしませんか。ケースバイケースで例外もあり、という前提で提案します。 --Kanjy 2008年9月1日 (月) 11:37 (UTC)

まず始めに、8/29 以降、動植物系において分野カテゴリを手当たり次第に修正しています。それに伴いカテゴリを作成しているのですが、参考にした物が分野カテゴリを「言語名 名詞」の下に延ばすものだったので、私が作成したものは「言語名 名詞」の下に分野カテゴリがあります。
閑話休題、英語や日本語の場合、集録されている分野の種類が多いので「言語名 分野」を間に挟んでは如何でしょうか? --Lemonsquash 2008年9月1日 (月) 14:18 (UTC)
(コメント)繰り返し言いますが社会科学系の分野別カテゴリについては、言語別分野別の分類は避けていただきたいと考えます(「言語別分野別」をつけるのは構いませんが、「分野別」のみを除去するのは避けていただきたい、と言うことです)。これは、ひとえに私がこのカテゴリをつけることにより「法律用語辞典」「経済用語辞典」に成長することを願うからです。社会科学の学習においては、概念の普遍性と個別性を意識することにおいて、例えば、「right」と「droit」と「Recht」が同一の空間に並ぶのは比較的重要なことで、これがいちいち英語の法学用語やフランス語の用語等に飛ぶのは、用語辞典としてあまり楽しいことではありません。まあ、人文科学や自然科学でも基礎概念は同様のことが言えるような気がしますが、社会科学、ことに法律学は、言葉(=適用文化)が違うと、概ね同一の概念でも微妙に差異があり、その際が非常に重要であるという事情があります。以上のことを理解いただければ、その他のカテゴリ分類には特に異議は唱えません。ただ、多分、私は、個々の具象名詞に分野カテゴリーをつけると言う、比較的事典的な営みには参加しないでしょうが。--Mtodo 2008年9月1日 (月) 17:27 (UTC)
(前言一部撤回){{Category:{{id}}_料理}}とか、旅行時にメニューを見たりするのに有用そうだから、あっても良さそうですね。前言を撤回します。--Mtodo 2008年9月1日 (月) 17:46 (UTC)

Mtodo さん好みの用語辞典をカテゴリ機能で実現しようという話には、今のところあまり深く関与する気にはなれません。分野のみカテゴリを付けるルールの復活には、今のところ反対しないつもりですし、コンセンサスが形成されれば従います。

Lemonsquash さんのご提案「『言語名 分野』を間に挟む」は、すみませんが、仰せの意味がよくわかりません。何と何の間に何を挟むのでしょうか。現在どうなっているものを、どのように変えるのでしょうか。おそらく具体例を挙げて頂いた方が理解しやすいかと思います。 --Kanjy 2008年9月2日 (火) 18:51 (UTC)

Category:英語 にサブカテゴリが雑然と並んでいるだけなので、品詞と分野を別けた方がいいかなと思ったしだいです。
  • 案1) Category:英語 に分野カテゴリを置くのではなく、Category:英語 分野 を置いてその下に各分野カテゴリを置く
  • 案2) サブカテゴリを設定する場合。品詞は「#」、分野は「$」で始める。さらに細分化する場合「%」,「(」,「)」,「+」等で先頭ページに配置される記号を頭につける。表示順を固定する場合は、記号の後ろに数字で順位付け。
如何でしょうか --Lemonsquash 2008年9月8日 (月) 05:54 (UTC)

なるほど、ご説明有難うございます。案 2 の記号は、ソートキーの先頭に付けるんでしょうか。だとすれば、良いアイデアだと思います。例えばカテゴリページ「Category:英語_名詞」に親カテゴリ指定を書く際「[[Category:英語|#めいし]]」と書くということですね。言語名カテゴリ内で、品詞サブカテゴリと分野サブカテゴリが混ざり合うのを避け、かつカテゴリ内の先頭ページにサブカテゴリが集まる、という点でメリットがありますね。

案 1 はカテゴリ階層が一つ増え、カテゴリツリーをたどる際のクリック数が増えて少々不便になりますが、許容できなくはない範囲かとは思います。

というわけで Lemonsquash さんの案2 を採用の上で、言語別分野別カテゴリツリーは原則として「言語名_名詞」傘下ではなく「言語名」傘下に作る、ということでいかがでしょう。異論がなければ、おもての「言語・分野のカテゴリ」節に加筆したいと思います。 --Kanjy 2008年9月12日 (金) 14:16 (UTC)

Kanjy です。異論がないようですので、おもて側へ大胆に加筆させて頂きました。ソートキー等の話もあるので、「言語・分野のカテゴリ」節だけでは済まなくなりましたが、以前 kahusi さんから提案のあった言語別のソートキー慣例につきましても併せて反映してみました。 --Kanjy 2008年9月26日 (金) 16:26 (UTC)


方針に正式に反映されたソートキーですが、

Category:日本語では、サブカテゴリに「品詞」「分野」が混ざっており、「#」「$」で切り分けるのは良いのですが、Category:名詞では、サブカテゴリにあるのは各言語となります。ソートキーに「*」をつけると全てのサブカテゴリが「*」に入ってしまいます。言語のカテゴリに対する方針はこのままで良いのですが、 品詞のカテゴリのソートキー例([[:Category:名詞|*にほんこ]])は不要だと思います。--Kaznyan 2008年11月23日 (日) 03:45 (UTC)

御意。上記ソートキー例「[[Category:名詞|*にほんこ]]」の「*」は、ない方がよいですね。品詞別カテゴリのメンバーは、原則として言語別品詞別カテゴリだけしかないはずですので、そのソートキーは「[[Category:名詞|にほんこ]]」の方がよいですね。 --Kanjy 2008年11月26日 (水) 12:40 (UTC)
例を修正しました。言語カテゴリにおける品詞のソート「#」は問題ないのですが、分野においては言語カテゴリに置かれているもの、名詞カテゴリにおかれているもの、階層の深いサブカテゴリも上位カテゴリと同様に扱うかわれているなど、一概に「$」をつけて整理ができる状況ではないため、今後検討が必要です。そのため、安定している分野の上位カテゴリに限り作業を実行します。--Kaznyan 2008年11月29日 (土) 05:14 (UTC)
例の追加、および、誤った例の除去、有難うございます。ただ、言語・分野カテゴリや、言語・品詞カテゴリのような、二つの親カテゴリの交点となるサブカテゴリについて例示する場合は、やはり親カテゴリ指定を両方とも示さなければ不完全だと私は思います。
Kaznyan さんの仰せに従い、ソートキーに「*」を前置するルールを(大胆に)修正してみました。
言語カテゴリ内にサブカテゴリが雑然と並んでいた原因は、本質的には分野カテゴリが雑然としているからで、分野カテゴリの大規模な整理が必要ですね。いずれ Category‐ノート:分野 ででも話し合いましょう。 --Kanjy 2008年11月29日 (土) 11:50 (UTC)

朝鮮語のソートキー[編集]

Wiktionary:編集室/2008年Q2#韓国語(朝鮮語)ソートキー処理について曰く、字母に分解しなくて良いとの事なので、此方の記述も修正しようと思います。異論無ければ一週間を目処に変更します。勝手に変更しても良いのかも知れませんが。--kahusi (會話) 2009年6月22日 (月) 09:57 (UTC)

特に異論無いと見て編集しました。--kahusi (會話) 2009年7月3日 (金) 10:36 (UTC)
有難うございます。字母に分解しなくても良いことには異論ありません。しかし、ハングル表記の項目に、項目見出しのハングルを(字母に分解せず)そのままソートキーとして書く、というのはちょっと変な感じがします。ソートキー不要と言うべきではないでしょうか。 --Kanjy 2009年7月3日 (金) 11:37 (UTC)
慥かに、うっかりしておりました。変更致しました。--kahusi (會話) 2009年7月4日 (土) 13:12 (UTC)

日本語項目のソートキーについて[編集]

日本語項目のソートキーに関して以前からちょっと気になっていたことがありますので、書かせていただきます。先日、Mtodoさんが若干追記され、現在推奨されるソートキーは、「ひよう びょう 秒」のような形になっています。このように、読み仮名1(清音等に直した読み仮名)、読み仮名2(本来の読み仮名)、見出し語の三つを、必ずセットでソートキーに指定するようにすれば、清音→濁音→半濁音、拗音・促音→直音の順できれいに並びます。例えば、以下のようになります。

項目の並び ソートキー
ひょう ひよう ひょう ひょう
ヒョウ ひよう ひょう ヒョウ
ひよう ひょう 表
ひよう ひよう ひよう ひよう
費用 ひよう ひよう 費用
びょう ひよう びょう びょう
ひよう びょう 秒
びよう ひよう びよう びよう
美容 ひよう びよう 美容

しかし現在は、項目名が清音・直音の平仮名の場合にソートキーを不要としており、また、読み仮名が清音・直音になる場合(例:大変 たいへん)、読み仮名を一つしか指定しないようになっています。そうすると、「ひよう」と「費用」がきれいに並ばず、以下のような並びになってしまいます。

項目の並び ソートキー
ひよう ひよう
ひょう ひよう ひょう ひょう
ヒョウ ひよう ひょう ヒョウ
ひよう ひょう 表
びょう ひよう びょう びょう
ひよう びょう 秒
びよう ひよう びよう びよう
美容 ひよう びよう 美容
費用 ひよう 費用

日本語の項目については、一律で、読み仮名1(清音等に直した読み仮名) 、読み仮名2(本来の読み仮名)、見出し語({{PAGENAME}}と書くことも可)の三つをセットでソートキーに指定することにしてはいかがでしょうか。--Usagiuma (トーク) 2016年5月7日 (土) 14:19 (UTC)

前の書き込みについて訂正させていただきます。同じソートキーの項目同士は項目名の順で並ぶので、三つ目の「見出し語」は不要だと思います。つまり、Mtodoさんが追記される前のように、「ひよう びょう」だけで十分なのではないでしょうか。
既にソートキーの最後に「 {{PAGENAME}}」(または見出し語)を付ける書き方も使われていますが、付けていない項目のほうが多いですので、今後は「 {{PAGENAME}}」なしで統一していくようにしたほうが簡潔でよいと考えます。前に挙げた例でいうと、以下のようになります。
項目の並び ソートキー
ひょう ひよう ひょう
ヒョウ ひよう ひょう
ひよう ひょう
ひよう ひよう ひよう
費用 ひよう ひよう
びょう ひよう びょう
ひよう びょう
びよう ひよう びよう
美容 ひよう びよう
--Usagiuma (トーク) 2016年5月10日 (火) 14:12 (UTC)

日本語のソートキーに第三ソートキーを用いない提案ほか[編集]

1. 日本語のソートキーに第三ソートキーを用いない。
2. 日本語の第一ソートキーおよび第二ソートキーに長音符を用いない。

以上二点を提案いたします。

1については一部直前の節での議論の繰り返しとなります。ページ名が自動的にソートキーに付加されることと、その区切り記号が半角スペースとは異なることが理由です。たとえば項目「秒」のソートキーに「ひよう びょう」を指定すると実際のソートキーはラインフィードで区切ったページ名が付き「ひよう びょう\n秒」となります(ここではラインフィードU+000Aを\nと表記することとします)。文字コード順で並べれば「」は「」よりも先に並ぶのが自然ですが、もし「病」のソートキーを「ひよう びょう 病」と指定すると「ひよう びょう 病\n病」で並べられ、「ひよう びょう\n秒」よりも後に並びます(ラインフィードU+000Aは半角スペースU+0020よりも先に並ぶ)。第三ソートキーを用いるものと用いないものがある場合、このように不整合が現れます。どちらかに統一すればよい話ですから、現状に合わせて、日本語項目においては第三ソートキーを用いないことを提案いたします。

2についてはこの文書に現在書いてあることをより明確しようというものです。というのも、私はここしばらくの編集に於いて「ジュース」に対してソートキーを「しゆうす じゅーす」とするようなことをしてきました。もしここに「じゅうず」と読む日本語が現れた時に「ジュース」が後ろに並んでしまうため不適切で、「しゆうす じゅうす」とすべきと思います。第二ソートキーにおいても長音符は母音に置き換えるよう提案、というより認識の一致を求めます。

以上、よろしくお願いします。 --Naggy Nagumo (トーク) 2018年10月5日 (金) 05:53 (UTC)