「Wiktionary:編集室/2021年Q1」の版間の差分
Naggy Nagumo (トーク | 投稿記録) 細 →言語コードを2文字コード優先にする提案: 誤字 |
→言語コードを2文字コード優先にする提案: comment |
||
85行目: | 85行目: | ||
:{{コメント}} 今の段階では賛否は言いかねますが、昔のjawiktで使っていた言語コード(ja、en、deなど)に戻すということですね。日本語版ウィクショナリーにおいて2文字コードから3文字コードへの変更は2009年5月頃に行われておりますが、当時の編集室を確認してもこの変更が行われた経緯は確認できませんでした。もし当時、何となくで3文字コードに変えただけであれば2文字コードに戻すのは特に問題ないと思いますし、反対に2文字コードでは何か不都合があって3文字コードに変更したのであれば2文字コードに戻すことは良くないのかも知れません。 |
:{{コメント}} 今の段階では賛否は言いかねますが、昔のjawiktで使っていた言語コード(ja、en、deなど)に戻すということですね。日本語版ウィクショナリーにおいて2文字コードから3文字コードへの変更は2009年5月頃に行われておりますが、当時の編集室を確認してもこの変更が行われた経緯は確認できませんでした。もし当時、何となくで3文字コードに変えただけであれば2文字コードに戻すのは特に問題ないと思いますし、反対に2文字コードでは何か不都合があって3文字コードに変更したのであれば2文字コードに戻すことは良くないのかも知れません。 |
||
:当時の経緯を確認出来なかったので私からは何とも言えませんが、経緯を知っている人に確認を取るのが良いかと思います(2文字コードから3文字コードへの移動はLERKさんが行っていたため、LERKさんなら何か知っているかも知れません)。 --[[利用者:M-30722|M-30722]] ([[利用者・トーク:M-30722|トーク]]) 2021年3月28日 (日) 13:31 (UTC) |
:当時の経緯を確認出来なかったので私からは何とも言えませんが、経緯を知っている人に確認を取るのが良いかと思います(2文字コードから3文字コードへの移動はLERKさんが行っていたため、LERKさんなら何か知っているかも知れません)。 --[[利用者:M-30722|M-30722]] ([[利用者・トーク:M-30722|トーク]]) 2021年3月28日 (日) 13:31 (UTC) |
||
::自分のノートページに告知があったのでコメントします。 |
|||
::文字コードは、3文字がいいですね、言語ごとに2文字だったり3文字だったりと不統一(言語によっては2文字の設定がなかったりする)なのはやりにくいですし。あと「複数」を意味するテンプレートに {{[[template:p|p]]}} がありますが、辞書でこれを略すときは ''pl.'' と表記するのがほとんどであり、慣例的につい {{[[template:pl|pl]]}} と入力してしまいがちです。ここウィクショナリーでは {pl} > {{[[template:pol|pol]]}} は「ポーランド語」に使われているんですよね…これらを将来的には移行させたい、という思いがあります(いつになるか見当がつきませんが、まあウィキペディアに比べたら小規模ですから、長いスパンで考えています)。 |
|||
::「3文字か2文字か併存しているのは分かりにくい」「2文字でないとサポートしていないものもある」という点についてですが、言語コードはウィキペディアなどで簡単に調べられるわけですから「言語コードは限られた人しか知り得ない、とても難しいもの」とは決して言えないと愚考します。 |
|||
::10年ごろ前は今よりもっと規模も小さく、参加している常連メンバー(←そういうものの定義がある訳ではないのですが)も数えるほど(今もそれくらいの規模だとは思うのですが)でした(当時は活動的だったけど今では活動が途絶えて久しいユーザも何人かいます)。記事の更新も1日前や2日前、もっと少ないと3日前以上のものが普通に表示される程度でした(ウィキソースやウィキクォートなど、得てしてウィキペディア以外の姉妹プロジェクトは今もそうなんではないでしょうか、不定期にしか確認してませんが)。小規模コミュニティーでは「思い立ったら、どんどん実行してしまうのも方便」と言えましょう。…例えば、創設初期のころに行われていた、日本語版の項目のスタイルやテンプレートの整備は、規模が大きい英語版(逆に言えば、英語版以外はフランス語版が比較的まともで、それらを除くと小規模のままだったり内容がスッカスカだったりするところが多い…)を参考にしていただけですが、それ自体に関して問題になったことは(私の知る限り)問題になったことは無いと思います。…日本語版は英語版の下部組織ではないのだから別に英語版に準拠する必要はないんですよね…[[special:差分/1328598|流行語の掲載基準も違う]]みたいですし(他言語版のルールはあまり詳しくありませんが)。[[利用者:LERK|LERK]] ([[User_talk:LERK|会話]]) 2021年4月11日 (日) 16:03 (UTC) |
2021年4月11日 (日) 16:03時点における版
テンプレート呼び出し元が更新されない
テンプレート:pl-nounで引数の使用状況を調べるためにカテゴリ出力機能を加えたのですが(特別:差分/1274184/1349960)、いくら待っても呼び出し元が更新されない→カテゴリメンバーが増えないようです。テンプレートを変更したら呼び出し元もしばらくして更新されると思ったのですが、どうして更新されないのでしょうか?またはテンプレートにカテゴリを埋め込む以外に引数を調べる方法はあるでしょうか? --Naggy Nagumo (トーク) 2021年1月18日 (月) 09:49 (UTC)
- コメント まずNaggy Nagumoさん視点で望ましくない状態のページは確実に存在しますか。そもそもどのページにも問題がないのでは、という物凄く楽観的な事を考えてしまったのですが……。カテゴリ:メンテナンス/テンプレート:pl-nounを引数declを使用して呼び出しているページ、カテゴリ:メンテナンス/テンプレート:pl-nounを引数aを使用して呼び出しているページ、カテゴリ:メンテナンス/テンプレート:pl-nounで渡している性のフォーマットを修正する必要があるページ、この3ついずれかのカテゴリに振り分けが見られれば良いのですよね?この手の変更を加えるとカテゴリに反映されるまで体感で数日くらいはかかる感じがするのですが、それでも変化がないとなれば私の環境でもいよいよおかしいという事になりそうです。--Eryk Kij (トーク) 2021年1月18日 (月) 10:31 (UTC)
- 望ましくないというよりは、注意すべき呼び出し方をしているものになります(すぐに戻すと思ってあまりよく考えずにカテゴリ名をつけました)。"decl"を使用しているものではtau, menu、"a"を使用しているものではcelownik, student、性のフォーマットに注意が必要なものではciapa, niedołęgaなどがあります。carだけは手動で更新したので反映されています。APIで待機中のジョブ数を取得したら0だったので[1]、待っていても更新されないのではないか?と思いました。数日待って更新されてくれればよいのですが。 --Naggy Nagumo (トーク) 2021年1月18日 (月) 11:17 (UTC)
- コメント あまり根本的な解決法ではないと思いますが、挙げられたページは全て空編集を行ってカテゴリ反映される様に致しました。ciapa や niedołęga は参考とした辞書やポーランド語版Wiktionaryでは〈女性と男性〉に当たる様な性の表示がなされていて、論理的に考えればスウェーデン語等の共性にあたるものではありつつも原語資料でその様な扱いがされていないからという理由で現在の表示の仕方にしているという次第です。--Eryk Kij (トーク) 2021年1月18日 (月) 12:21 (UTC)
- 気づいたら更新されていたようですね。少しせっかちだったようです。しかしよくよく考えたらジョブキューの数が0というのがおかしいような……。@エリック・キィ テンプレートを改造する予定ですが、ポーランド語の文法についてはまるで知らないので、後で相談させてください。 --Naggy Nagumo (トーク) 2021年1月19日 (火) 13:16 (UTC)
- コメント あまり根本的な解決法ではないと思いますが、挙げられたページは全て空編集を行ってカテゴリ反映される様に致しました。ciapa や niedołęga は参考とした辞書やポーランド語版Wiktionaryでは〈女性と男性〉に当たる様な性の表示がなされていて、論理的に考えればスウェーデン語等の共性にあたるものではありつつも原語資料でその様な扱いがされていないからという理由で現在の表示の仕方にしているという次第です。--Eryk Kij (トーク) 2021年1月18日 (月) 12:21 (UTC)
- 望ましくないというよりは、注意すべき呼び出し方をしているものになります(すぐに戻すと思ってあまりよく考えずにカテゴリ名をつけました)。"decl"を使用しているものではtau, menu、"a"を使用しているものではcelownik, student、性のフォーマットに注意が必要なものではciapa, niedołęgaなどがあります。carだけは手動で更新したので反映されています。APIで待機中のジョブ数を取得したら0だったので[1]、待っていても更新されないのではないか?と思いました。数日待って更新されてくれればよいのですが。 --Naggy Nagumo (トーク) 2021年1月18日 (月) 11:17 (UTC)
lang属性に渡す言語コードは2文字コードを優先してください
HTML要素のlang属性に指定する言語コードは、ISO 639-1の2文字コードを優先してください。HTMLやXMLの仕様上2文字・3文字コードの両方が存在する場合は2文字コードを使用することになっています。これに反する場合はサポート外となり、ウェブブラウザが正しくレンダリングしないなど弊害があります。例えば以下の例をご覧ください。ブラウザによっては3文字コード"fra"を指定するとフランス語のスタイルになりません。
<q lang="ja">あいうえお</q>, <q lang="fr">abc</q>
→あいうえお
,abc
<q lang="jpn">あいうえお</q>, <q lang="fra">abc</q>
→あいうえお
,abc
{{lang}}
などのテンプレートが対象となります。 --Naggy Nagumo (トーク) 2021年1月29日 (金) 03:06 (UTC)
化学物質の掲載基準について
Kyosu-tanniと申します。
「~化○○」(例:「塩化ナトリウム」)や「~酸○○」(例:「硝酸カリウム」)といった化学物質について、それらが複合語の扱いにおいてどのように扱われるのか分からなかったので伺います。
上の例では、「塩化ナトリウム」の場合単に「ナトリウム」が「塩化」しているものであることから「複合前にない新たな意味が生じていない」ととることも、「塩化ナトリウム」で NaCl という一つの物質としての意味が生じているととることもできそうです。同様に、「硝酸カリウム」の場合単なる「カリウム」の「硝酸」塩とも、KNO3 という一つの物質ともとれそうです。カテゴリ:日本語 化学物質で実例を見ますと、前者のような例は「一酸化炭素」「塩化水素」など一定数あるのに対し、後者のような例は見つけられませんでした。どのような場合に許容されるのか、前者と後者の違いは何か(もしくは単に後者の項目が作られていないだけで違いはないのか)など、教えていただけますでしょうか。--Kyosu-tanni (トーク) 2021年2月3日 (水) 12:42 (UTC)
- 非常に難しい問題です。掲載基準を決める際に、生物名を例にこのような議論がなされています。確たる結論は出ておらず、基準としてはWiktionary:編集方針#専門用語の扱い程度です。一般的な考え方だと「広辞苑」「日本国語大辞典(日国)」など「辞典」掲載は認めるのにやぶさかではないですが、化学辞典だと難しいというところでしょうか。JapanKnowledgeで、チェックすると、「塩化コバルト」「臭化アンモニウム」は日国の見出し語にはありましたが、「臭化コバルト」は「化学辞典」のみの掲載でした。あと、辞典としての記載のポイントは、組成や性質よりは、翻訳になるかと思います。それを考えると、日本語版以外の外国語版(掲載にあたって、ある程度の議論がなされていることが前提にはなりますが)にそれを表す語があれば掲載可能と考えても良いかと思います。--Mtodo (トーク) 2021年2月4日 (木) 00:17 (UTC)
- @Mtodoさん: なるほど、他の言語への翻訳といった、辞典としての内容が重要なわけですね。ありがとうございます。--Kyosu-tanni (トーク) 2021年2月6日 (土) 10:33 (UTC)
- 個人的な考えですが、化合物は一つ物質であると思いますので掲載する価値があると思います。例えば硝酸カリウムは硝酸ともカリウムとも性質が全く異なるものですのでそういう意味では「新たな意味が生じている」ととれるかと思います。ただ、どこまで細かいところまで許容するかは難しい問題になりそうですね、例えば「塩化銅」には「塩化銅(I)」(塩化第一銅、CuCl)と「塩化銅(II)」(塩化第二銅、CuCl2)とがありますが、「塩化銅」までOKとするのか、「塩化第一銅」などもOKとするのか難しい判断になりそうですし、また単体の元素も例えば「ウラン」はOKとしまして、同位体の「ウラン238」や「ウラン235」は掲載するか否かという線引きが悩ましいところかなと感じます。 --M-30722 (トーク) 2021年2月13日 (土) 09:59 (UTC)
- @M-30722さん: ありがとうございます。少なくとも化合物までであれば掲載する価値が認められることになるのですね。--Kyosu-tanni (トーク) 2021年2月13日 (土) 14:33 (UTC)
- 個人的な考えですが、化合物は一つ物質であると思いますので掲載する価値があると思います。例えば硝酸カリウムは硝酸ともカリウムとも性質が全く異なるものですのでそういう意味では「新たな意味が生じている」ととれるかと思います。ただ、どこまで細かいところまで許容するかは難しい問題になりそうですね、例えば「塩化銅」には「塩化銅(I)」(塩化第一銅、CuCl)と「塩化銅(II)」(塩化第二銅、CuCl2)とがありますが、「塩化銅」までOKとするのか、「塩化第一銅」などもOKとするのか難しい判断になりそうですし、また単体の元素も例えば「ウラン」はOKとしまして、同位体の「ウラン238」や「ウラン235」は掲載するか否かという線引きが悩ましいところかなと感じます。 --M-30722 (トーク) 2021年2月13日 (土) 09:59 (UTC)
広義のヌメロニムについて
Kyosu-tanniと申します。
ウィキペディアの記事で解説されている「広義の」ヌメロニム(数略語)について、これは掲載基準においてどのように扱われるのでしょうか。
広義のヌメロニムには、
といったものがあるようです。(なお、「internationalization」を「i18n」で表すようなもの(狭義のヌメロニム?)は既に立項されているのを見つけました。)
これらは許容されるのか、許容されるのであればどのような条件があるかなど、お教え頂けますでしょうか。--Kyosu-tanni (トーク) 2021年2月3日 (水) 13:05 (UTC)
- Wiktionary:編集方針に当てはめると、不特定多数による利用実績があり投稿者による造語でないこと、初出から一定の期間を経ており新語でないことが満たされていれば、掲載可能だと思います。以上の要件を満たすかどうかは、正確性検証プロセスで確認されることとなります。--Mtodo (トーク) 2021年2月4日 (木) 00:28 (UTC)
- @Mtodoさん: なるほど、ありがとうございます。--Kyosu-tanni (トーク) 2021年2月6日 (土) 10:39 (UTC)
形態素の異形態について
Kyosu-tanniです。
「あめ」「あま」「さめ」といった形態素の異形態についての執筆は可能なのでしょうか。ウィキペディアでウィクショナリーへのリンクとともに先述の例の記載がありましたが、リンク先の「あま」「さめ」の項目に「雨」の意味を持つ形態素の形態のひとつとしての説明がなかったので気になりました(なお、ウィキペディアのほうのリンクは、リンク先と内容が合っていないとして取り敢えず外しておきました)。--Kyosu-tanni (トーク) 2021年2月6日 (土) 10:51 (UTC)
- 取り扱いについて明確に定めている文書はないかもしれませんが、辞書的に取り上げる価値があれば遠慮なく作成してよいと思います。カテゴリ:日本語 造語成分へのカテゴライズが適切かもしれません。 --Naggy Nagumo (トーク) 2021年2月26日 (金) 13:31 (UTC)
「カテゴリ:外来語」廃止の提案
カテゴリ・トーク:外来語にて議論が行われている内容ですが、このカテゴリは「◯◯語由来」のカテゴリが作られる以前にあったカテゴリで、当初はよその言語から入ってきた語彙を収録する役割を担っていたものでありますが、何を以って「外来語」とするかの定義が曖昧になりがちで、それゆえ扱いに混乱が生じる可能性がありますので当カテゴリを廃止し、外来語を収録する機能を「◯◯語由来」に任せた方が良いのではと考えておりますがいかがでしょうか。 --M-30722 (トーク) 2021年2月26日 (金) 05:14 (UTC)
- 賛成 外来語の定義は一部あいまいなところがあり、辞書的な基準というよりは「外国語っぽい」という感覚的な基準がありそうです。「◯◯語由来」のカテゴリと重複していますし、外来語カテゴリは廃止してよいと思います。ただ、カテゴリを集めるカテゴリとしては有用で、現在も「借用語」や「○○語由来」の親カテゴリとしても機能しています。この機能についてはカテゴリ・トーク:日本語 借用語#このカテゴライズは適当でしょうか?で疑問が投げかけられているように、やはり外来語という名称は不適切です。項目のカテゴライズは廃止したうえで、「他言語由来」などに名称変更するのはいかがでしょうか? --Naggy Nagumo (トーク) 2021年2月26日 (金) 13:25 (UTC)
- コメント コメント加えます。カテゴリ:日本語 外来語は日本語版ウィクショナリーでトップクラスのアクセス数となっています。これは検索エンジンで特定のワードを検索した際に上位に出てくるためと思われます。アクセス数だけでは訪問者のニーズを満たしたかどうかはわかりませんが、少なくともウィクショナリーを知る機会にはなっているはずです。廃止する前に「付録:外来語」または「付録:日本語の外来語」を作っておきたいですね。 --Naggy Nagumo (トーク) 2021年3月26日 (金) 14:11 (UTC)
日本語の「同音異義」を「漢語の仮名表記」にしませんか?
カテゴリ:日本語 同音異義にカテゴライズされている項目ですが、レベル3セクションタイトルと必須カテゴリを「同音異義」ではなく「漢語の仮名表記」にしませんか?同音異義であることは間違いないのでカテゴリは有益なのですが、これを品詞に相当する整理とするには違和感があります。平仮名表記の「こうむいん」と「しょうじょう」は漢語を仮名表記したものということで同じ概念ですが、タイトルを「同音異義」としているために等しく扱うことができなくなっています。変更することで趣旨が分かりやすくなると思いますがどうでしょうか? --Naggy Nagumo (トーク) 2021年3月11日 (木) 05:09 (UTC)
- 漢字表記語の読み仮名を同一のカテゴライズしたいと言うのであれば(そうでなければ対応不要)、漢語(字音語)とはかぎらないので、「漢字表記の音(又は『読み』)」位でしょうね。仮名表記だと、カタカナにおける「学術的表記」との混同を生じます。そもそも、正書法としては原則存在しない表現なので、本当は「漢字表記の音の表記」でしょうが、言い方がくどいので。--Mtodo (トーク) 2021年3月26日 (金) 01:37 (UTC)
- 「漢語」と「仮名表記」の部分に問題があるということですね。「和語の漢字表記」と対照的な名前を付けてみましたが、確かに問題がありそうです。「漢字語の平仮名表記」とするのはどうでしょうか?「漢字語」という用語は一般的な言葉ではないため、ウィクショナリー用語として使用することができると思います。これは朝鮮語項目でも使われている用語で、わずかに統一性も増しそうです。「平仮名表記」については、カタカナ表記は生物分類など特殊な表記が含まれるため、ひらがなに限定すればよいと思いました。音や読みではなく表記の問題だと思うので。 --Naggy Nagumo (トーク) 2021年3月26日 (金) 11:11 (UTC)
言語コードを2文字コード優先にする提案
現在の日本語版ウィクショナリーではISO639-3ベースに言語コードを使用していますが、ISO639に2文字・3文字コードの両方が存在するものは2文字コードを優先することを提案します。根拠は主にlang属性などで使用すべきIETF言語タグを意識するものです。
2文字・3文字コードの両方が存在する言語で3文字コードを使用することのデメリット
- IETF BCP 47の仕様に合わない: RFC 5646, Language Subtag Registry
- lang属性で用いることはHTMLの仕様に反している(HTMLはBCP 47に従っているため): W3C Recommendation | HTML 5.2, HTML Living Standard
- →3文字コードは仕様外なので、lang属性に指定した場合ウェブブラウザ等が期待通りに解釈するか保障されない。なお投稿時点ではIE, レガシーEdge, Chromium Edge, Firefox, Chromeはいずれも3文字コードをサポートしていない。
- xml:lang属性で用いることはXMLの仕様に反している(BCP 47に従っているため): Extensible Markup Language (XML) 1.0 (Fifth Edition)
- 上記も含めて2文字コードのみが許される場面があり、同じ言語を扱っていても入力するユーザーが2文字コードと3文字コードを適切に使い分けなければならない。あるいはユーザーが使い分けなくてもいいように、言語コードを扱うテンプレート内部に3文字コードを2文字コードに変換する仕組みを実装する必要がある。どちらにしても負担が増大する。
上記のような問題があり、メリットを上回るデメリットがあると思います。IETFやHTMLの仕様に従うのは、ウィクショナリーがウェブ辞書であるため自然なことです。今のところ問題はそこまで深刻に表面化していないので、影響範囲も大きいですし、長いスパンで統一していければよいと考えています。 --Naggy Nagumo (トーク) 2021年3月27日 (土) 01:37 (UTC)
- コメント 今の段階では賛否は言いかねますが、昔のjawiktで使っていた言語コード(ja、en、deなど)に戻すということですね。日本語版ウィクショナリーにおいて2文字コードから3文字コードへの変更は2009年5月頃に行われておりますが、当時の編集室を確認してもこの変更が行われた経緯は確認できませんでした。もし当時、何となくで3文字コードに変えただけであれば2文字コードに戻すのは特に問題ないと思いますし、反対に2文字コードでは何か不都合があって3文字コードに変更したのであれば2文字コードに戻すことは良くないのかも知れません。
- 当時の経緯を確認出来なかったので私からは何とも言えませんが、経緯を知っている人に確認を取るのが良いかと思います(2文字コードから3文字コードへの移動はLERKさんが行っていたため、LERKさんなら何か知っているかも知れません)。 --M-30722 (トーク) 2021年3月28日 (日) 13:31 (UTC)
- 自分のノートページに告知があったのでコメントします。
- 文字コードは、3文字がいいですね、言語ごとに2文字だったり3文字だったりと不統一(言語によっては2文字の設定がなかったりする)なのはやりにくいですし。あと「複数」を意味するテンプレートに {{p}} がありますが、辞書でこれを略すときは pl. と表記するのがほとんどであり、慣例的につい {{pl}} と入力してしまいがちです。ここウィクショナリーでは {pl} > {{pol}} は「ポーランド語」に使われているんですよね…これらを将来的には移行させたい、という思いがあります(いつになるか見当がつきませんが、まあウィキペディアに比べたら小規模ですから、長いスパンで考えています)。
- 「3文字か2文字か併存しているのは分かりにくい」「2文字でないとサポートしていないものもある」という点についてですが、言語コードはウィキペディアなどで簡単に調べられるわけですから「言語コードは限られた人しか知り得ない、とても難しいもの」とは決して言えないと愚考します。
- 10年ごろ前は今よりもっと規模も小さく、参加している常連メンバー(←そういうものの定義がある訳ではないのですが)も数えるほど(今もそれくらいの規模だとは思うのですが)でした(当時は活動的だったけど今では活動が途絶えて久しいユーザも何人かいます)。記事の更新も1日前や2日前、もっと少ないと3日前以上のものが普通に表示される程度でした(ウィキソースやウィキクォートなど、得てしてウィキペディア以外の姉妹プロジェクトは今もそうなんではないでしょうか、不定期にしか確認してませんが)。小規模コミュニティーでは「思い立ったら、どんどん実行してしまうのも方便」と言えましょう。…例えば、創設初期のころに行われていた、日本語版の項目のスタイルやテンプレートの整備は、規模が大きい英語版(逆に言えば、英語版以外はフランス語版が比較的まともで、それらを除くと小規模のままだったり内容がスッカスカだったりするところが多い…)を参考にしていただけですが、それ自体に関して問題になったことは(私の知る限り)問題になったことは無いと思います。…日本語版は英語版の下部組織ではないのだから別に英語版に準拠する必要はないんですよね…流行語の掲載基準も違うみたいですし(他言語版のルールはあまり詳しくありませんが)。LERK (会話) 2021年4月11日 (日) 16:03 (UTC)