-
Notifications
You must be signed in to change notification settings - Fork 398
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
部首のバグ修正と改善 #1169
base: master
Are you sure you want to change the base?
部首のバグ修正と改善 #1169
Conversation
Thanks for your pull request! It looks like this may be your first contribution to a Google open source project. Before we can look at your pull request, you'll need to sign a Contributor License Agreement (CLA). View this failed invocation of the CLA check for more information. For the most up to date status, view the checks section at the bottom of the pull request. |
CLAについてですが,当方Googleアカウントを保有していません.なにかできることはございますか. |
Thank you for sending the PR. CLA is a required process to accept PRs due to the repository policy. Thank you for your cooperation. |
わかりました。Googleアカウントを作成しますのでお待ちいただければ幸いです。 所属組織のGitHubアカウントで返信してしまったため再投稿です。 |
Googleアカウントにログインし、CLAに同意いたしましたのでご報告いたします。 |
Hi faketanaka, I agree that there is a room to improve radical related conversions as discussed in #653. On the other hand, a number of radical characters look quite similar to normal characters. For example, ⾚ (U+2F9A) as a Kangxi radical (康煕部首) looks identical to 赤 (U+8D64) as a normal kanji. Therefore, we would like to avoid confusing users from two similar characters, even though the radical one has some descriptions. Some environments may not show those descriptions. So we would like to avoid too generic readings for radical characters (e.g. あか for ⾚ [U+2F9A]). Please remove those readings from radical characters and keep readings that the users can intentionally type radical characters. |
これは変換候補の右側に表示されるコメントのことではなく、「あか」と入力して部首のあかが表示されるのは混乱を招くため、候補を出すためのキーワードを改善する必要がある、ということでしょうか。 私はこの問題に対する対応は #1165 で十分であると考えておりました。具体的にどのような入力で表示されるのがいいか、なにか案はないでしょうか。例えば「ぶしゅのあか」で候補に出すといったことが考えられますが、「ぶしゅのあか」というキーワードが適切かどうかは私一人では判断できかねます。 |
康煕部首・CJK部首補助ブロックは日本の規格が元になったものではないはずです。 |
うーん、Unicodeに収録されている文字がどの文字セット規格に由来するのかは把握しておりませんが、Mozcが公式にサポートしているOSは基本的にUTF-8ロケールであり、Unicode前提・Unicode中心に考えるのが適当であるかと思います。(Unicode以外の日本の文字コードも考慮にいれるのはよいことですが、あくまでもレガシーな文字セットとみなして、Unicode中心という考えに抵触しない範囲でやるべきと考えています) 日本の文字セット規格に由来しない文字を出さないとなると、「 |
私としては、最終的にはメンテナーのkomatsuさんの判断におまかせします。 |
一応日本語新字体の字形もいくつかありますね。失礼しました。 https://techracho.bpsinc.jp/hachi8833/2020_10_07/95257 検索性が最悪で普通の漢字で探しても出ない点が日本語の文字として新たに迎え入れるうえでちょっと困るかなと思います。 フォント対応を調べましたが、以下のフォントには対応していないことを確認しました。BIZ UD系は個人的に多用しているので、伝統的なフォント群に対応していないことも含めてあまり使いたくはないかなと思います。
Google Fontsの日本語フォントでは半々程度です。 https://fonts.google.com/?preview.text=%E2%BB%AF%20%E7%AB%9C&lang=ja_Jpan 対応しているフォントは元の漢字とグリフが99%以上同じなので余計に存在に気づきにくく、無理して使い分けなくてもいいのかな・・・という気がします。 |
別に今まで通り漢字を部首代わりに使ってもいいのかな検索性もいいしどのフォントにも基本対応しているしどうせ字形は同じだし・・・という考えです。 |
Here's my thoughts. Characters introduced from non Japanese standards (e.g. 康煕部首・CJK部首補助ブロック)It's fine to use them if they are widely available among various platforms. So font coverage is one of the major factors (although it's not a gating factor). Visual ambiguity between normal Kanji characters and radicals.As I commented in this thread, I'm also afraid this ambiguity. So the readings of radicals should not be generic. If we introduce radicals, we should let the users clearly understand that they are typing radicals but not normal Kanji characters. So I suggested to append the specific prefix (ぶしゅの) to each reading. I will discuss it with other people in the team, and I would change my statement later. |
Should we reserve the current radical kanji candidates with the "部首" in the candidate descriptions replaced with "部首漢字", and replace the "部首" in those for the new radical dedicated characters with "部首専用"? |
「部首漢字」と「部首専用」をそれぞれ両方表示するのはいくらなんでも意図がエンドユーザーに伝わらないでしょう。難しすぎます。 |
そもそも「康煕字典の部首」という概念は漢字文化圏全体で共通のものであることを認識していただく必要があります。 |
現代の日本において、新字体は漢字の字形として一般的ですが、漢和辞典の部首索引においては一般的ではありません。部首索引においては今なお康煕字典のかたちの部首が事実上の標準とされ、新字体の部首は括弧書きで書かれる(康煕字典の部首が主で新字体の形状の部首が従)ことがよくある、ということです。康煕字典の漢字を外国語のものと認識されては困ります。 |
簡体字と旧字体のグリフは前から確認していましたが、改めて日本の新字体を確認したというだけです。 |
I have discussed this topic with the team. Thank you for waiting for the update. Two concerns were raised as discussed here.
Since the user dictionary is the feature to cover this kind of requirement, here are our conclusions.
Although we don't apply this PR at this moment, I really appreciate your contribution. |
Description
つき
とにくづき
,よこめ
とあみめ
など)Issue IDs
#653