Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Space between Japanese and Western characters: Treatment of circled characters #41

Open
kidayasuo opened this issue Nov 15, 2023 · 3 comments

Comments

@kidayasuo
Copy link
Contributor

kidayasuo commented Nov 15, 2023

和欧間スペースの定義をUnicode全体に広げようとしています。jlreq-d’s spacing property に提案がありますが、何点か議論のある文字についてJLReq TFで議論したく。

#41 は丸付き文字について

JLReq においては丸付き文字は漢字類cl-19、欧文cl-27の両方に含まれています。これは同じ文字でも幅が全角の場合はcl-19、プロポーショナルの場合にはcl-27となっています。さて、テキストエンジンがある文字が実際に全角であるかどうかの判定を行うのは困難です。ではどうすれば良いか。可能なら文字コードレベルで決めてしまいたいが可能か、が議論の対象です。

Unicoce には下のような囲み文字があります

  • 丸付きの、数字①、英字Ⓐ、カタカナ㋐、漢字㉅、ハングル㉮。またこれらの白黒反転や二重丸
  • 四角付きの、英字🄰、漢字🈘

これらの East Asian Width は N (narrow, proportional), W (wide, fullwidth), A (ambiguous) といろいろです。

用途は

  • リストの先頭文字(その場合、丸付き文字とリストのテキストの間には空白文字が入るだろう)
  • リストに使われた文字を指す(文の中)
  • ㉅ など省略形として記号的に(単独)

ここ、もっとあると思いますが、出てきたら書き足します。

@kidayasuo kidayasuo changed the title 和欧間 和欧間スーペース:丸つき文字の扱い Nov 15, 2023
@kidayasuo kidayasuo changed the title 和欧間スーペース:丸つき文字の扱い 和欧間スペース:丸つき文字の扱い Nov 15, 2023
@KobayashiToshi
Copy link
Contributor

これらも“O”でいいと思う.

丸付き数字は,羅列する場合に使用する.①漢字は…,②letterは……,などとあった場合,①は空かないで,②が空くというのは,どうかと思うから.ちょと詰まった感じはあるが……

@himorin
Copy link
Contributor

himorin commented Nov 22, 2023

いくつかのくくりだしの範囲があるかと思いますが、どこら辺が適当でしょうかね。。

  • Decomposition_Type=Circleは文字の丸囲みも結構ありそうです
  • subhead=Circled numbersは数字だけ(?)
  • 四角囲みはDecomposition_Type=Squareはありますがこれだと複数文字を組んだ㍿とかも入ってきます、がsubheadだと多くの種類に?(とはいえ、最終的に全部マルっと同じ文字クラス処理になりそうですが・・・)

あとは括弧つき(subhead=Parenthesized ideographs)もある意味この類型でしょうか?

@KobayashiToshi
Copy link
Contributor

KobayashiToshi commented Nov 22, 2023 via email

@kidayasuo kidayasuo changed the title 和欧間スペース:丸つき文字の扱い Space between Japanese and Western characters: Treatment of circled characters Dec 16, 2023
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants