文の状態によってマッチしたりしなかったりする #13

ttrace · 2021-05-21T07:18:52Z

行頭の空白があるかどうかによってマッチ結果が異なります（現状のバージョンの場合は、一行目だけマッチする）。

辞書：

module.exports = [
    // ルール　助詞の連続（タイプミス）
    {
        message: `「$1$2$3」には助詞の連続があります（係助詞の連続） err 1`,
        //名詞はは連続しない。
        expected: '$1$2',
        tokens: [
            {
                "_capture": "$1"
            },{
                "pos": "助詞",
                "pos_detail_1": "係助詞",
                "_capture": "$2"
            },{
                "pos": "助詞",
                "pos_detail_1": "係助詞",
                "_capture": "$3"
            }
        ]
    }
];

例文：

名詞はは連続しない。
 名詞はは連続しない。

The text was updated successfully, but these errors were encountered:

azu · 2021-05-24T16:09:55Z

対象となるテキストを書いているファイル形式はMarkdown or Text どちらでしょうか?
(ASTの状態が関係していそうな気がします)

textlint 12.0.0でMarkdownパーサのアップデートして、先頭の空白は Str に含まれなくなったので、この2つの行の差分が吸収されそうな気もしています。

https://textlint.github.io/astexplorer/#/snippet/woXCqHBhcnNlcklEwrh0ZXh0bGludDptxINrZG93bi10by1hc3TCqMSFdHTEkGdzwoHEisSMxI7EkMSSxJRyxJbEmMSaxJzEnsSgw4DCqHbEhnNpb27EqMSqxI3Ej8SRxJPElcSXxJnEm8SdxJ90wqYxMi4wxY_CqGZpbGVuYW1lwrBzb3VyY2UudW5kZcWTbmVkwqRjb8Wlw5lEw6XCkMKNw6jCqcKew6PCgcKvxbfCr8OpwoDCo8OnwrbCmsW3wpfFt8KqxbfChMOjwoDCggoKLcaNxosgxbHFs8W1xbrFusW8xb7GgMaCxoTGhsaIwoI}

あと、これは

名詞はは連続しない。
 名詞はは連続しない。

と書いた場合に一行目のみにしかマッチしない?

名詞はは連続しない。

と

 名詞はは連続しない。

両方別々のパラグラフとして書いた場合に、後者にはマッチしない? のどちらでしょうか?

ttrace · 2021-05-25T00:50:12Z

Textファイルに以下の連続した行を書いてtextlintをかけた場合に、一行目のみにマッチして、二行目にマッチしないという意味です。
markdownでも試してみます。

名詞はは連続しない。名詞はは連続しない。

azu · 2021-05-25T01:04:50Z

一行目のみにマッチして、二行目にマッチしないという意味です。

このルールはセンテンス分解していないので、形態素解析結果が1行目と2行目で異なるのかと思いましたが、
同じ結果になる気がしますね。

https://azu.github.io/morpheme-match/?text=%E5%90%8D%E8%A9%9E%E3%81%AF%E3%81%AF%E9%80%A3%E7%B6%9A%E3%81%97%E3%81%AA%E3%81%84%E3%80%82%20%20%E5%90%8D%E8%A9%9E%E3%81%AF%E3%81%AF%E9%80%A3%E7%B6%9A%E3%81%97%E3%81%AA%E3%81%84%E3%80%82

morpheme-match-allの方が、一度マッチすると繰り返しマッチが上手く出来ていないのかもしれません。

ttrace · 2021-08-06T07:09:03Z

ttrace/morpheme-match-textlint/
に、再現用のテストを書きました。

azu/morpheme-match@master...ttrace:debug-match-rule#diff-392fe26183bb619e42e27aa51f37fc1d1fcc99940a70ff2a9ce1345053672de1
azu/morpheme-match@master...ttrace:debug-match-rule#diff-ebbd233f3019402b6a5abdd736938aa4d5f277e2ee05a2d36179c0f8abe17dcc

マージできる状態かと思います。

        const resultsC = await matchAll("名詞はは連続しない。");
        const resultsD = await matchAll(" 名詞はは連続しない。");

の両方でマッチする辞書を用いても、上のtextがマッチしません。
関数を遡って確かめてみたところ、上の文のtokenがこのテストの前に実行しているtokenと混ざっていました。
とりあえず報告いたします。

{
    word_id: 93100,
    word_type: 'KNOWN',
    word_position: 3,
    surface_form: 'の',
    pos: '助詞',
    pos_detail_1: '連体化',
    pos_detail_2: '*',
    pos_detail_3: '*',
    conjugated_type: '*',
    conjugated_form: '*',
    basic_form: 'の',
  …'*',
    pos_detail_3: '*',
    conjugated_type: '*',
    conjugated_form: '*',
    basic_form: '名詞',
    reading: 'メイシ',
    pronunciation: 'メイシ'
  },
...

azu added the bug Something isn't working label May 25, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

文の状態によってマッチしたりしなかったりする #13

文の状態によってマッチしたりしなかったりする #13

ttrace commented May 21, 2021

azu commented May 24, 2021

ttrace commented May 25, 2021

azu commented May 25, 2021

ttrace commented Aug 6, 2021 •

edited

Loading

文の状態によってマッチしたりしなかったりする #13

文の状態によってマッチしたりしなかったりする #13

Comments

ttrace commented May 21, 2021

azu commented May 24, 2021

ttrace commented May 25, 2021

azu commented May 25, 2021

ttrace commented Aug 6, 2021 • edited Loading

ttrace commented Aug 6, 2021 •

edited

Loading