Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

SFX D #33

Open
zdenop opened this issue Feb 7, 2021 · 18 comments
Open

SFX D #33

zdenop opened this issue Feb 7, 2021 · 18 comments

Comments

@zdenop
Copy link
Contributor

zdenop commented Feb 7, 2021

Aha, to isté tu:

SFX D   eň          ňam        ec is:dative is:plural

Originally posted by @andrewshadura in #32 (comment)

@zdenop
Copy link
Contributor Author

zdenop commented Feb 7, 2021

@andrewshadura: počkám, či nájdeš viac, aby som to nerobil po jednom riadku ;-)

@andrewshadura
Copy link

The condition "[^s][ey][lľ]" does not guarantee that "ľ" can always be stripped.

SFX D   ľ           liam       [^s][ye][ľl] is:dative is:plural

@andrewshadura
Copy link

--- sk_affix.dat.orig	2021-02-07 14:55:31.395919429 +0100
+++ sk_affix.dat	2021-02-07 14:56:28.980340792 +0100
@@ -293,7 +293,7 @@
 SFX U   a           iach       [^ďťňľi]a is:locative is:plural
 SFX U   a           ami        a is:instrumental is:plural
 
-SFX D Y 201
+SFX D Y 197
 SFX D   ec          ce         ec is:genitive
 SFX D   ď           de         ď is:genitive
 SFX D   eľ          le         seľ is:genitive
@@ -384,7 +384,6 @@
 SFX D   ď           diam       [^i]aď is:dative is:plural
 SFX D   ň           niam       lebeň is:dative is:plural
 SFX D   ň           niam       [alou]ň is:dative is:plural
-SFX D   ň           niam       eňa is:dative is:plural
 SFX D   ň           niam       čeň is:dative is:plural
 SFX D   ň           niam       jeseň is:dative is:plural
 SFX D   ň           niam       [^á]leň is:dative is:plural
@@ -406,8 +405,7 @@
 SFX D   eň          ňam        priazeň is:dative is:plural
 SFX D   eň          ňam        báseň is:dative is:plural
 SFX D   eň          ňam        i[ae]reň is:dative is:plural
-SFX D   eň          ňam        ec is:dative is:plural
-SFX D   ľ           liam       [^s][ye][ľl] is:dative is:plural
+SFX D   ľ           liam       [^s][ye]ľ is:dative is:plural
 SFX D   el          liam       sel is:dative is:plural
 SFX D   eľ          liam       myseľ is:dative is:plural
 SFX D   eľ          le         seľ is:accusative is:plural
@@ -456,7 +454,6 @@
 SFX D   ď           diach      [^i]aď is:locative is:plural
 SFX D   ň           niach      lebeň is:locative is:plural
 SFX D   ň           niach      [alou]ň is:locative is:plural
-SFX D   ň           niach      eňa is:locative is:plural
 SFX D   ň           niach      čeň is:locative is:plural
 SFX D   ň           niach      jeseň is:locative is:plural
 SFX D   ň           niach      [^á]leň is:locative is:plural
@@ -478,8 +475,7 @@
 SFX D   eň          ňach       priazeň is:locative is:plural
 SFX D   eň          ňach       báseň is:locative is:plural
 SFX D   eň          ňach       i[ae]reň is:locative is:plural
-SFX D   eň          ňach       ec is:locative is:plural
-SFX D   ľ           liach      [^s][ye][ľl] is:locative is:plural
+SFX D   ľ           liach      [^s][ye]ľ is:locative is:plural
 SFX D   el          liach      sel is:locative is:plural
 SFX D   eľ          liach      myseľ is:locative is:plural
 SFX D   ec          ciach      ec is:locative is:plural

@zdenop
Copy link
Contributor Author

zdenop commented Feb 7, 2021

s týmito zmenami už je možné spraviť aspell slovník?

@andrewshadura
Copy link

andrewshadura commented Feb 7, 2021

Áno, idem to teraz dať do Debianu (experimental). Žiaľ, aspell nepoužívam, tak neviem to poriadne skontrolovať (cc @pali znova 🙂) Ak by to dobre fungovalo, tak dám rovno to unstable 🙂

zdenop added a commit that referenced this issue Feb 7, 2021
@pali
Copy link

pali commented Feb 7, 2021

aspell stále používam, ak bude k dispozícii deb/dsc balík tak ho na debiane otestujem. o pár dní bude freeze balíkov debiane, tak by bolo dobré ho stihnúť zaradiť.

@andrewshadura
Copy link

Keď sa zbuilduje, môžeš to rovno aj apt install 🙂

@pali
Copy link

pali commented Feb 8, 2021

Balík sa nainštaloval ale vypisuje warning pri inštalácii:

(Číta sa databáza ... momentálne je nainštalovaných 463726 súborov alebo adresárov.
Preparing to unpack .../aspell-sk_2.02-0-6_all.deb ...
Unpacking aspell-sk (2.02-0-6) over (2.02-0-1.1) ...
Nastavuje sa balík aspell-sk (2.02-0-6) ...
Processing triggers for dictionaries-common (1.28.1) ...
aspell-autobuildhash: processing: sk [sk].
Upozornenie: The word "nie sú" is invalid. Znak ' ' (U+20) sa nesmie vyskytovať uprostred slova. Preskakujem slovo.

@pali
Copy link

pali commented Feb 8, 2021

Dal som ho spustiť na rôzne texty čo som písal a vyzerá, že funguje všetko ako má.

@andrewshadura
Copy link

Hmm, zvláštne je to, keď to zbuildujem lokálne, nevidím tento problém.

@andrewshadura
Copy link

Aha, LC_ALL=C pomohlo.

@andrewshadura
Copy link

Ok, bol to problém v skripte, ktorý robil konverziu.

@pali
Copy link

pali commented Feb 10, 2021

Už to nevypisuje warning pri inštalácii:

(Číta sa databáza ... momentálne je nainštalovaných 463726 súborov alebo adresárov.
Preparing to unpack .../aspell-sk_2.02-0-7_all.deb ...
Unpacking aspell-sk (2.02-0-7) over (2.02-0-6) ...
Nastavuje sa balík aspell-sk (2.02-0-7) ...
Processing triggers for dictionaries-common (1.28.1) ...
aspell-autobuildhash: processing: sk [sk].

@zdenop
Copy link
Contributor Author

zdenop commented Feb 10, 2021

verzia 2.02-x-x urcite nie je ok.

# verzia: 2.05-alpha, 2021-02-07

@andrewshadura
Copy link

Nechápem, ako to myslíš?

@zdenop
Copy link
Contributor Author

zdenop commented Feb 10, 2021

Nastavuje sa balík aspell-sk (2.02-0-6) ...

predpokladam, ze data su aktualne cize 2.05-alpha

@andrewshadura
Copy link

Ono to je tak, že v zdrojovom balíku sú dáta z 2.02-0, ale „za jazdy“ sa generuje slovník/affixy z hunspell-sk 2.05 (z libreoffice-dictionaries).
Možno by dávalo zmysel vyhodiť všetko okrem metadát a zmeniť verziu.

@andrewshadura
Copy link

Ale celkovo si myslím, že pre slovníky schéma verziovania na štýl 2.05 nedáva zmysel; ani semver by sa nehodilo.
Najlepšie IMHO je verziovanie podľa dátumu, napr.: 20210210.0.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants