[da-stavekontrol] Status på sprogværktøjer i LibreOffice

classic Classic list List threaded Threaded
2 messages Options
Leif Lodahl Leif Lodahl
Reply | Threaded
Open this post in threaded view
|

[da-stavekontrol] Status på sprogværktøjer i LibreOffice

Hej alle,
I forbindelse med årsskiftet plejer jeg at give en status på forskellige
dele af vores projekt, herunder også en status på diverse sprogværktøjer.

Vi når det ikke til nytår, men måske første februar?

Jeg vil derfor gerne have en status over, hvad vi (I) har opnået i løbet af
året 2015:
Stavekontrol
Synonymordbog
Grammatikkontrol
Orddeling

Jeg overvejer (igen) at forsøge at puste liv i grammatikkontrollen.

Konkret vil jeg skrive en artikel i nyhedsbrevet med nogle simple eksempler.

Mig bekendt er der ikke sket noget siden Henrik Bendt lavede en større
opdatering, herunder skrev en rigtig god dokumentation (
https://wiki.documentfoundation.org/DA/LanguageTool ). Jeg har kigget lidt
på det, og jeg mener at vi dels kan kopiere nogle af reglerne fra de andre
sprog, og dels kan oprette nogle simple regler, blandt andet om "forkert
brug af faste vendinger".

Fik vi nogensinde lavet en tagger, så vi kan lave sætningsanalyse og dermed
gennemføre egentlig sætningsanalyse.


/Leif

--
Send en e-mail til [hidden email] for instruktioner om hvordan du ophæver dit abonnement
Problemer? http://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på http://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke efterfølgende slettes
esben_aaberg esben_aaberg
Reply | Threaded
Open this post in threaded view
|

SV: [da-stavekontrol] Status på sprogværktøjer i LibreOffice

Hej Leif
Her er en opremsning af nogle af de ting jeg kan huske fra 2015.

Stavekontrol (Stavekontrolden):Support for genitiv med es, som var tilladt før 2001, er fjernet fra de fleste ord.Nye ordklasser for ord der ender på -el, hvor el bliver til -le i bestemt ental. Disse er et udspring af ny retskrivningspraksis i Retskrivningsordbogen af 2012. 697 ord tildelt de nye ordklasser for ord der ender på -el.Ca. 380 flere ord har fået tilføjet ordsammensætningsopmærkning.Ca. 200 verber med dobbeltkonsonant har fået en strammere opmærkning.Over 2000 ord er blevet ændret eller tilføjet i alt.Div. test- og bygge script er forbedret.
Version 2.3 af Stavekontrolden er frigivet som udvidelse, men er ikke i LibreOffice kodetræet endnu.

Synonymordbog:Nyest udgave af koden, udviklet af Magenta, til bygning af synonymordbogen har været anvendt til den aktuelle udgave.Data fra DanNet er opdateret fra version 2.1 til 2.2.Der er fjernet en del apostroffer fra ordforbindelser, hvor der indgår flere ord i reference ordet.Der er rettet og slettet nogle fejl i vores p.t. offline synonymordbogs-websides database.
Regressionstestene er blevet forbedret.Script til at samle data og bygge synonymordbogen er lavet.

Grammatikkontrol (LanguageTool):Oversættelsen af brugergrænsefladen vedligeholdt.Websiderne "Community Website" og "wikicheck" er oversat.Tagger har fået rettet nogle fejl, tilføjet nogle flere tags, og en del flere ord er opmærket.Scriptlinjer der laver tags, her er 13 databasetræk og 38 reverse engineering af dic-filen.Script til regressionstest af tagger er lavet.Hunspell ordbogen er opdateret til Stavekontrolden version 2.3.

Der har været arbejdet med XML-regler, der gør kraftig bruger af tags. Men det er ikke lykkedes at lave nogle gode regler, hvor der enten ikke er for mange falske positiver eller at reglerne bliver for tynde.

Orddeling:Status quo, vi bruger stadig de mønstre Frank Jensen producerede i ca. 1988, og som Preben Randhol bearbejdede for bedre kompatibilitet i 1994.
Bag scenen har jeg udvidet mine test data en smule, lavet nogle forsøg og haft en god snak med László Németh udvikleren af Hyphen (orddelingsmotoren der bl.a. bruges i LibreOffice) til LibreOffice konferencen i Aarhus. Men summen er at der kun er kommet nogle idéer ned i noterne.

Med venlig hilsen
Esben Aaberg


      Fra: Leif Lodahl <[hidden email]>
 Til: "[hidden email]" <[hidden email]> wikicheck Sendt: 19:11 tirsdag den 29. december 2015
 Emne: [da-stavekontrol] Status på sprogværktøjer i LibreOffice
   
Hej alle,
I forbindelse med årsskiftet plejer jeg at give en status på forskellige
dele af vores projekt, herunder også en status på diverse sprogværktøjer.

Vi når det ikke til nytår, men måske første februar?

Jeg vil derfor gerne have en status over, hvad vi (I) har opnået i løbet af
året 2015:
Stavekontrol
Synonymordbog
Grammatikkontrol
Orddeling

Jeg overvejer (igen) at forsøge at puste liv i grammatikkontrollen.

Konkret vil jeg skrive en artikel i nyhedsbrevet med nogle simple eksempler.

Mig bekendt er der ikke sket noget siden Henrik Bendt lavede en større
opdatering, herunder skrev en rigtig god dokumentation (
https://wiki.documentfoundation.org/DA/LanguageTool ). Jeg har kigget lidt
på det, og jeg mener at vi dels kan kopiere nogle af reglerne fra de andre
sprog, og dels kan oprette nogle simple regler, blandt andet om "forkert
brug af faste vendinger".

Fik vi nogensinde lavet en tagger, så vi kan lave sætningsanalyse og dermed
gennemføre egentlig sætningsanalyse.


/Leif

--
Send en e-mail til [hidden email] for instruktioner om hvordan du ophæver dit abonnement
Problemer? http://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på http://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke efterfølgende slettes


 
--
Send en e-mail til [hidden email] for instruktioner om hvordan du ophæver dit abonnement
Problemer? http://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på http://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke efterfølgende slettes