[da-stavekontrol] Sprognævnet frigiver Retskrivningsordbogen

classic Classic list List threaded Threaded
2 messages Options
Leif Lodahl Leif Lodahl
Reply | Threaded
Open this post in threaded view
|

[da-stavekontrol] Sprognævnet frigiver Retskrivningsordbogen

I forbindelse med finanslovsforhandlingerne er der fra 2018 og frem
øremærket 0,5 mio. kr. til Dansk Sprognævn til at frikøbe
Retskrivningsordbogen til sprogteknologiske formål.

https://dsn.dk/nyt/nyheder/2017/sprognaevnets-ordlister-bliver-gratis-fra-2018


Er det noget vi kan få nytte af?

Hvis det giver mening, vil jeg gerne skrive en artikel til nyhedsbrevet,
men jeg skal have input.


/Leif

--
Send en e-mail til [hidden email] for instruktioner om hvordan du ophæver dit abonnement
Problemer? https://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: https://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på https://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke efterfølgende slettes
esben_aaberg esben_aaberg
Reply | Threaded
Open this post in threaded view
|

SV: [da-stavekontrol] Sprognævnet frigiver Retskrivningsordbogen

Super fedt...
For det første fjerner det en hver tvivl, om hvad vi må. I dag bruger jeg tid på at finde ord, via artikler, dokumenter, Google crawling og andre kilder, ud fra devisen har jeg fundet ordet må jeg gerne slå det op hos DSN og DSL. Dette sikre naturligvis at det er tidstypiske ord der kommer i vores ordlister, men det er til tider en tidskrævende proces.
I modsætning til RO2012.opslagsord.med.homnr.og.ordklasse, som DSN stillede til rådighed, så vi de nye lister fra DSN repræsentere den aktuelle stavemåde for alle ord. Hvilket vil gøre at med lidt script halløj, vil vi kunne tillade os at tilføje alle ord til Stavekontroldens udgivelser, da DSNs lister vil være af meget høj kvalitet. Det vil betyde at nogle enkelte sjældent brugte ord med 0 til 50, hits på Google, vil blive tilføjet, samt nogle ditto sjælene ord som i dag er blevet undladt, da de vil kunne blive forvekslet med meget brugte ord.

Hvis jeg skal lave en statistisk estimering ud fra RO2012.fuldformsliste.snas og RO2012.opslagsord.med.homnr.og.ordklasse, vil jeg tro at det vil give: 2.000-3.000 nye ord, som vi ikke genkender i dag
2.000-4.000 sammensatte ord, som vi genkender i dag, men ikke ville kunne komme med staveforslag til, ved forkert stavning
I dag har Stavekontrolden ca. 105.000 ord, så det vil være en tilvækst på ca. 5 %
Analyse på en "komplet" fuldformsliste, ville med stor sandsynlighed også kunne bruges til at afsløre fejl i det vi allerede har opmærket.


Med venlig hilsen
Esben Aaberg



      Fra: Leif Lodahl <[hidden email]>
 Til: "[hidden email]" <[hidden email]>
 Sendt: 10:00 tirsdag den 19. december 2017
 Emne: [da-stavekontrol] Sprognævnet frigiver Retskrivningsordbogen
   
I forbindelse med finanslovsforhandlingerne er der fra 2018 og frem
øremærket 0,5 mio. kr. til Dansk Sprognævn til at frikøbe
Retskrivningsordbogen til sprogteknologiske formål.

https://dsn.dk/nyt/nyheder/2017/sprognaevnets-ordlister-bliver-gratis-fra-2018


Er det noget vi kan få nytte af?

Hvis det giver mening, vil jeg gerne skrive en artikel til nyhedsbrevet,
men jeg skal have input.


/Leif

--
Send en e-mail til [hidden email] for instruktioner om hvordan du ophæver dit abonnement
Problemer? https://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: https://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på https://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke efterfølgende slettes


   
--
Send en e-mail til [hidden email] for instruktioner om hvordan du ophæver dit abonnement
Problemer? https://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: https://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på https://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke efterfølgende slettes