[da-stavekontrol] Amatørlingvistik

classic Classic list List threaded Threaded
3 messages Options
Leif Lodahl Leif Lodahl
Reply | Threaded
Open this post in threaded view
|

[da-stavekontrol] Amatørlingvistik

Hej alle,
Bare til alm. information, så har Peter Brodersen på G+ lavet lidt
statistisk sproggymnastik:
https://plus.google.com/u/0/104724014751924900780/posts

Nå, spøg til side.

Vi skal lige være opmærksomme på, at der sker rigtig meget på området
"åbne data". Det er et emne jeg før har berørt, og jeg har siden været i
snak med nogle af de centrale embedsmænd (eller hedder det
embedskvinder?). Der er *virkelig* god stemning omkring projektet, og
budskabet fra dem jeg har talt med er, at vi bare skal sige til hvis der
er data som vi mangler. Det er ikke alle datasæt som er blevet
identificeret endnu, og hvis vi kan pege på noget som ikke er frigivet,
skal vi bare sige til.

Fik vi i øvrigt nogensinde indlæst stednavnelisten?

Nævnte Peter Brodersen er rigtig god til at behandle store mængder data
(se www.findvej.dk m.fl.) og han er også interesseret i ordbøger. Hvis
vi har konkrete opgaver, så kan vi bede ham om hjælp.

Noget af det vigtigste for mig er, at vi tilrettelægger arbejdet, så det
ikke er centreret om meget få (eller en enkelt) personer. Vi *skal* have
flere med, for ellers når vi ikke at udnytte de muligheder vi har.
Seneste henvendelse fra Jan Møgelbjerg er et godt eksempel.

Ideer modtages med kyshånd.

Skal vi igen forsøge at åbne for samarbejde med andre? Apertium, DSL,
Ubuntu, Mozilla og Wikipedia?

F.eks. tror jeg umiddelbart at vores ordliste kan gøre nytte på
http://da.wiktionary.org/wiki/Forside .


Mvh.
Leif Lodahl


--
Send en e-mail til [hidden email] for instruktioner om hvordan du ophæver dit abonnement
Problemer? http://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på http://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke efterfølgende slettes

esben_aaberg esben_aaberg
Reply | Threaded
Open this post in threaded view
|

[da-stavekontrol] SV: [da-stavekontrol] Amatørlingvistik

Hej Leif

Vi har i tidernes morgen indlæst steder fra Stednavneudvalget, om det er det samme som stednavnelisten, skal jeg lade være usagt, men jeg tror der er en hvis sammenfald. Jeg har stadig en drøm om at få lavet nogle lister udenfor Stavekontroldens-webinterface med egennavne, hvor der evt. knyttes noget statistik og andre udvælgelsesparameter til, hvor det så er meningen at ordene kommer i ordbogen på bygningstidspunktet. Dette ville give et bedre overblik over hvad status er på egennavn, samt give mulighed for at fortryde indlæsning af en liste med egennavne, og muligheden for at lave flere former for fin tuning. Hvilket egennavne er det man ønsker på sigt som forlag eller egennavne der kun bliver godkendt men ikke kommer som forslag, det kan være lidt svært at sætte grænserne. Der er de åbenlyse landenavne, bynavne, mest brugte fornavne, mest brugte efternavn, men hvad med politikers, kunstners og kendissers navne, floder, oceaner,
 vulkaner, biler, branding osv.
En helt anden ting er stavemåder:
Nuuk el./og Godthåb
Hamborg el./og Hamburg
Flensborg el./og Flensburg
Ved at få det ud i separate lister kan man tage en diskussion, og så hurtig tilpasse ordbogen derefter, hvis man vel og mærket har nogle gode parameter at lave udvælgelsen ud fra.
Flere af de lister man kunne have liggende ville være oplagte at de var baseret på "åbne data".

Jeg har ikke rigtig forstået ideen med Wiktionary! Hvad laver islandske, italienske og tyrkiske ord i den dansk ordbog?

http://da.wiktionary.org/wiki/Eyja%C3%A1lfa

http://da.wiktionary.org/wiki/dolci

http://da.wiktionary.org/wiki/Danca

Nu har jeg aldrig rigtig sat mig ind i Wiki-konceptet, selv om jeg ar været glad for at bruge deres data samt rette nogle stavefejl og fjernet noget hærværk. Er der en mulighed for at uploade data? Jeg har kun set en API til at hente data.



Med venlig hilsen

Esben Aaberg


________________________________
 Fra: leif <[hidden email]>
Til: "[hidden email]" <[hidden email]>
Sendt: 12:16 mandag den 22. april 2013
Emne: [da-stavekontrol] Amatørlingvistik
 

Hej alle,
Bare til alm. information, så har Peter Brodersen på G+ lavet lidt
statistisk sproggymnastik:
https://plus.google.com/u/0/104724014751924900780/posts

Nå, spøg til side.

Vi skal lige være opmærksomme på, at der sker rigtig meget på området
"åbne data". Det er et emne jeg før har berørt, og jeg har siden været i
snak med nogle af de centrale embedsmænd (eller hedder det
embedskvinder?). Der er *virkelig* god stemning omkring projektet, og
budskabet fra dem jeg har talt med er, at vi bare skal sige til hvis der
er data som vi mangler. Det er ikke alle datasæt som er blevet
identificeret endnu, og hvis vi kan pege på noget som ikke er frigivet,
skal vi bare sige til.

Fik vi i øvrigt nogensinde indlæst stednavnelisten?

Nævnte Peter Brodersen er rigtig god til at behandle store mængder data
(se www.findvej.dk m.fl.) og han er også interesseret i ordbøger. Hvis
vi har konkrete opgaver, så kan vi bede ham om hjælp.

Noget af det vigtigste for mig er, at vi tilrettelægger arbejdet, så det
ikke er centreret om meget få (eller en enkelt) personer. Vi *skal* have
flere med, for ellers når vi ikke at udnytte de muligheder vi har.
Seneste henvendelse fra Jan Møgelbjerg er et godt eksempel.

Ideer modtages med kyshånd.

Skal vi igen forsøge at åbne for samarbejde med andre? Apertium, DSL,
Ubuntu, Mozilla og Wikipedia?

F.eks. tror jeg umiddelbart at vores ordliste kan gøre nytte på
http://da.wiktionary.org/wiki/Forside .


Mvh.
Leif Lodahl


--
Send en e-mail til [hidden email] for instruktioner om hvordan du ophæver dit abonnement
Problemer? http://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på http://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke efterfølgende slettes
--
Send en e-mail til [hidden email] for instruktioner om hvordan du ophæver dit abonnement
Problemer? http://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på http://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke efterfølgende slettes
Leif Lodahl Leif Lodahl
Reply | Threaded
Open this post in threaded view
|

Re: [da-stavekontrol] SV: [da-stavekontrol] Amatørlingvistik

Esben skrev:
Vi har i tidernes morgen indlæst steder fra Stednavneudvalget, om det er
det samme som stednavnelisten, skal jeg lade være usagt, men jeg tror der
er en hvis sammenfald.

Svar:
Stednavnelisten er en del af de åbne grunddata, som indeholder alle
officielle stednavne i Danmark:
http://download.kortforsyningen.dk/content/stednavne-namedplace

/Leif


Den 22. apr. 2013 23.31 skrev Esben Aaberg <[hidden email]>:

> Hej Leif
>
> Vi har i tidernes morgen indlæst steder fra Stednavneudvalget, om det er
> det samme som stednavnelisten, skal jeg lade være usagt, men jeg tror der
> er en hvis sammenfald. Jeg har stadig en drøm om at få lavet nogle lister
> udenfor Stavekontroldens-webinterface med egennavne, hvor der evt. knyttes
> noget statistik og andre udvælgelsesparameter til, hvor det så er meningen
> at ordene kommer i ordbogen på bygningstidspunktet. Dette ville give et
> bedre overblik over hvad status er på egennavn, samt give mulighed for at
> fortryde indlæsning af en liste med egennavne, og muligheden for at lave
> flere former for fin tuning. Hvilket egennavne er det man ønsker på sigt
> som forlag eller egennavne der kun bliver godkendt men ikke kommer som
> forslag, det kan være lidt svært at sætte grænserne. Der er de åbenlyse
> landenavne, bynavne, mest brugte fornavne, mest brugte efternavn, men hvad
> med politikers, kunstners og kendissers navne, floder, oceaner,
>  vulkaner, biler, branding osv.
> En helt anden ting er stavemåder:
> Nuuk el./og Godthåb
> Hamborg el./og Hamburg
> Flensborg el./og Flensburg
> Ved at få det ud i separate lister kan man tage en diskussion, og så
> hurtig tilpasse ordbogen derefter, hvis man vel og mærket har nogle gode
> parameter at lave udvælgelsen ud fra.
> Flere af de lister man kunne have liggende ville være oplagte at de var
> baseret på "åbne data".
>
> Jeg har ikke rigtig forstået ideen med Wiktionary! Hvad laver islandske,
> italienske og tyrkiske ord i den dansk ordbog?
>
> http://da.wiktionary.org/wiki/Eyja%C3%A1lfa
>
> http://da.wiktionary.org/wiki/dolci
>
> http://da.wiktionary.org/wiki/Danca
>
> Nu har jeg aldrig rigtig sat mig ind i Wiki-konceptet, selv om jeg ar
> været glad for at bruge deres data samt rette nogle stavefejl og fjernet
> noget hærværk. Er der en mulighed for at uploade data? Jeg har kun set en
> API til at hente data.
>
>
>
> Med venlig hilsen
>
> Esben Aaberg
>
>
> ________________________________
>  Fra: leif <[hidden email]>
> Til: "[hidden email]" <[hidden email]>
> Sendt: 12:16 mandag den 22. april 2013
> Emne: [da-stavekontrol] Amatørlingvistik
>
>
> Hej alle,
> Bare til alm. information, så har Peter Brodersen på G+ lavet lidt
> statistisk sproggymnastik:
> https://plus.google.com/u/0/104724014751924900780/posts
>
> Nå, spøg til side.
>
> Vi skal lige være opmærksomme på, at der sker rigtig meget på området
> "åbne data". Det er et emne jeg før har berørt, og jeg har siden været i
> snak med nogle af de centrale embedsmænd (eller hedder det
> embedskvinder?). Der er *virkelig* god stemning omkring projektet, og
> budskabet fra dem jeg har talt med er, at vi bare skal sige til hvis der
> er data som vi mangler. Det er ikke alle datasæt som er blevet
> identificeret endnu, og hvis vi kan pege på noget som ikke er frigivet,
> skal vi bare sige til.
>
> Fik vi i øvrigt nogensinde indlæst stednavnelisten?
>
> Nævnte Peter Brodersen er rigtig god til at behandle store mængder data
> (se www.findvej.dk m.fl.) og han er også interesseret i ordbøger. Hvis
> vi har konkrete opgaver, så kan vi bede ham om hjælp.
>
> Noget af det vigtigste for mig er, at vi tilrettelægger arbejdet, så det
> ikke er centreret om meget få (eller en enkelt) personer. Vi *skal* have
> flere med, for ellers når vi ikke at udnytte de muligheder vi har.
> Seneste henvendelse fra Jan Møgelbjerg er et godt eksempel.
>
> Ideer modtages med kyshånd.
>
> Skal vi igen forsøge at åbne for samarbejde med andre? Apertium, DSL,
> Ubuntu, Mozilla og Wikipedia?
>
> F.eks. tror jeg umiddelbart at vores ordliste kan gøre nytte på
> http://da.wiktionary.org/wiki/Forside .
>
>
> Mvh.
> Leif Lodahl
>
>
> --
> Send en e-mail til [hidden email] for instruktioner
> om hvordan du ophæver dit abonnement
> Problemer? http://da.libreoffice.org/kontakt-os/postlister/
> Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
> Listens arkiv er tilgængelig på
> http://listarchives.libreoffice.org/da/stavekontrol/
> Alle beskeder du sender til listen bliver publiseret her og kan ikke
> efterfølgende slettes
> --
> Send en e-mail til [hidden email] for instruktioner
> om hvordan du ophæver dit abonnement
> Problemer? http://da.libreoffice.org/kontakt-os/postlister/
> Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
> Listens arkiv er tilgængelig på
> http://listarchives.libreoffice.org/da/stavekontrol/
> Alle beskeder du sender til listen bliver publiseret her og kan ikke
> efterfølgende slettes
>

--
Send en e-mail til [hidden email] for instruktioner om hvordan du ophæver dit abonnement
Problemer? http://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på http://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke efterfølgende slettes