[da-stavekontrol] tagger: pronomen - stedord

classic Classic list List threaded Threaded
3 messages Options
esben_aaberg esben_aaberg
Reply | Threaded
Open this post in threaded view
|

[da-stavekontrol] tagger: pronomen - stedord

Hej Jan

Jeg har været ved at opdatere taggeren, så disse 4 ordklasser nu også er dækket:

adv    adverbium    biord
int    interjektion    udråbsord

kon    konjunktion    bindeord
ono    onomatopoietikon    lydord


Hvis du er interesseret i den opdaterede fil, så sig til! Dog vil jeg
anbefale at den første regel du laver ikke er afhængig af taggeren, for
at holde kompleksiteten nede i indlæringsfasen.


Jeg har en lille opgave jeg vil høre om du var interesseret i at løse!

Vi skal have opmærket pronomen (stedord) til taggeren!

Nedenfor finder du beskrivelse af de elementer jeg tro du skal bruge for at komme i gang.

Det jeg/vi har behov for er en fil med ordet<tabulator>opslagsordet<tabulator>tagsene:med:kolon:separator.


Er det en opgave du har lyst til at løse?



Med venlig hilsen

Esben Aaberg




Her er de pronominer jeg har forsøgt at opmærke, som i dag er en del af taggeren (Jeg kan sende filen, da formateringen bliver ødelaget af e-mailen):


jeg    jeg    pron:sin:nom
mig   
 jeg    pron:sin:akk
du    du    pron:sin:nom
dig    du    pron:sin:akk
han    ham    pron:sin:nom
ham    ham    pron:sin:akk
hans    ham    pron:sin:gen
hun    hun    pron:sin:nom
hende    hun    pron:sin:akk
hendes    hun    pron:sin:gen
vi    vi    pron:plu:nom
os    vi    pron:plu:akk
vores    vi    pron:plu:gen
I    I    pron:plu:nom
jer    I    pron:plu:akk
jeres    I    pron:plu:gen
de    de    pron:plu:nom
dem   
 de    pron:plu:akk
deres    de    pron:plu:gen
sig    sig    pron:plu:akk




Her er beskrivelsen af hvordan de skal mærkes op, husk at sætte
spørgsmålstegn ved alt, da jeg er lidt usikker på om jeg har forstået
dette korrekt og hvilket tags der giver mening!


Udsnit fra filen i languagetool-standalone:
/LanguageTool-2.1/org/languagetool/resource/da/danish_tags.txt


Pronomen: -ikke implementeret

pron    pronomen    stedord

sin    singularis    ental
plu    pluralis    flertal

*1per       1. person       ━┓
*2per       2. person       ━╋━ Er ikke med i opmærkningen
*3perm    3. person m? ━┫
*3perf      3. person f?   ━┫   
*3pern     3. person n?  ━┛

nom    nominativ    grundled    grundledsfald, nævnefald
akk    akkusativ    genstandsled   
 afhængighedsfald, genstandsfald
*dat    dativ        (findes ikke på dansk - kun i fastgroede udtryk)
gen    genitiv     ejefald     tillægsfald   


*) Tags marked with * are not in the tagger.




Her er et træk fra vores database med de ord der er markeret som værende pronomen:

|55|vi|vi, os, vores|
|55|somme|somme, sommes|NULL
|55|sin|sin, sit, sine, sines|NULL
|55|sig|sig|NULL
|55|selv|selv|NULL
|55|nogenting|nogenting, nogentings|NULL
|55|nogensomhelst|nogensomhelst,
 nogensomhelsts|NULL
|55|nogen|noget, nogets, nogle, nogen, nogles, nogens|NULL
|55|min|min, mit, mine, mines|NULL
|55|man|man|NULL
|55|jeg|jeg, mig|NULL
|55|ingenting|ingenting, ingentings|NULL
|55|ingen|intet, intets, ingen, ingens|NULL
|55|I|i, eder, jer, eders, jeres|NULL
|55|hvo|hvo|NULL
|55|hvilken|hvilken, hvilkens, hvilket, hvilkets, hvilke, hvilkes|NULL
|55|hverandre|hverandre, hverandres|NULL
|55|hver|hver, hvers, hvert, hverts|NULL
|55|hvem|hvem, hvis|NULL
|55|hvad|hvad|NULL
|55|hun|hun, hende, hendes|NULL
|55|hinanden|hinanden, hinandens|NULL
|55|hin|hin, hins, hint, hints, hine, hines|NULL
|55|han|han, ham, hans|NULL
|55|enhver|enhver, enhvers, ethvert, ethverts|NULL
|55|en|en, ens, et, ets|NULL
|55|du|du, dig|NULL
|55|din|din, dit, dine, dines|NULL
|55|det|det|NULL
|55|denne|denne, dennes, dette, dettes, disse, disses|NULL
|55|den|den, dens|NULL
|55|De|de, dem,
 deres|
|55|begge|begge, begges|NULL
|55|anden|anden, andens, andet, andets, andre, andres|NULL
|55|alting|alting, altings|NULL
|55|allerhøjstsamme|allerhøjstsamme, allerhøjstsammes|NULL
|55|vor|vor, vort, vore|NULL
|55|allesammen| | 

Her ud over er der et jeg er i tvivl om "al" RO siger adj, DSL siger pronomen.

http://www.dsn.dk/dsn.dk?retskriv=al

http://ordnet.dk/ddo/ordbog?select=al,2&query=al
--
Send en e-mail til [hidden email] for instruktioner om hvordan du ophæver dit abonnement
Problemer? http://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på http://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke efterfølgende slettes
Leif Lodahl Leif Lodahl
Reply | Threaded
Open this post in threaded view
|

Re: [da-stavekontrol] tagger: pronomen - stedord

Hej Esben,
Som sædvanligt: Tusind tak for den store indsats du gør for de danske
sprogværktøjer.

Forstår jeg din mail korrekt, så er der en række "lister", som skal
påføres detaljer (opmærkning). Du har selv gennemført de første, men
pronominer vil du gerne have hjælp til.

Hvilke andre lignende lister kan vi forvente at se fremadrettet? Jeg
tænker på om vi skal organisere arbejdet, f.eks. lægge dem i et Google
regneark?

Hvis der er nogen der har lyst til at tage fat i at lave regler, så sig
endelig til. Det vil være dejligt, hvis nogen kan begynde at
eksperimentere med at lave sætningsanalyse. En idè kan være at kigge i
de hollandkse og norske regler. Andre sprog kan også inspirere.

Skal jeg prøve at kontakte Henrik for at få ham til at holde et "kursus"?

Jeg stiller en masse spørgsmål, og alle som er interesserede, må gerne
give sig til kende med meninger og ideer. Selv er jeg slet ikke
kvalificeret til at bidrage med det lingvistiske, men bidrager gerne med
andre ting.


/Leif



Den 07-04-2013 11:52, Esben Aaberg skrev:

> Hej Jan
>
> Jeg har været ved at opdatere taggeren, så disse 4 ordklasser nu også er dækket:
>
> adv    adverbium    biord
> int    interjektion    udråbsord
>
> kon    konjunktion    bindeord
> ono    onomatopoietikon    lydord
>
>
> Hvis du er interesseret i den opdaterede fil, så sig til! Dog vil jeg
> anbefale at den første regel du laver ikke er afhængig af taggeren, for
> at holde kompleksiteten nede i indlæringsfasen.
>
>
> Jeg har en lille opgave jeg vil høre om du var interesseret i at løse!
>
> Vi skal have opmærket pronomen (stedord) til taggeren!
>
> Nedenfor finder du beskrivelse af de elementer jeg tro du skal bruge for at komme i gang.
>
> Det jeg/vi har behov for er en fil med ordet<tabulator>opslagsordet<tabulator>tagsene:med:kolon:separator.
>
>
> Er det en opgave du har lyst til at løse?
>
>
>
> Med venlig hilsen
>
> Esben Aaberg
>
>
>
>
> Her er de pronominer jeg har forsøgt at opmærke, som i dag er en del af taggeren (Jeg kan sende filen, da formateringen bliver ødelaget af e-mailen):
>
>
> jeg    jeg    pron:sin:nom
> mig
>   jeg    pron:sin:akk
> du    du    pron:sin:nom
> dig    du    pron:sin:akk
> han    ham    pron:sin:nom
> ham    ham    pron:sin:akk
> hans    ham    pron:sin:gen
> hun    hun    pron:sin:nom
> hende    hun    pron:sin:akk
> hendes    hun    pron:sin:gen
> vi    vi    pron:plu:nom
> os    vi    pron:plu:akk
> vores    vi    pron:plu:gen
> I    I    pron:plu:nom
> jer    I    pron:plu:akk
> jeres    I    pron:plu:gen
> de    de    pron:plu:nom
> dem
>   de    pron:plu:akk
> deres    de    pron:plu:gen
> sig    sig    pron:plu:akk
>
>
>
>
> Her er beskrivelsen af hvordan de skal mærkes op, husk at sætte
> spørgsmålstegn ved alt, da jeg er lidt usikker på om jeg har forstået
> dette korrekt og hvilket tags der giver mening!
>
>
> Udsnit fra filen i languagetool-standalone:
> /LanguageTool-2.1/org/languagetool/resource/da/danish_tags.txt
>
>
> Pronomen: -ikke implementeret
>
> pron    pronomen    stedord
>
> sin    singularis    ental
> plu    pluralis    flertal
>
> *1per       1. person       ━┓
> *2per       2. person       ━╋━ Er ikke med i opmærkningen
> *3perm    3. person m? ━┫
> *3perf      3. person f?   ━┫
> *3pern     3. person n?  ━┛
>
> nom    nominativ    grundled    grundledsfald, nævnefald
> akk    akkusativ    genstandsled
>   afhængighedsfald, genstandsfald
> *dat    dativ        (findes ikke på dansk - kun i fastgroede udtryk)
> gen    genitiv     ejefald     tillægsfald
>
>
> *) Tags marked with * are not in the tagger.
>
>
>
>
> Her er et træk fra vores database med de ord der er markeret som værende pronomen:
>
> |55|vi|vi, os, vores|
> |55|somme|somme, sommes|NULL
> |55|sin|sin, sit, sine, sines|NULL
> |55|sig|sig|NULL
> |55|selv|selv|NULL
> |55|nogenting|nogenting, nogentings|NULL
> |55|nogensomhelst|nogensomhelst,
>   nogensomhelsts|NULL
> |55|nogen|noget, nogets, nogle, nogen, nogles, nogens|NULL
> |55|min|min, mit, mine, mines|NULL
> |55|man|man|NULL
> |55|jeg|jeg, mig|NULL
> |55|ingenting|ingenting, ingentings|NULL
> |55|ingen|intet, intets, ingen, ingens|NULL
> |55|I|i, eder, jer, eders, jeres|NULL
> |55|hvo|hvo|NULL
> |55|hvilken|hvilken, hvilkens, hvilket, hvilkets, hvilke, hvilkes|NULL
> |55|hverandre|hverandre, hverandres|NULL
> |55|hver|hver, hvers, hvert, hverts|NULL
> |55|hvem|hvem, hvis|NULL
> |55|hvad|hvad|NULL
> |55|hun|hun, hende, hendes|NULL
> |55|hinanden|hinanden, hinandens|NULL
> |55|hin|hin, hins, hint, hints, hine, hines|NULL
> |55|han|han, ham, hans|NULL
> |55|enhver|enhver, enhvers, ethvert, ethverts|NULL
> |55|en|en, ens, et, ets|NULL
> |55|du|du, dig|NULL
> |55|din|din, dit, dine, dines|NULL
> |55|det|det|NULL
> |55|denne|denne, dennes, dette, dettes, disse, disses|NULL
> |55|den|den, dens|NULL
> |55|De|de, dem,
>   deres|
> |55|begge|begge, begges|NULL
> |55|anden|anden, andens, andet, andets, andre, andres|NULL
> |55|alting|alting, altings|NULL
> |55|allerhøjstsamme|allerhøjstsamme, allerhøjstsammes|NULL
> |55|vor|vor, vort, vore|NULL
> |55|allesammen| |
>
> Her ud over er der et jeg er i tvivl om "al" RO siger adj, DSL siger pronomen.
>
> http://www.dsn.dk/dsn.dk?retskriv=al
>
> http://ordnet.dk/ddo/ordbog?select=al,2&query=al


--
Send en e-mail til [hidden email] for instruktioner om hvordan du ophæver dit abonnement
Problemer? http://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på http://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke efterfølgende slettes
esben_aaberg esben_aaberg
Reply | Threaded
Open this post in threaded view
|

SV: [da-stavekontrol] tagger: pronomen - stedord

Hej Leif

Alle ord der er stærkt bøjede skal i princippet håndteres manuelt eller lagres på en anden måde end vi har i dag.

Stedord er overkommelig lille mængde af ord (ca. 100 ord), som hurtig vil kunne opmærkes. Jeg har ikke opdaget andre ordklasser, hvor det er realistisk inden for rimelig tid at udføre dem manuelt.


Når der skrives regler bør de tage hensyn til at der kan være ord der er ukendte, hvis der er enkelt ord der står i vejen for at en regel vil virke, kan de ord tilføjes menuet. Et eksempel på et sådan ord kunne være "smide" for at dække dobbeltbetydningen af "smed".


Jeg tro Jan vil kunne opmærke dem hurtigere end mig, og han havde givet udtryk for at han gerne ville hjælpe. Han er også vendt tilbage med svar off-list, og kigger på det i den kommende uge.

Der er pt. 470511 ord med detaljeret opmærkninger i taggerens ordbog, og jeg vil stille og rolig kunne udbygge dette med de scripts jeg bruger/udvikler.


Hvis vi generelt kigger udover sprogprojekterne, så her efter 6 år, opdager jeg stadig hurtigere fejl og mangler end at jeg kan nå at rette dem. Så alle der er interesseret i at deltage skal ikke holde sig tilbage. Alle smårettelse er med til at højne kvaliteten.

Der er ikke nogen norsk regler, men de svenske bruger same syntaks som vores.


Med venlig hilsen

Esben Aaberg



________________________________
 Fra: leif <[hidden email]>
Til: [hidden email]
Sendt: 21:22 søndag den 7. april 2013
Emne: Re: [da-stavekontrol] tagger: pronomen - stedord
 
Hej Esben,
Som sædvanligt: Tusind tak for den store indsats du gør for de danske
sprogværktøjer.

Forstår jeg din mail korrekt, så er der en række "lister", som skal
påføres detaljer (opmærkning). Du har selv gennemført de første, men
pronominer vil du gerne have hjælp til.

Hvilke andre lignende lister kan vi forvente at se fremadrettet? Jeg
tænker på om vi skal organisere arbejdet, f.eks. lægge dem i et Google
regneark?

Hvis der er nogen der har lyst til at tage fat i at lave regler, så sig
endelig til. Det vil være dejligt, hvis nogen kan begynde at
eksperimentere med at lave sætningsanalyse. En idè kan være at kigge i
de hollandkse og norske regler. Andre sprog kan også inspirere.

Skal jeg prøve at kontakte Henrik for at få ham til at holde et "kursus"?

Jeg stiller en masse spørgsmål, og alle som er interesserede, må gerne
give sig til kende med meninger og ideer. Selv er jeg slet ikke
kvalificeret til at bidrage med det lingvistiske, men bidrager gerne med
andre ting.


/Leif
--
Send en e-mail til [hidden email] for instruktioner om hvordan du ophæver dit abonnement
Problemer? http://da.libreoffice.org/kontakt-os/postlister/
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
Listens arkiv er tilgængelig på http://listarchives.libreoffice.org/da/stavekontrol/
Alle beskeder du sender til listen bliver publiseret her og kan ikke efterfølgende slettes