Keele mõõtmed keeletehnoloogias

1 minut

Üha rohkem räägitakse keeletehnoloogia konverentsidel nii piiri taga kui ka Eestis sellest, mida suudavad inimesed vabatahtliku osalusega ära teha veebis esitatud andmete täiendamisel või parandamisel. Kõneks on crowdsourcing, eesti keeles levinumaks vasteks rahvahange. Nii Eestis kui Soomes on sel moel näiteks transkribeeritud käsikirjalisi tekste või parandatud vanemate kirjatähtede tärktuvastust. Omamoodi rahvahange on ka asjatundlikult koostatud küsimustike põhjal saadud info ühe või teise rakenduse kasutusmugavuse parandamiseks või laiendamiseks. Üks suuremaid rahvahanke teel korjatud teadmiste kogumeid ülepea on aga Vikipeedia. Keeletehnolooge huvitab see varamu ühest küljest oma kindla struktuuriga artiklite pärast, mida peaks olema teoreetiliselt hõlbus automaatselt genereerida, aga ka Vikipeedia olemusliku ristviitamise tõttu, mis annab võimaluse luua automaatseid seoseid mitte ainult ühes keeles väljendatud sõnade vaid ka eri keelte vahel.

Jaga

Samal teemal

Jaga
Sirp