BAZA DE BAZE DE LIMBĂ URALIANĂ

suihkone /). Articolul constă în prelegeri la Zilele Științei, organizate de Universitatea din Helsinki pe 9 și 10 ianuarie 1997 și Congresul IFUSCO 1997 pe 24 aprilie 1997. Traducerea în germană a fost făcută de doamna Irmeli Helin și de doctorul Helmut Diekman îngrijorat. Aș vrea să vă mulțumesc mult amândurora. Aș dori, de asemenea, să îi mulțumesc prof. Dr. Ins Cornelssen pentru comentariile dvs. despre acest articol.

baza

Harta 1. Zonele lingvistice ale limbii Urali 5

12 CONJ_a = mutta ADV_öni = nyt PRN-NEG_n'ekod_SG_NOM = ei kukaan V-NEG_oz_PRES_3SG-PL = ei V_tydav_NEG_SG = nahkyä. # Alakuloisia ajatuksia nytä. # Alakuloisia ajatuksia nä. Material în Erzänischen cu codificare morfologică (Jack Rueter 1994) 00080025 V_Uchost'_IND_PT1_SUBJ-3PL_FAB = WAIT N-P_Mat'an'_GEN-OBJ_IDF = (Nume DAT), PRN-REL_kona_SG_NOM_AB1F = WHO V_tus _GEN-OBJ_IDF = LICOR V_veshn'eme_INF-OBJ = CĂUTĂ. # AU AȘTEPTAT MATJA CARE A IEȘIT CĂUTĂ MOONSHINE. # 00080026 PRN-PER Son SG3 NOM = SHE V_sas'_IND_PT1_SUBJ-3SG_FAB = COME ATR IDF = UNUL CARE ESTE GOLID N PLUS NOM-COM IDF = MÂNĂ. # A VENIT ÎNAPOI MÂNT GOLIT. # 00080027 N plăcut 'PL NOM-COM IDF = MÂNĂ 00080027 NUM_Kavto_SG_NOM_IDF = DOUĂ N_kudoso_INE_IDF' HOUSE V_ '_IND_PT1_SUBJ-1SG_FAB = BE, PRN-_mez'ejak_SG_NOM_IDF_PCL-INCL = ANYTHING PCL-NEG1_a = NOT V_maksit'_IND_PRS_SUBJ-3PL_FAB = DĂ PR N-PER tonă 'SG2 GEN = YOU N_kasol'ent'_SG_GEN-OBJ_DEF = BEANS POP_kise_INE_IDF = FOR, N-P_Pakhom_SG_NOM = (NUME DAT). # AM FOST LA DOUĂ CASE, PAKHOM, DAR CE NU CÂȘTIGĂ FASOLE. #

Corpus Sölkupic cu codificare morfologică și sintactică și traducere germană (Jarmo Alatalo 1998) 13 Itja și Pünegusse. (A8) T: A8. iicjä immrljantrsä urrkäsjprkkaqr. Itja a locuit cu mătușa lui. iicjä N SG NOM SBJ immrljantrsä N SG KOM 3S LDM SAD urrkäsjprkkaqr V AOR 3DS FRE KNT VER T: A8. okkrr taaqrn iicjä mykka immrljaqrntr: Itja a spus odată mătușii: okkrr P ATR taaqrn N SG LOK SAD iicjä N SG NOM SBJ mykka V AOR 3SS FRE VER immrljaqrntr N SG DAT 3S LDM SAD T: A8. "man kojalang qarrngtrlj aaqqrn poqlontr". „Mă duc la Golful Râului Înclinat”. man P SBJ kojalang V OPT 1SS VER qarrngtrlj P IP TRA ATR aaqqrn N SG GEN ATR poqlontr N SG DAT SAD Udmurtisch (Pirkko Suihkonen 1998b: 30-31, 48-49, test coding) (1) Codificare morfologică cu traduceri ale formelor de bază ale cuvintelor Dzhog_ADV_MAN rapid, în curând ortts' + i + z_v_-cont_-tra_ + fin_ind_past_sg3 pentru a trece (departe) zarn'i_n_-count_sg_nom A_SCAL_SG_NOM kuaro_a_scal_sg_nom de aur, z_v_-cont_-tra_ + fin_ind_past_sg3 pentru a trece (departe) zarn'i_n_-count_sg_nom A_SCAL_SG_NOM kuaro_a_scal_sg_nom de aur, z_v_a_scal_sg_nom cu frunze dyr_G_sg_nom + z_m_vhu-cont_sg_nom + dyr_G_SG_NOM + time_s_vhu-time + z_vhu-AN_CO -tra_ + fin_ind_past_pl3 to come zhob_a_scal_sg_nom urât, neplăcut siz'yl_n_ + count_-anim_sg_nom A_SCAL_SG_NOM ADV_TIME toamnă nunal + jos_n_ + count_-anim_pl_nom zi. În + ez_N_ + COUNT_-ANIM_SG_ACC cer, cer

15 analiza automată dă mai întâi forma cuvântului în corpus, apoi interpretarea formei cuvântului în cauză, adică semnificațiile lor, enumerate. Interpretarea conține forma de bază a cuvântului și analiza morfologică a cuvântului. Toate semnificațiile cuvântului respectiv formează împreună o cohortă (Karlsson 1992: 3; Karlsson 1995: 46). Un program de analiză automată a limbii finlandeze este utilizat în UHLCS. Analiza automată a limbii finlandeze (Koskenniemi 1983) (pisica a dormit pe scările stabile și a visat vara) * kissa nukkui tallin portailla ja uneksi kesästä. (") (" ("kissa" N NOM SG)) (" ("nukkua" V PAST ACT SG3)) (" ("talli" N GEN SG)) ("

"(" porras "N ADE PL)) (" "(" ja "COORD C)) (" "(" uneksia "V IMPV ACT SG2) (" uneksia "V PRES ACT NEG) (" uneksia "V PAST ACT SG3 ) ("uni" N TRA SG)) (" ("kesä" N ELA SG)) (") Dacă este programată o codare automată pentru analiza unei limbi, acest program poate fi utilizat pentru codificarea materialelor suplimentare Sarcina codificării, fie că este automată sau manuală, este de a oferi cele mai fiabile cunoștințe posibile despre limba respectivă. În plus, codificarea trebuie efectuată cu atât de multă atenție încât nici o informație din textul original să nu se piardă. Pot fi puse în aplicare concepte sau sisteme de codificare procesate pentru limbi tipologic diferite 5. Utilizarea materialului în scopuri de cercetare Materialul poate fi folosit în mai multe moduri în practică. Cercetarea lingvistică, inclusiv investigarea domeniilor speciale din acestea, este importantă

16 limbi și editarea materialului pentru dicționare și gramatici. Această categorie include, printre altele dicționarul Udmurt, care a fost creat din materialul corpului de text Udmurt. Dicționarul va fi ulterior disponibil pe serverul corpurilor electronice. În exemplul următor cuvântul udmurt este primul, urmat de traducerea în engleză și finlandeză. Corpuri electronice ca material pentru dicționare (Suihkonen, Zagulyayeva & Tronina 1995: 17) UDMURT/UDMURTTI ENGLISH/ENGLANTI FINNISH/SUOMI ad'ami, N man, human being; persoană. himines; rău; henkilö. addz '+ em, 1st V PCPL

, 2. N 1. s. addz'yny. 2. văzând. 1. ks. addz'yny. 2. Näkeminen. addz'empoton, N doresc să văd. halu sewdä. addz'empot + on + tem, ADJ ks. addz'empoton; odios; urât. ks. addz'empoton; vihattava; vastenmielinen, inhottava. addz'empotostem = addz'empotontem. addzem # pot + y + ny, V INF să vrei să vezi. haluta sewdä. addz'is'k + este ', V PCPL

s. addz'is'kyny. ks. addz'is'kyny. addz'is'k + on, N 1. vizibilitate. 2. întâlnire, întâlnire. 3. fantomă. 1. Näky (väi) syys. 2. kohtaus; tapaamine. 3. aave. addz'is'k + on + tem, PCPL

s. addz'is'kyny. ks. addz'is'kyny. addz '+ is'k + y + ny, V INF

uralilaisten cold tietopankki ovat osa Helsingin yliopiston> tallteilla olevaa eri cold tietopankkia. 19 Programul kw-alg caută sufixele posesive -ez și -yz ale persoanei a 3-a din sg. Și pl. Udmurt ca o succesiune de caractere, care pot fi și sufixe pentru acc. Fișierul de intrare al concordanței este o secțiune analizată morfologic din corpusul textului Udmurt. Materialul eșantion este un text derulant, fără conversii pentru majuscule și semne de punctuație. kw-alg '\ + (ez hez yz)' target file 104: Anaj + ez kosem + ys 'gine kyti-oti tölatis'ky + ny 125: a, inzhen'er + ly dyshetskon s'ures + ez. 118: i + z t'ehn'its'eskoj l'it'eraturaj + ez. 48: 'ko + d + -a, myn + a + m tshukaz'e berpum + yz Erkyn nunal + e kyl' + i + z. 69: Viktor Ivanovits '+ len pits'i dyr + yz s'elo + ja + my ortts' + i + z. 91: Esh + jos + yz uram + yn kalg + o, Următorul exemplu este un extras din întregul material al corpusului nord-lapon. Ca parametri pentru programul de concordanță, pe lângă definiția fișierelor de intrare și țintă, numerele sunt date și ca indicatori pentru cuvinte, secvențe de caractere între două semne de punctuație și lungimea contextului. KWIC 4 4 target file sápmelas'vuo a ja gávnnahii, sus lea skandinávalas 'va igi buoremus dovdomearka lei, sus lei ritmalac'c'at njo l ásaidahttojuvjuvot eanet nu, ávdin ja geavatkeavohtes eaje s datneju asju asvit nu, te sámec'earddaid gaskkas nu, viimmát nuortasámiid stii lmmos 'sáhttá govviduvvot nu, váldá ovdan iez'as árbevi ápmelac'c'at leat jurddas'an, vuoinjnjat lattditat sivdnidanuo zuoinjnjat ja vuovdit "sámegovaid", maidda ássi vuoinjnjaide vuo uduvve dán dihtui luonddu greed n goit bázii s'addat dovddusin sámi dáiddac'eahppin, id álgovu oleamus dáiddahápáz, hp'jdahápmin sárgundáhámin, hp'jdahápmin sárgundáhámin, journalista Matti (1872-1929) lei vuos Institutul de lingvistică de la Universitatea din Helsinki menține facilitățile și se asigură că programele utilizate sunt actualizate și aplicabile în mod optim. Institutul predă, de asemenea, cunoștințe de bază despre sistemul de operare UNIX și despre utilizarea corpurilor electronice ca material de cercetare. Institutele lingvistice ale Universității Helsinki oferă, de asemenea, unul în timpul semestrelor