AntConc LinguTools

Instrumente comune de adnotare și analiză a corpusului în lingvistică

captura ecran

Ce este AntConc?

AntConc este un instrument de concordanță pentru corpusuri scrise cu ajutorul căruia se pot efectua relativ ușor interogări standard de căutare pentru analiza corpusului pe computer. Software-ul creează automat liste de cuvinte (frecvența cuvintelor) și statistici, de exemplu cu privire la relația dintre „simbol” și „tipuri”, cu care, printre altele, bogăția vocabularului unui text poate fi examinată. Instrumentul acceptă formatul comun UTF-8 și permite interogări de căutare cu expresii regulate. AntConc face parte dintr-o serie de multe alte instrumente pentru analiza textelor (de exemplu, AntWordProfiler, AntGram, AntPConc sau FireAnt).

Beneficii:

  • operare simplă, intuitivă
  • liste clare de concordanță
  • Vizualizare accesabilă sortabilă
  • Calcule cluster și n-gram posibile
  • Sunt posibile evaluări cu texte marcate cu POS și adnotate
  • Analize contrastive
  • disponibil pentru PC și Mac
  • Tutoriale video și ajutor

Dezavantaj:

  • adnotarea/transcrierea manuală nu este posibilă
  • fără analiză text-imagine
  • numai pentru corpusuri de până la aproximativ 1,5 milioane de jetoane

Noțiuni introductive/scenariu de utilizare:

Adesea, observațiile întâmplătoare din viața de zi cu zi conduc la o întrebare lingvistic interesantă. Acestea pot fi formulări evidente, modă și cuvinte tabu, dar și cazuri de îndoială lingvistică. Folosind exemplul superalimentului relativ nou din categoria alimentară din discursul nutrițional actual, următorul arată posibilitățile de analiză lingvistică a corpusului folosind AntConc.

Evaluare:

Dacă introduceți cuvântul superfood în linia de căutare, veți primi mai întâi toate accesările în vizualizarea concordanță. Majuscule și minuscule sunt luate în considerare numai dacă bifa este setată pentru „Caz”. Pentru a obține o primă impresie a co-textului lingvistic, accesările pot fi sortate și folosind butonul „Sortare” (captura de ecran 1). Dacă nu există nici o bifă lângă „Cuvinte”, interogarea de căutare nu ia în considerare limitele cuvintelor, motiv pentru care sunt enumerate atât forma pluralului, cât și diferiți compuși, cum ar fi pulberea superalimentară. Dezbaterile discursive cu termenul superaliment (7) și tendința pentru superalimente (14) sunt acum indicate în prezentarea generală a concordanței. Diverse alimente precum broccoli (8) sau fructe de padure goji (11) par, de asemenea, asociate cu cuvântul cheie.

Captură de ecran 1: Concordanțe centrate pentru termenul de căutare „superaliment”

Atributele reale și exotice indică, de asemenea, aceste două domenii: în primul rând, întrebarea discursivă negociată a ceea ce fac superalimentele în principiu și, în al doilea rând, ce alimente sunt incluse. Pentru o listare sistematică a atributelor adjective, trebuie creat mai întâi un corpus etichetat în funcție de părți de vorbire. Instrumentul AntTag face acest lucru posibil într-un mod simplu. La conversie, trebuie selectate setările de limbă „germană” și varianta de etichetare „orizontală” (nu „verticală”). Documentul etichetat este salvat automat sub documentul txt original. Dacă încărcați acum toate fișierele etichetate POS create în acest mod în AntConc, veți obține o prezentare generală a tuturor atributelor adjectivelor care urmează imediat cuvântul cheie din stânga folosind interogarea de căutare „ADJA superfood” (captura de ecran 2). Discursurile vizibile din punct de vedere lingvistic sunt referințe la un subiect contestat în care se discută public ce sunt reale sau ce sunt superalimentele reale. Actualizarea discursivă în sine este de asemenea abordată, de ex. despre alunecări ale superalimentelor hyped, noi și de șold. Cuvântul la modă pare să descrie diverse produse într-un mod nutrițional actual.

Captură de ecran 2: Concordanțe centrate pentru termenul de căutare „superaliment” cu corpus etichetat POS

O imagine de ansamblu a frecvențelor cuvintelor poate fi creată relativ ușor în fila „Listă de cuvinte” (captura de ecran 3). Acolo, primele cuvinte conținute sunt forma singulară superfood (37), cuvintele formează eat (34) și sănătos (40). Așa cum era de așteptat, există o serie de cuvinte mai mici de înaltă frecvență, de la determinative la verbele auxiliare din partea de sus, în timp ce prepozițiile în și cu sunt în partea de sus.

Captură de ecran 3: Listă de cuvinte

O altă perspectivă de evaluare a unei metode bazate pe corpus este calculul de N grame, care poate fi efectuat atât cu corpusul marcat, cât și cu cel neetichetat. Câmpul de introducere rămâne gol, bifa „N-grame” trebuie setată în dreapta. Prezentarea generală a bigramelor (captura de ecran 4) oferă o indicație a anglicismului cheie al alimentației curate, iar combinația de cuvinte obișnuite arată, de asemenea, că textele tind să fie adaptate pentru a defini ce tipuri de superalimente se consumă unde și cum (captura de ecran 5) . Dacă urmați calea frazelor introduse cu, puteți găsi o încorporare prepozițională specifică discursului (captura de ecran 6), în care substantivul respectiv exprimă ceea ce este considerat un superaliment:

Din punct de vedere semantic, superalimentele reprezintă îmbogățiri.Acest surplus nutrițional-fiziologic este alcătuit morfologic de compuși (budinca de chia) și sintactic, printre altele. realizat într-o co-construcție. Aceste construcții sunt folosite pentru a combina feluri de mâncare și alimente bine cunoscute - din motive de sănătate - cu alimente sănătoase (salată cu varză, castronele cu semințe de chia).

Captură de ecran 4: Bigrams

Captură de ecran 5: Dovezi pentru expresia „acolo” în vizualizarea concordanței

Captură de ecran 6: Prezentare generală a bigramului pentru prepoziția „cu”

Captură de ecran 7: Co-apariții ale termenului de căutare „superaliment” (se colocează) într-un mediu cu cinci cuvinte în stânga și în dreapta

Pentru evaluarea conform „Colocează”, trebuie selectat un cuvânt sau o frază sursă cu care alte cuvinte co-co-apar într-un mediu selectat anterior (un mediu cu cinci cuvinte la stânga și la dreapta termenului de căutare este prestabilit). Pentru superaliment, există o acumulare a formelor de singular și plural ale sein (este și sunt) (captura de ecran 7), ceea ce sugerează presupunerea că anglicismul apare în mod regulat în predicțiile în care se fac atribuiri definitorii, ca în următoarele construcții predicative:

Dovezile puterilor vindecătoare ale superalimentelor sunt rare. (Concentrați-vă online 7.6.2018)

Ovăzul este un adevărat „superaliment”. (Spiegel online 19 aprilie 2018)

O listă de cuvinte cheie poate fi creată numai dacă un corp de comparație a fost încărcat în avans pe AntConc în „Preferințe instrument”. Pentru corpusul superalimentar, de ex. oferă un contrast tematic cu elemente nutriționale mai globale, care ar putea avea urme mai puțin metadiscursive, deoarece definițiile sunt mai puțin controversate. Se poate presupune, de asemenea, că există mai puține construcții de definiție și atribuire.

Concluzie:

Acest mini-studiu lingvistic corpus a identificat termenul de superaliment ca un cuvânt de moda al cărui efect asupra sănătății corespunde alimentelor și ingredientelor individuale și ale cărui efecte asupra sănătății sunt (critic) discutate în discursul presei publice.