Pachet de programe pentru manipularea textului

Pachetul de programe poate fi utilizat cu următoarele proceduri

Într-un program Delphi sau Free Pascal cu ajutorul bibliotecii (unității) Mysnobol

Pentru aceasta sunt utilizate următoarele fișiere: mysnobol.pas mystring.pas myintarray.pas

Bibliotecile au fost testate cu Delphi6, Delphi10 și Lazarus sau Freepascal.

Dacă nu este disponibil niciun compilator Pascal, puteți utiliza interpretorul Pascal Pscript.

Modelele pot fi folosite și cu aplicația SnobolIDE. Aici puteți introduce un model de căutare, care este apoi înlocuit cu modelul de înlocuire.

Toate fișierele necesare și documentația se află în fișierul snobol.zip

Acest fișier este despachetat rapid într-un director la care este posibil și accesul la scriere, de ex. \ Appdata \ snobol

Sunt descrise metode pentru recunoașterea și procesarea textului cu ajutorul claselor de potrivire a modelelor bazate pe limbajul de programare SNOBOL. Clasele sunt parțial schimbate în comparație cu modelul SNOBOL pentru a obține o eficiență mai mare.

SNOBOL 4 (S.triG Oriented symbolic L.numărul de limbă Al 4-lea) este a patra și ultima versiune a unei serii de limbaje de programare cu scopul de a manipula șirurile. Aceste limbi au fost dezvoltate între 1962 și 1967 la AT & T's Bell Laboratories de David J. Farber, Ralph E. Griswold și Ivan P. Polonsky.

O caracteristică esențială esențială de limbajele de programare utilizate la acea vreme este existența tiparelor ca tip de date „de primă clasă”, i. H. un tip de date, a cărui valoare poate fi manipulată în orice mod ca în alte limbaje de programare, precum și de către operatori pentru înlănțuirea și manipularea tiparelor. Șirurile generate în timpul rulării pot fi tratate și executate ca un program. Un model în SNOBOL 4 poate fi foarte simplu, dar și foarte complex. Un model simplu este de ex. B. doar un șir ca „ABCD”. Un model complex, pe de altă parte, poate fi o structură mare, de ex. B. poate descrie gramatica completă a unui limbaj de calculator. (Wikipedia)

În anii 1970 și 1980, SNOBOL 4 a fost utilizat pe scară largă ca limbaj pentru manipularea textului. Cu toate acestea, în ultimii ani, popularitatea sa a scăzut, deoarece limbile mai noi și mai eficiente, cum ar fi Awk și Perl, au devenit mai populare pentru manipularea șirurilor cu expresii regulate. Spre deosebire de Regex în Perl, totuși, SNOBOL permite și recunoașterea structurilor de paranteză care nu pot fi descrise cu expresii regulate.

(1) Potrivirea modelului

Cu potrivirea tiparelor în texte, se tratează definiția tiparelor de testare (tipare) care, prin combinație, sunt capabile să descrie structurile de testare care apar liber. Modelele și combinațiile lor ar trebui să poată fi recunoscute de algoritmi adecvați. Astfel de tipare fac parte din multe limbaje de programare și scriptare. Limba JAVA știe de ex. clasa tokenizer, unde un text poate fi împărțit în părți folosind separatoare. Limbajul script PERL cu expresiile sale regulate (regex: expresie regulată Perl) are, de asemenea, un instrument foarte puternic pentru a descrie și recunoaște tiparele. Una dintre primele limbi orientate în mod special către acest tip de procesare de text a fost SNOBOL. Abordarea descrisă mai jos utilizează în mod esențial tiparele definite în SNOBOL. Cu toate acestea, nu definește un nou limbaj de programare sau de scriptare, dar implementarea are loc prin clase și funcții scrise într-un limbaj existent (PASCAL-DELPHI). Acest lucru permite utilizarea metodologiei în orice program scris în aceste limbi. O implementare de ex. în Java sau C ++ ar fi, de asemenea, posibil.

Modelele pot include fi:

Corzi de o anumită lungime

toate corzile până la un personaj special

cea mai lungă serie de goluri

orice repetări ale unui șir

Șiruri echilibrate în raport cu simbolurile de paranteză date