WebLog-ul lui David Madore O încercare de a scrie Unicode pentru manechini

O încercare de a scrie Unicode pentru manechine

Meta: Scopul acestei intrări ar fi în mod ideal să elibereze un fel de document pe care aș dori să-l numesc Unicode for Dummies: ideea ar fi să ai ceva de înțeles de către publicul larg (spunem de toți cei care au cunoștințe minime despre utilizarea unui computer - știind cum să copiez și să lipiți, de exemplu) și care prezintă lucrurile pe care aș dori să le știe toată lumea despre Unicode (ce este, pentru ce este, de ce există, dar și ce impact poate avea asupra lor - mai ales în termeni de securitate - și modul de utilizare). Evident, un astfel de document ar avea cu adevărat sens doar în cadrul mai general al instruirii de bază în domeniul informaticii pentru publicul larg (ceea ce ar explica, de exemplu, într-unul din capitolele sale, ce este webul și ideea generală a unui web browser, ce adresă URL și o pagină web, așa ceva, așa că pot da sfaturi de securitate în special), dar nu am timp sau răbdare să încerc să scriu un astfel de curs, așa că mă gândesc doar la un caramida mica, cea despre Unicode. (Și din nou, voi descrie ceea ce îmi imaginez că ar trebui scris mai degrabă decât să-l scriu efectiv.) • De ce în mod specific Unicode? Mai întâi pentru că cred că este un fruct cu agățare redusă (publicul larg are multe de câștigat pentru puțin efort în a cunoaște puțin despre subiect); dar și dintr-un motiv egoist, adică mă enervează, atunci când interacționez electronic cu oamenii, să mă găsesc citind sau răspunzând la lucruri precum cum scrieți ℝ într-un mesaj pe Twitter? (bine, precis, ei mă vor întreba mai degrabă cum fac să scriu o bară dublă R (adică, bold-blackboard); și ceea ce mă enervează sincer sunt oamenii care scriu | R să încerce să imite acest lucru ℝ), sau altceva Nu știu cum să scriu e-in-the, nu este pe tastatura mea și nu mă refer la lucruri de genul acesta.

david

Această intrare nu este menită să fie finalizată și, în special, pune întrebarea cititorilor competenți din punct de vedere tehnic cu privire la ceea ce ar trebui totuși spus acolo sau cum să facă lucrurile mai accesibile pentru doamna Michu și domnul Dugenou. (Dar, pentru a spune adevărul, cu siguranță voi fi leneș să completez acest text. Deoarece voi fi leneș să simplific pasajele în care am exersat spunând lucruri care sunt prea complicate. Sunt totuși interesat de feedbackul posibilelor doamne Michu și Domnule Dugenou, care ar întâlni acest text, astfel încât să-mi spună ce cred ei că nu este clar sau are nevoie de îmbunătățiri în el.)

Pe scurt. Ce vreau să înțeleagă publicul larg despre Unicode? În principal pasajele cu caractere aldine în cele ce urmează (dar și, oricum, ce este între pasajele cu caractere aldine ...):

Mai întâi, desigur, ce este: Unicode este un standard al computerului care definește un set de caractere (dar și convenții privind modul de gestionare a acestor caractere) care permite să reprezinte un număr gigantic de limbi diferite, precum și o masă imensă de diferite simboluri (inclusiv faimoasele emoji care sunt probabil acum ceea ce face Unicode cel mai faimos în rândul publicului larg). Poate că ar trebui să adăugăm aici exemple de limbi susținute de Unicode și de cuvinte scrise în acele limbi, dar să spunem că aproape fiecare sistem de scriere a limbilor care încă trăiesc pe Pământ și o grămadă bună de limbi moarte și unele limbi artificiale (Orice ar însemna asta) sunt reprezentabile prin Unicode. În ceea ce privește simbolurile, acestea acoperă tot felul de pictograme comune, simboluri tehnice, inclusiv un număr mare de simboluri matematice, dar, pur și simplu, o mulțime de semne de punctuație puțin ciudate sau exotice.

Pe de altă parte, ceea ce cred că este important de subliniat este că în zilele noastre, Unicode este peste tot: în marea majoritate a situațiilor în care un computer manipulează șiruri (adică text), aceste caractere sunt caractere Unicode. Paginile web sunt în Unicode; adresele paginilor web sunt (sau cel puțin pot fi) în Unicode; e-mailurile sunt în Unicode (pentru adresele de e-mail, este mai îndoielnic); Documentele Word sau LibreOffice sunt în Unicode; Căutări Google/Bing/DuckDuckGo/etc. sunt realizate în Unicode; Wikipedia este în Unicode; tweet-urile sunt în Unicode; chiar și SMS-urile sunt în Unicode (deși există unele subtilități aici care fac ca toate caracterele să nu fie la fel); pe multe sisteme de operare, numele fișierelor sunt în Unicode; Și așa mai departe. (Există, desigur, excepții: companiile aeriene cu siguranță nu folosesc Unicode în sistemele lor de rezervare antediluviene și, dacă numele tău are caractere ciudate, probabil știi că atunci când încerci să obții un bilet.)