Codificare Perl și caracter

Articolele citite de ori.

codificare

Atât autorul, cât și traducătorul

Articolul

Postat la 28 octombrie 2014 - Actualizat la 29 iunie 2016

Conexiuni sociale

I. Introducere ▲

II. ASCII ▲

Deoarece un octet conține 8B biți, cel mai semnificativ bit al unui caracter ASCII este întotdeauna 0.

III. Alte codificări de caractere

IV. Unicode

V. Formate de transformare Unicode

puncte de cod

Personaje

VI. Perl 5 și codificări de caractere

În caz contrar, puteți fi înșelat foarte repede și puteți pierde urmele dintre șirurile care sunt șiruri de octeți și care sunt șiruri de text.

VII. Testați-vă mediul

Semnul euro nu se află în tabelul de codificare Latin-1, deci dacă terminalul dvs. se află în această codificare, semnul euro nu va apărea corect.

Terminalele Windows utilizează în principal codificări cp *, de exemplu cp850 sau cp858 (disponibil numai în versiunile mai noi de Encode) pentru instalațiile germane. Restul mediului utilizează codificări Windows- *, de exemplu Windows-1252 pentru mai multe locații din Europa de Vest.

returnează o listă a codificărilor disponibile.

VIII-A. В "В Caractere mari pentru tipărireВ В" ▲

Uneori s-ar putea să vedeți acest mesaj de avertizare: Caracter lat în tipar .

VIII-B. Inspectați lanțurile