Files
symbl-data/loc/it/blocks/low-surrogates.axyml
Sergei Asanov 335df6d2d1 total update
2019-06-26 17:55:47 +03:00

5 lines
833 B
Plaintext

UTF-16 (English Unicode Transformation Format) in informatica è un modo di codificare i caratteri da Unicode sotto forma di una sequenza di parole a 16 bit. Questa codifica consente di scrivere caratteri Unicode negli intervalli U + 0000..U + D7FF e U + E000..U + 10FFFF (per un totale di 1 112 064). In questo caso, ciascun simbolo è scritto in una o due parole (coppia surrogata).
Ora che Unicode contiene più di 65536 caratteri, non può accoglierli tutti in 2 byte. Ciò significa che un'istanza della struttura Char non può accettare tutti i possibili caratteri. UTF-16 (e .NET) risolve questo problema utilizzando coppie surrogate: si tratta di due valori a 16 bit, in cui ogni valore varia da 0xD800 a 0xDFFF.
Le coppie surrogate sono divise in due parti: [BLOCK:high-surrogates "top"] (D800-DBFF) e "lower" (DC00-DFFF).