Up 2014.09.05

This commit is contained in:
Oleg Grigoriev
2014-09-05 14:40:05 +04:00
parent 77ac4e3653
commit 014a1fe9f0
34 changed files with 1331 additions and 1201 deletions

View File

@ -3,7 +3,7 @@
Для его ввода была предназначена Escape-последовательность [code \a]:
[[[code
[[[php
s = "Вот вам: \a!!";
echo s;
]]]

View File

@ -0,0 +1,37 @@
Несмотря на своё название (joiner), этот символ не объединяет, а, скорее, разъединяет соседние символы.
Он заставляет алгоритмы, обрабатываюшие текст, рассматривать два символа отдельно, тогда как в некоторых случаях они могут быть различным образом объеденены.
Один из примеров - сортировка.
Вот несколько английских слов, упорядоченных по алфавиту:
[[[code
address
bomb
cat
cheese
digit
]]]
Однако, если мы будем рассматривать эти слова с точки зрения чешского языка, то сортировка по алфавиту будет следующей:
[[[code
address
bomb
cat
digit
cheese
]]]
С первого взгляда неожиданно.
Одно слово, начинающееся на [code c], выше слова на [code d], а другое (также начинающееся на [code c]), ниже.
На самом деле буквы [code c] и [code h] образуют [http://en.wikipedia.org/wiki/Ch_%28digraph%29#Czech диграф], который рассматривается в чешском языке, как одна буква, которая имеет порядок, отличный от [code c].
Если же между c и h вставить CGJ, то слово будет выглядеть по прежнему (сам объеденитель не имеет графического представления), но сортировка будет работать более привычно:
[[[code
address
bomb
cat
cheese
digit
]]]

View File

@ -0,0 +1,5 @@
Этот символ - графическое представление управляющего символа [U:0004 #].
Обратите внимание, что его аббревиатура EOT (end of transmission).
На некоторых системах и шрифтах значёк перепутан с символом [U:0005 #] и отображается, как ENQ.

View File

@ -0,0 +1,5 @@
Этот символ - графическое представление управляющего символа [U:0005 #].
Обратите внимание, что его аббревиатура ENQ (enquiry).
На некоторых системах и шрифтах значёк перепутан с символом [U:0004 #] и отображается, как EOT.

View File

@ -0,0 +1,7 @@
Этот символ - графическое представление управляющего символа [U:000E #].
На некоторых системах и шрифтах занчёк отображается по разному.
Выводятся аббревиатуры [code SS] или [code SO].
Более правильным видится [code SO]: shift out.