total update

This commit is contained in:
Sergei Asanov
2019-06-26 17:54:16 +03:00
parent 5ff4c39b7c
commit 335df6d2d1
11731 changed files with 2582581 additions and 181485 deletions

View File

@ -0,0 +1,37 @@
Несмотря на своё название (joiner), этот символ не объединяет, а скорее разъединяет соседние символы.
Он заставляет алгоритмы, обрабатывающие текст, рассматривать два символа отдельно, тогда как в некоторых случаях они могут быть различным образом объединены.
Один из примеров — сортировка.
Вот несколько английских слов, упорядоченных по алфавиту:
[[[code
address
bomb
cat
cheese
digit
]]]
Однако, если мы будем рассматривать эти слова с точки зрения чешского языка, то сортировка по алфавиту будет следующей:
[[[code
address
bomb
cat
digit
cheese
]]]
С первого взгляда неожиданно.
Одно слово, начинающееся на [code c], выше слова на [code d], а другое (также начинающееся на [code c]), ниже.
На самом деле буквы [code c] и [code h] образуют [http://en.wikipedia.org/wiki/Ch_%28digraph%29#Czech диграф], который рассматривается в чешском языке как одна буква, которая имеет порядок, отличный от [code c].
Если же между c и h вставить CGJ, то слово будет выглядеть по прежнему (сам объединитель не имеет графического представления), но сортировка будет работать более привычно:
[[[code
address
bomb
cat
cheese
digit
]]]