mirror of
https://github.com/symbl-cc/symbl-data.git
synced 2025-11-01 22:21:10 -04:00
Up 2014.09.05
This commit is contained in:
33
loc/ru/sections/combining-diacritical-marks.axyml
Normal file
33
loc/ru/sections/combining-diacritical-marks.axyml
Normal file
@ -0,0 +1,33 @@
|
||||
## Комбинируемые символы
|
||||
|
||||
Символы, имеющие графическое представление, в стандарте Юникода подразделяются на базовые и комбинируемые (или модифицирующие).
|
||||
Комбинируемые названы так, потому что при отображении комбинируются с рядом стоящим базовым символом (модифицируют его).
|
||||
|
||||
Например, есть символ [U:0418] (наша русская буква И).
|
||||
Это вполне самостоятельная буква, которая имеет своё графическое представление и занимает место в строке текста (протяжённый символ).
|
||||
|
||||
И есть комбинируемый символ [U:0306 кратка] (надстрочный полукруг).
|
||||
Сочетание этих двух символов [code U+0418 + U+0306] даёт букву [U:0419] (И-краткая).
|
||||
|
||||
Можно скомбинировать модифицирующий символ и с другим базовым.
|
||||
Например, с [U:044B].
|
||||
Получается такой уродец: [b][html ы̆][/b].
|
||||
|
||||
Комбинированные символы не занимают места в строке (непротяжённые символы) и их использование в отрыве от базовых символов не имеет смысла.
|
||||
|
||||
Для многих комбинаций отдельно существуют и монолитные символы.
|
||||
Так, например, для той же и-краткой отведена отдельная кодовая позиция [U:0149 *].
|
||||
|
||||
## Диакритические знаки
|
||||
|
||||
Диакритические знаки представляют из себя различные надстрочные, подстрочные и другие знаки.
|
||||
Сами по себе они не обозначают на письме никакого звука, но влияют на произношение других букв.
|
||||
Обычно они не занимают в строке отдельного места, а дополняют начертание основного символа.
|
||||
|
||||
К диакритике относятся различные ударения, огласовки, изменения тональности.
|
||||
В разных языках могут использоваться одинаковые знаки, имеющие, тем не менее, различный смысл.
|
||||
Например, [b]о[html ̀][/b], это может быть и ударение (в русском), и показатель долготы (в чешском), и смягчение (в польском).
|
||||
|
||||
Многие сочетания букв с диакритическими знаками в итоге стали отдельными буквами и уже не рассматриваются по частям.
|
||||
Например, всё та же буква [U:0419].
|
||||
|
||||
@ -9,7 +9,7 @@
|
||||
Большинство же символов этого блока включены в стандарт только для поддержания совместимости с другими кодировками (тем более, что эти символы - часть ASCII).
|
||||
Это символы управления телетайпами, перфокартами, различными терминалами.
|
||||
Например, при получении определённого символа устройство должно что-то сделать: сбросить страницу, закончить обработку текущих данных, сделать запрос.
|
||||
Есть даже символ [U:0007], заставляющий устройство пищать через встроенных динамик.
|
||||
Есть даже символ [U:0007 #], заставляющий устройство пищать через встроенных динамик.
|
||||
|
||||
Многие устройства для которых они предназначались уже давно устарели.
|
||||
Либо стали использовать для тех же целей различные языки управления устройствами (Postscript и другие).
|
||||
@ -35,6 +35,41 @@ echo "One line\nTwo line\tThree line";
|
||||
Также многие терминалы позволяли вводить такие символы вручную, обычно с помощью сочетания с клавишей Ctrl.
|
||||
Например, Ctrl-C посылает символ [0003 #] прерывающий текущий процесс.
|
||||
|
||||
[[[code
|
||||
U+0000: \0 Пустой символ
|
||||
U+0001: Ctrl+A Начало заголовка
|
||||
U+0002: Ctrl+B Начало текста
|
||||
U+0003: Ctrl+C Конец текста
|
||||
U+0004: Ctrl+D Конец передачи
|
||||
U+0005: Ctrl+E Запрос
|
||||
U+0006: Ctrl+F Подтверждение
|
||||
U+0007: \a Ctrl+G Звуковой сигнал
|
||||
U+0008: \b Ctrl+H Возврат на шаг
|
||||
U+0009: \t Ctrl+I Горизонтальная табуляция
|
||||
U+000A: \n Ctrl+J Перевод строки
|
||||
U+000B: \v Ctrl+K Вертикальная табуляция
|
||||
U+000C: \f Ctrl+L Прогон страницы
|
||||
U+000D: \r Ctrl+M Возврат каретки
|
||||
U+000E: Ctrl+N Режим национальных символов
|
||||
U+000F: Ctrl+O Режим обычного ASCII
|
||||
U+0010: Ctrl+P Освобождение канала данных
|
||||
U+0011: Ctrl+Q 1-й код управления
|
||||
U+0012: Ctrl+R 2-й код управления
|
||||
U+0013: Ctrl+S 3-й код управления
|
||||
U+0014: Ctrl+T 4-й код управления
|
||||
U+0015: Ctrl+U Отрицательное подтверждение
|
||||
U+0016: Ctrl+V Пустой символ для синхронного режима
|
||||
U+0017: Ctrl+W Конец блока передаваемых данных
|
||||
U+0018: Ctrl+X Отмена
|
||||
U+0019: Ctrl+Y Конец носителя
|
||||
U+001A: Ctrl+Z Замена
|
||||
U+001B: Ctrl+[ Альтернативный регистр #2
|
||||
U+001C: Ctrl+\ Разделитель файлов
|
||||
U+001D: Ctrl+] Разделитель групп
|
||||
U+001E: Ctrl+^ Разделитель записей
|
||||
U+001F: Ctrl+_ Разделитель полей
|
||||
]]]
|
||||
|
||||
## Другие блоки
|
||||
|
||||
Кроме базового блока, есть ещё управляющие символы ISO 8859, расположенные в начале [SECTION:latin-1-supplement расширенной латиницы].
|
||||
@ -43,4 +78,6 @@ echo "One line\nTwo line\tThree line";
|
||||
С другой стороны есть символы, имеющие управляющее значение именно в рамках стандарта Unicode.
|
||||
Например, [U:034F *] или [U:200E *].
|
||||
|
||||
## Иконки
|
||||
|
||||
Хотя сами управляющие символы не имеют никакого графического представления, для этого могут использоваться иконки из блока [BLOCK:control-pictures].
|
||||
|
||||
11
loc/ru/sections/control-pictures.axyml
Normal file
11
loc/ru/sections/control-pictures.axyml
Normal file
@ -0,0 +1,11 @@
|
||||
В этом блоке собраны иконки для представления управляющих символов.
|
||||
В основном это относится к блоку управляющих символов [block:control-character C0].
|
||||
Сами по себе управляющие символы не имеют никакого графического представления.
|
||||
|
||||
В качестве иконок используется изображение двух- или трёхсимвольного сокращения от названия символа (из ASCII).
|
||||
Например, EOT - end of transmission, BS - backspace.
|
||||
|
||||
В некоторых шрифтах иконки могут быть перепутаны.
|
||||
Например, местами меняются [U:2404 EOT] и [U:2405 ENQ].
|
||||
А вместо [U:240E SO] пишут SS.
|
||||
|
||||
@ -1,5 +0,0 @@
|
||||
Управляющие символы — элементы данной кодировки, которым не приписано графическое представление, но которые используются для управления устройствами, организации передачи данных и других целей.
|
||||
|
||||
Сейчас для этих целей применяются форматы файлов, языки управления устройствами (такие как Postscript) и сетевые протоколы. Поэтому многие управляющие символы сейчас или не используются вообще, или используются не по назначению.
|
||||
|
||||
Стандарт POSIX требует обязательного наличия лишь восьми управляющих символов — \0, \a, \b, \t, \n, \v, \f, \r.
|
||||
Reference in New Issue
Block a user