diff --git a/data/sets.txt b/data/sets.txt index 54f15b46..1d253381 100644 --- a/data/sets.txt +++ b/data/sets.txt @@ -64,4 +64,9 @@ [social-symbols] set: ♀, ♂, ☊, ♪, ♫, ♯, ▶, ◼, ♬, ♭, ♮, ❤,♎,☀,★,☂,♞,☯,☭,☢,€,☎,⚑,❄,♫,✂, ☃,❄,❅,❆,★,☆,✪, ❦, ❧, ☙, ❥, ❣, ♡, ♥, ❤, ➳, ღ, ♈, ♉, ♊, ♋, ♌, ♍, ♎, ♏, ♐, ♑, ♒, ♓, ✆, ☎, ☏, ✉, ☕, ✁, ✂, ✃, ✄, ✍, ✎, ✏, ✐, ✑, ✒, ⌦, ⌫, ⌧, ㍶, ℻, ←, ↑, →, ↓, ↔, ↕, ↖, ↗, ↘, ↙, ▲, ▼, ◀, ▶, ➔, ➘, ➙, ➚, ➛, ➜, ➝, ➞, ➟, ➠, ➡, ➢, ➣, ➤, ➥, ⚜,✥, ✤, ✻, ✼, ✽, ✾, ❀, ✿, ❁, ❃, ❇, ❈, ⚘, ⁕ - icon: ☀ \ No newline at end of file + icon: ☀ + +[esperanto] + set: A, B, C, Ĉ, D, E, F, G, Ĝ, H, Ĥ, I, J, Ĵ, K, L, M, N, O, P, R, S, Ŝ, T, U, Ŭ, V, Z, a, b, c, ĉ, d, e, f, g, ĝ, h, ĥ, i, j, ĵ, k, l, m, n, o, p, r, s, ŝ, t, u, ŭ, v, z + icon: Ĉ + diff --git a/loc/cn/blocks/about.txt b/loc/cn/blocks/about.txt index ef4acd76..2a76a581 100644 --- a/loc/cn/blocks/about.txt +++ b/loc/cn/blocks/about.txt @@ -6,7 +6,7 @@
Sergei Asanov

Sergei Asanov

St. Petersburg, Russia
- http://sadesign.ru
+ http://sergeiasanov.ru
Idea, design, layout
Contact: sa@unicode-table.com
diff --git a/loc/cn/sets.txt b/loc/cn/sets.txt index b1a13761..297213e2 100644 --- a/loc/cn/sets.txt +++ b/loc/cn/sets.txt @@ -14,3 +14,5 @@ music-symbols: 音乐符号 flowers-symbols: 花形图案 greek-symbols: 希腊字母 social-symbols: Facebook 使用的图案 +esperanto: 世界语 + diff --git a/loc/de/blocks/about.txt b/loc/de/blocks/about.txt index 7987cc6a..181b3b37 100644 --- a/loc/de/blocks/about.txt +++ b/loc/de/blocks/about.txt @@ -8,7 +8,7 @@
Sergej Asanov

Sergej Asanov

Sankt-Petersburg, Russland
- http://sadesign.ru
+ http://sergeiasanov.ru
Idee, Design, Layout
Kontakt: sa@unicode-table.com
diff --git a/loc/de/sets.txt b/loc/de/sets.txt index 37134afb..3f75f047 100644 --- a/loc/de/sets.txt +++ b/loc/de/sets.txt @@ -13,4 +13,5 @@ sea-symbols: Symbols zum Seethema music-symbols: Symbols zum Thema der Musik flowers-symbols: Bluemen Symbolen greek-symbols: Griechische Symbole -social-symbols: Symbole für Facebook \ No newline at end of file +social-symbols: Symbole für Facebook +esperanto: Esperanto diff --git a/loc/en/blocks/about.txt b/loc/en/blocks/about.txt index 803a80e1..c9dda9f7 100644 --- a/loc/en/blocks/about.txt +++ b/loc/en/blocks/about.txt @@ -6,7 +6,7 @@
Sergei Asanov

Sergei Asanov

St. Petersburg, Russia
- http://sadesign.ru
+ http://sergeiasanov.ru
Idea, design, layout
Contact: sa@unicode-table.com
diff --git a/loc/en/blocks/euro.txt b/loc/en/blocks/euro.txt deleted file mode 100644 index d436ac64..00000000 --- a/loc/en/blocks/euro.txt +++ /dev/null @@ -1,92 +0,0 @@ -
-
-

Знак евро вместо символа-заполнителя

-

€ - -Начинаем новую рубрику «пятиминутка ликбеза с сайтом Таблица символов Юникода» - -Сегодня посмотрим на раздел «Управляющие символы С1», к которому относятся символы с кодами от 0080 до 009F. То есть блок, идущий сразу после ASCII (первые 128 символов). - -Этот раздел был унаследован Юникодом от кодовой страницы ISO 8859-1. Сама же ISO 8859-1 (также известная, как Latin-1), основана на символьном наборе для терминалов. В следствии чего, первые 32 символа были выделены для различных терминальных команд. То есть, «разрешение разрыва строки», «запрещение разрыва строки», «обратный перевод строки», «символ-заполнитель» и остальной допотопный треш. - -На Latin-1 также раньше строились и другие 8-битные кодировки, в частности Windows-1252, использовавшаяся в Windows для западноевропейских алфавитов. - -Однако, Microsoft, как всегда, сторонние стандарты использует, но только так, как хочет. Там решили, что в Latin-1 не попали многие нужные и ненужные, но забавные, символы. Например, не попал знак евро (€), что всех очень напрягало, так как цены на сайтах писать не удобно. Зато целых тридцать две позиции занимают какие-то символы для терминалов. Кому они нужны? На терминалах-то и Windows нету. - - -То есть, взяли и понапихали в этот раздел своих символов. Был символ 0080 «символом-заполнителем», а стал знаком евро. Ещё различных крестиков, процентиков, знаков функций и ещё чего-то совершенно непонятного напридумывали. Ну, и шрифты, соответственно, перерисовали, чтобы на 128-м месте шло евро. А если какой терминал подавится подобным текстом, то никому уже никакого дела не было. -€ ƒ ‡ ‰ Œ - -И потом пришёл Юникод, а у него в стандарте 0080 никакой не евро. Евро у него — 20AC. А 0080—009F, по-прежнему, терминальные символы. - -То есть, все тексты, которые раньше использовали эти символы из win-1252, они как-бы неправильные. И советы по всей сети, вроде «для ввода евро нажмите ALT+128» тоже неправильные. - -Но это какая-то нехорошая ситуация, поэтому её решили, как всегда костылём. Например, в стандарте HTML5 сказано, символы из ISO-8859-1 нужно заменять на windows-1252. И все браузеры этому следует. - -Что это значит, рассмотрим на примере: - -

- - - -Получается, что мы вывели символ с кодом 128, а он заменился на 8364. То есть, «терминальный символ, который использовался вместо евро», заменился на «настоящий Unicode-евро». Также ƒ меняется на 402-й символ (знак функции). - -То есть, даже если взять нормальный шрифт, поддерживающий Unicode (Universalia, например), в котором по 128-му коду нет никакого евро, всё равно вместо € будет красоваться евро (но html-валидатор всё-таки выругается). - -Тоже самое, если вставлять в DOM через JavaScript: - -var div = document.createElement("div"); -div.innerHTML = "€"; -console.log(div.firstChild.nodeValue.charCodeAt(0)); // 8364 - -Но можно вставить непосредственно символ. Тогда всё нормально: - -var div = document.createElement("div"), - char = String.fromCharCode(128), - text = document.createTextNode(char); -div.appendChild(text); -console.log(div.firstChild.nodeValue.charCodeAt(0)); // 128 - -Выводы и вопросы - -1. Верстальщикам: евро, это не €, а €. А ещё лучше: €. - -2. Программистам: когда вам кажется, что из DOM должен прийти точно определённый символ — креститься надо. - -3. Разработчикам Юникода: нахрена вам терминальные символы и почему столько мусора, а знака рубля нет? -Список заменяемых символов из 0080—009F -€ 0080 → 20AC Euro sign -‚ 0082 → 201A Single low-9 quotation mark -ƒ 0083 → 0192 Latin small letter f with hook -„ 0084 → 201E Double low-9 quotation mark -… 0085 → 2026 Horizontal ellipsis -† 0086 → 2020 Dagger -‡ 0087 → 2021 Double dagger -ˆ 0088 → 02C6 Modifier letter circumflex accent -‰ 0089 → 2030 Per mille sign -Š 008A → 0160 Latin capital letter s with caron -‹ 008B → 2039 Single left-pointing angle quotation mark -Œ 008C → 0152 Latin capital ligature oe -Ž 008E → 017D Latin capital letter z with caron -‘ 0091 → 2018 Left single quotation mark -’ 0092 → 2019 Right single quotation mark -“ 0093 → 201C Left double quotation mark -” 0094 → 201D Right double quotation mark -• 0095 → 2022 Bullet -– 0096 → 2013 En dash -— 0097 → 2014 Em dash -˜ 0098 → 02DC Small tilde -™ 0099 → 2122 Trade mark sign -š 009A → 0161 Latin small letter s with caron -› 009B → 203A Single right-pointing angle quotation mark -œ 009C → 0153 Latin small ligature oe -ž 009E → 017E Latin small letter z with caron -Ÿ 009F → 0178 Latin capital letter y with diaeresis -

-
diff --git a/loc/en/sets.txt b/loc/en/sets.txt index d1655967..1a280cfc 100644 --- a/loc/en/sets.txt +++ b/loc/en/sets.txt @@ -14,3 +14,5 @@ music-symbols: Music symbols flowers-symbols: Flowers symbols greek-symbols: Greek symbols social-symbols: Symbols for Facebook +esperanto: Esperanto + diff --git a/loc/ru/blocks/about.txt b/loc/ru/blocks/about.txt index eac0d5a8..2da54d1e 100644 --- a/loc/ru/blocks/about.txt +++ b/loc/ru/blocks/about.txt @@ -8,7 +8,7 @@
Сергей Асанов

Сергей Асанов

Санкт-Петербург, Россия
- http://sadesign.ru
+ http://sergeiasanov.ru
Идея, дизайн, вёрстка
Связаться: sa@unicode-table.com
diff --git a/loc/ru/blocks/euro.txt b/loc/ru/blocks/euro.txt deleted file mode 100644 index 167d0278..00000000 --- a/loc/ru/blocks/euro.txt +++ /dev/null @@ -1,91 +0,0 @@ -
-
-

Знак евро или символ-заполнитель U+0080

-

Раздел Управляющие символы С1, к которому относятся символы с кодами 0080—009F, был унаследован Юникодом от кодовой страницы ISO 8859-1. Сама же ISO 8859-1 (также известная, как Latin-1), основана на символьном наборе для терминалов. Вследствие чего, первые 32 символа были выделены для различных терминальных команд. То есть, «Разрешение разрыва строки», «Запрещение разрыва строки», «Обратный перевод строки», «Символ-заполнитель» и остальной допотопный треш.

- -

На Latin-1 также раньше строились и другие 8-битные кодировки, в частности Windows-1252, использовавшаяся в Windows для западноевропейских алфавитов.

- -

Однако, Microsoft, как всегда, сторонние стандарты использует, но только так, как хочет. Там решили, что в Latin-1 не попали многие нужные и ненужные, но забавные, символы. Например, не попал знак евро , что всех очень напрягало, так как цены на сайтах писать не удобно. Зато целых тридцать две позиции занимают какие-то символы для терминалов. Кому они нужны? На терминалах-то и Windows нету.

- - -

То есть, взяли и понапихали в этот раздел своих символов. Был символ 0080 «символом-заполнителем», а стал знаком евро. Ещё различных крестиков, процентиков, знаков функций и ещё чего-то совершенно непонятного напридумывали. Ну, и шрифты, соответственно, перерисовали, чтобы на 128-м месте шло евро. А если какой терминал подавится подобным текстом, то никому уже никакого дела не было.

- -€ ƒ ‡ ‰ Œ - -

И потом пришёл Юникод, а у него в стандарте 0080 никакой не евро. Евро у него — 20AC. А 0080—009F, по-прежнему, терминальные символы.

- -

То есть, все тексты, которые раньше использовали эти символы из win-1252, они как-бы неправильные. И советы по всей сети, вроде «для ввода евро нажмите ALT+128» тоже неправильные.

- -

Но это какая-то нехорошая ситуация, поэтому её решили, как всегда костылём. Например, в стандарте HTML5 сказано, символы из ISO-8859-1 нужно заменять на windows-1252. И все браузеры этому следует.

- -

Что это значит, рассмотрим на примере:

-
-	
- - -
- -

Получается, что мы вывели символ с кодом 128, а он заменился на 8364. То есть, «терминальный символ, который использовался вместо евро», заменился на «настоящий Unicode-евро». Также ƒ меняется на 402-й символ (знак функции).

- -

То есть, даже если взять нормальный шрифт, поддерживающий Unicode (Universalia, например), в котором по 128-му коду нет никакого евро, всё равно вместо € будет красоваться евро (но html-валидатор всё-таки выругается).

- -

Тоже самое, если вставлять в DOM через JavaScript:

- -
-var div = document.createElement("div");
-div.innerHTML = "€";
-console.log(div.firstChild.nodeValue.charCodeAt(0)); // 8364
-
-Но можно вставить непосредственно символ. Тогда всё нормально:
-
-var div = document.createElement("div"),
-    char = String.fromCharCode(128),
-    text = document.createTextNode(char);
-div.appendChild(text);
-console.log(div.firstChild.nodeValue.charCodeAt(0)); // 128
-
- -

Выводы и вопросы

- -
    -
  1. Верстальщикам: евро, это не €, а €. А ещё лучше: €.
  2. -
  3. Программистам: когда вам кажется, что из DOM должен прийти точно определённый символ — креститься надо.
  4. -
  5. Разработчикам Юникода: нахрена вам терминальные символы и почему столько мусора, а знака рубля нет?
  6. -
- -

Список заменяемых символов из 0080—009F

-€ 0080 → 20AC Euro sign -‚ 0082 → 201A Single low-9 quotation mark -ƒ 0083 → 0192 Latin small letter f with hook -„ 0084 → 201E Double low-9 quotation mark -… 0085 → 2026 Horizontal ellipsis -† 0086 → 2020 Dagger -‡ 0087 → 2021 Double dagger -ˆ 0088 → 02C6 Modifier letter circumflex accent -‰ 0089 → 2030 Per mille sign -Š 008A → 0160 Latin capital letter s with caron -‹ 008B → 2039 Single left-pointing angle quotation mark -Œ 008C → 0152 Latin capital ligature oe -Ž 008E → 017D Latin capital letter z with caron -‘ 0091 → 2018 Left single quotation mark -’ 0092 → 2019 Right single quotation mark -“ 0093 → 201C Left double quotation mark -” 0094 → 201D Right double quotation mark -• 0095 → 2022 Bullet -– 0096 → 2013 En dash -— 0097 → 2014 Em dash -˜ 0098 → 02DC Small tilde -™ 0099 → 2122 Trade mark sign -š 009A → 0161 Latin small letter s with caron -› 009B → 203A Single right-pointing angle quotation mark -œ 009C → 0153 Latin small ligature oe -ž 009E → 017E Latin small letter z with caron -Ÿ 009F → 0178 Latin capital letter y with diaeresis -

-
diff --git a/loc/ru/sets.txt b/loc/ru/sets.txt index f16dc52f..1d1e0921 100644 --- a/loc/ru/sets.txt +++ b/loc/ru/sets.txt @@ -13,4 +13,5 @@ sea-symbols: Символы на морскую тему music-symbols: Музыкальные символы flowers-symbols: Символы цветов greek-symbols: Греческие символы -social-symbols: Символы для Вконтакте \ No newline at end of file +social-symbols: Символы для Вконтакте +esperanto: Алфавит эсперанто diff --git a/loc/ru/symbols/0000.txt b/loc/ru/symbols/0000.txt index d88e9a65..12da4265 100644 --- a/loc/ru/symbols/0000.txt +++ b/loc/ru/symbols/0000.txt @@ -231,11 +231,11 @@ 00E6 : Латинская строчная лигатура ae 00E7 : Латинская строчная буква c с седилью 00E8 : Латинская строчная буква e с грависом -00E9 : Латинская строчная буква e с актом +00E9 : Латинская строчная буква e с акутом 00EA : Латинская строчная буква e с циркумфлексом 00EB : Латинская строчная буква e с диэризисом 00EC : Латинская строчная буква i с грависом -00ED : Латинская строчная буква i с ударением +00ED : Латинская строчная буква i с акутом 00EE : Латинская строчная буква i с циркумфлексом сверху 00EF : Латинская строчная буква i с диэризисом (умляутом) 00F0 : Латинская строчная буква eth diff --git a/loc/ru/symbols/0200.txt b/loc/ru/symbols/0200.txt index 88ffe821..3f44c6fc 100644 --- a/loc/ru/symbols/0200.txt +++ b/loc/ru/symbols/0200.txt @@ -112,10 +112,10 @@ 026F : Латинская строчная буква перевернутая m 0270 : Латинская строчная буква перевернутая m с длинной ногой 0271 : Латинская строчная буква m с крючком -0272 : Латинская строчная буква n с левым крючком крючком +0272 : Латинская строчная буква n с левым крючком 0273 : Латинская строчная буква n с загнутым назад крючком 0274 : Латинская буква маленькая заглавная n -0275 : Латинская строчная буква полосойred o +0275 : Латинская строчная перечёркнутая буква o 0276 : Латинская буква маленькая заглавная oe 0277 : Латинская строчная буква закрытая omega 0278 : Латинская строчная буква phi @@ -126,10 +126,10 @@ 027D : Латинская строчная буква r с и хвостиком 027E : Латинская строчная буква r с рыбным крючком 027F : Латинская строчная буква обратная r с рыбным крючком -0280 : Латинская буква маленькая заглавная r -0281 : Латинская буква маленькая заглавная перевернутым r +0280 : Латинская строчная заглавная буква R +0281 : Латинская строчная перевёрнутая заглавная буква R 0282 : Латинская строчная буква s с крючком -0283 : Латинская строчная буква esh +0283 : Латинская строчная буква эш. Глухой постальвеолярный спирант 0284 : Латинская строчная буква j без точки с чертой и крючком 0285 : Латинская строчная буква squat обратная esh 0286 : Латинская строчная буква esh с завитком diff --git a/loc/ru/symbols/2900.txt b/loc/ru/symbols/2900.txt index 85d2b4f4..efbd08d9 100644 --- a/loc/ru/symbols/2900.txt +++ b/loc/ru/symbols/2900.txt @@ -236,7 +236,7 @@ 29EB : Закрашенная ромбовидная фигура 29EC : Незакрашенный круг со стрелой вниз 29ED : Закрашенный круг со стрелой вниз -29EE : Зарпещённо-ошибочный незакрашенный квадрат +29EE : Запрещённо-ошибочный незакрашенный квадрат 29EF : Запрещённо-ошибочный закрашенный квадрат 29F0 : Запрещённо-ошибочный незакрашенный ромб 29F1 : Запрещённо-ошибочный закрашенный ромб diff --git a/loc/th/blocks/about.txt b/loc/th/blocks/about.txt index 53c7b50c..168ebf8f 100644 --- a/loc/th/blocks/about.txt +++ b/loc/th/blocks/about.txt @@ -6,7 +6,7 @@
Sergei Asanov

Sergei Asanov

เซนต์ปีเตอร์สเบิร์ก, รัสเซีย
- http://sadesign.ru
+ http://sergeiasanov.ru
ความคิด, ออกแบบ, เค้าโครง
ติดต่อ: sa@unicode-table.com
diff --git a/loc/th/sets.txt b/loc/th/sets.txt index 5c1d24a5..9818ae96 100644 --- a/loc/th/sets.txt +++ b/loc/th/sets.txt @@ -19,3 +19,5 @@ music-symbols: สัญลักษณ์เพลง flowers-symbols: สัญลักษณ์ดอกไม้ greek-symbols: สัญลักษณ์ภาษากรีก social-symbols: สัญลักษณ์สำหรับ Facebook +esperanto: ภาษาโลก + diff --git a/loc/ua/blocks/about.txt b/loc/ua/blocks/about.txt index eac0d5a8..2da54d1e 100644 --- a/loc/ua/blocks/about.txt +++ b/loc/ua/blocks/about.txt @@ -8,7 +8,7 @@
Сергей Асанов

Сергей Асанов

Санкт-Петербург, Россия
- http://sadesign.ru
+ http://sergeiasanov.ru
Идея, дизайн, вёрстка
Связаться: sa@unicode-table.com
diff --git a/loc/ua/sets.txt b/loc/ua/sets.txt index c5201b11..a402f35b 100644 --- a/loc/ua/sets.txt +++ b/loc/ua/sets.txt @@ -13,4 +13,5 @@ sea-symbols: Символы на морскую тему music-symbols: Музыкальные символы flowers-symbols: Символы цветов greek-symbols: Греческие символы -social-symbols: Символы для Вконтакте \ No newline at end of file +social-symbols: Символы для Вконтакте +esperanto: Алфавіт есперанто