mirror of
https://github.com/symbl-cc/symbl-data.git
synced 2025-10-27 19:51:10 -04:00
484 lines
13 KiB
Plaintext
484 lines
13 KiB
Plaintext
# See ftp://ftp.unicode.org/Public/3.0-Update/UnicodeData-3.0.0.html
|
|
|
|
[cf]: Mudança de caso
|
|
[scf]: Alteração simples de maiúsculas e minúsculas
|
|
|
|
[age]: Versão
|
|
1.1: V1_1
|
|
2.0: V2_0
|
|
2.1: V2_1
|
|
3.0: V3_0
|
|
3.1: V3_1
|
|
3.2: V3_2
|
|
4.0: V4_0
|
|
4.1: V4_1
|
|
5.0: V5_0
|
|
5.1: V5_1
|
|
5.2: V5_2
|
|
6.0: V6_0
|
|
6.1: V6_1
|
|
6.2: V6_2
|
|
6.3: V6_3
|
|
7.0: V7_0
|
|
8.0: V8_0
|
|
9.0: V9_0
|
|
10.0: V10_0
|
|
11.0: V11_0
|
|
12.0: V12_0
|
|
12.1: V12_1
|
|
13.0: V13_0
|
|
na: Unassigned
|
|
14.0: V14_0
|
|
15.0: V15_0
|
|
|
|
[bpt]: Tipo de suporte de espelho emparelhado (bidi)
|
|
c: Close
|
|
n: None
|
|
o: Open
|
|
|
|
[CE]: Exclusão de composição
|
|
n: No
|
|
y: Yes
|
|
|
|
[blk]: Bloquear
|
|
adlam: Adlam
|
|
aegean_numbers: Aegean_Numbers
|
|
ahom: Ahom
|
|
alchemical: Alchemical_Symbols
|
|
alphabetic_pf: Alphabetic_Presentation_Forms
|
|
anatolian_hieroglyphs: Anatolian_Hieroglyphs
|
|
ancient_greek_music: Ancient_Greek_Musical_Notation
|
|
ancient_greek_numbers: Ancient_Greek_Numbers
|
|
ancient_symbols: Ancient_Symbols
|
|
arabic: Arabic
|
|
arabic_ext_a: Arabic_Extended_A
|
|
arabic_math: Arabic_Mathematical_Alphabetic_Symbols
|
|
arabic_pf_a: Arabic_Presentation_Forms_A
|
|
arabic_pf_b: Arabic_Presentation_Forms_B
|
|
arabic_sup: Arabic_Supplement
|
|
armenian: Armenian
|
|
arrows: Arrows
|
|
ascii: Basic_Latin
|
|
avestan: Avestan
|
|
balinese: Balinese
|
|
bamum: Bamum
|
|
bamum_sup: Bamum_Supplement
|
|
bassa_vah: Bassa_Vah
|
|
batak: Batak
|
|
bengali: Bengali
|
|
bhaiksuki: Bhaiksuki
|
|
block_elements: Block_Elements
|
|
bopomofo: Bopomofo
|
|
bopomofo_ext: Bopomofo_Extended
|
|
box_drawing: Box_Drawing
|
|
brahmi: Brahmi
|
|
braille: Braille_Patterns
|
|
buginese: Buginese
|
|
buhid: Buhid
|
|
byzantine_music: Byzantine_Musical_Symbols
|
|
carian: Carian
|
|
caucasian_albanian: Caucasian_Albanian
|
|
chakma: Chakma
|
|
cham: Cham
|
|
cherokee: Cherokee
|
|
cherokee_sup: Cherokee_Supplement
|
|
chess_symbols: Chess_Symbols
|
|
chorasmian: Chorasmian
|
|
cjk: CJK_Unified_Ideographs
|
|
cjk_compat: CJK_Compatibility
|
|
cjk_compat_forms: CJK_Compatibility_Forms
|
|
cjk_compat_ideographs: CJK_Compatibility_Ideographs
|
|
cjk_compat_ideographs_sup: CJK_Compatibility_Ideographs_Supplement
|
|
cjk_ext_a: CJK_Unified_Ideographs_Extension_A
|
|
cjk_ext_b: CJK_Unified_Ideographs_Extension_B
|
|
cjk_ext_c: CJK_Unified_Ideographs_Extension_C
|
|
cjk_ext_d: CJK_Unified_Ideographs_Extension_D
|
|
cjk_ext_e: CJK_Unified_Ideographs_Extension_E
|
|
cjk_ext_f: CJK_Unified_Ideographs_Extension_F
|
|
cjk_ext_g: CJK_Unified_Ideographs_Extension_G
|
|
cjk_radicals_sup: CJK_Radicals_Supplement
|
|
cjk_strokes: CJK_Strokes
|
|
cjk_symbols: CJK_Symbols_And_Punctuation
|
|
compat_jamo: Hangul_Compatibility_Jamo
|
|
control_pictures: Control_Pictures
|
|
coptic: Coptic
|
|
coptic_epact_numbers: Coptic_Epact_Numbers
|
|
counting_rod: Counting_Rod_Numerals
|
|
cuneiform: Cuneiform
|
|
cuneiform_numbers: Cuneiform_Numbers_And_Punctuation
|
|
currency_symbols: Currency_Symbols
|
|
cypriot_syllabary: Cypriot_Syllabary
|
|
cyrillic: Cyrillic
|
|
cyrillic_ext_a: Cyrillic_Extended_A
|
|
cyrillic_ext_b: Cyrillic_Extended_B
|
|
cyrillic_ext_c: Cyrillic_Extended_C
|
|
cyrillic_sup: Cyrillic_Supplement
|
|
deseret: Deseret
|
|
devanagari: Devanagari
|
|
devanagari_ext: Devanagari_Extended
|
|
diacriticals: Combining_Diacritical_Marks
|
|
diacriticals_ext: Combining_Diacritical_Marks_Extended
|
|
diacriticals_for_symbols: Combining_Diacritical_Marks_For_Symbols
|
|
diacriticals_sup: Combining_Diacritical_Marks_Supplement
|
|
dingbats: Dingbats
|
|
dives_akuru: Dives_Akuru
|
|
dogra: Dogra
|
|
domino: Domino_Tiles
|
|
duployan: Duployan
|
|
early_dynastic_cuneiform: Early_Dynastic_Cuneiform
|
|
egyptian_hieroglyph_format_controls: Egyptian_Hieroglyph_Format_Controls
|
|
egyptian_hieroglyphs: Egyptian_Hieroglyphs
|
|
elbasan: Elbasan
|
|
elymaic: Elymaic
|
|
emoticons: Emoticons
|
|
enclosed_alphanum: Enclosed_Alphanumerics
|
|
enclosed_alphanum_sup: Enclosed_Alphanumeric_Supplement
|
|
enclosed_cjk: Enclosed_CJK_Letters_And_Months
|
|
enclosed_ideographic_sup: Enclosed_Ideographic_Supplement
|
|
ethiopic: Ethiopic
|
|
ethiopic_ext: Ethiopic_Extended
|
|
ethiopic_ext_a: Ethiopic_Extended_A
|
|
ethiopic_sup: Ethiopic_Supplement
|
|
geometric_shapes: Geometric_Shapes
|
|
geometric_shapes_ext: Geometric_Shapes_Extended
|
|
georgian: Georgian
|
|
georgian_ext: Georgian_Extended
|
|
georgian_sup: Georgian_Supplement
|
|
glagolitic: Glagolitic
|
|
glagolitic_sup: Glagolitic_Supplement
|
|
gothic: Gothic
|
|
grantha: Grantha
|
|
greek: Greek_And_Coptic
|
|
greek_ext: Greek_Extended
|
|
gujarati: Gujarati
|
|
gunjala_gondi: Gunjala_Gondi
|
|
gurmukhi: Gurmukhi
|
|
half_and_full_forms: Halfwidth_And_Fullwidth_Forms
|
|
half_marks: Combining_Half_Marks
|
|
hangul: Hangul_Syllables
|
|
hanifi_rohingya: Hanifi_Rohingya
|
|
hanunoo: Hanunoo
|
|
hatran: Hatran
|
|
hebrew: Hebrew
|
|
high_pu_surrogates: High_Private_Use_Surrogates
|
|
high_surrogates: High_Surrogates
|
|
hiragana: Hiragana
|
|
idc: Ideographic_Description_Characters
|
|
ideographic_symbols: Ideographic_Symbols_And_Punctuation
|
|
imperial_aramaic: Imperial_Aramaic
|
|
indic_number_forms: Common_Indic_Number_Forms
|
|
indic_siyaq_numbers: Indic_Siyaq_Numbers
|
|
inscriptional_pahlavi: Inscriptional_Pahlavi
|
|
inscriptional_parthian: Inscriptional_Parthian
|
|
ipa_ext: IPA_Extensions
|
|
jamo: Hangul_Jamo
|
|
jamo_ext_a: Hangul_Jamo_Extended_A
|
|
jamo_ext_b: Hangul_Jamo_Extended_B
|
|
javanese: Javanese
|
|
kaithi: Kaithi
|
|
kana_ext_a: Kana_Extended_A
|
|
kana_sup: Kana_Supplement
|
|
kanbun: Kanbun
|
|
kangxi: Kangxi_Radicals
|
|
kannada: Kannada
|
|
katakana: Katakana
|
|
katakana_ext: Katakana_Phonetic_Extensions
|
|
kayah_li: Kayah_Li
|
|
kharoshthi: Kharoshthi
|
|
khitan_small_script: Khitan_Small_Script
|
|
khmer: Khmer
|
|
khmer_symbols: Khmer_Symbols
|
|
khojki: Khojki
|
|
khudawadi: Khudawadi
|
|
lao: Lao
|
|
latin_1_sup: Latin_1_Supplement
|
|
latin_ext_a: Latin_Extended_A
|
|
latin_ext_additional: Latin_Extended_Additional
|
|
latin_ext_b: Latin_Extended_B
|
|
latin_ext_c: Latin_Extended_C
|
|
latin_ext_d: Latin_Extended_D
|
|
latin_ext_e: Latin_Extended_E
|
|
lepcha: Lepcha
|
|
letterlike_symbols: Letterlike_Symbols
|
|
limbu: Limbu
|
|
linear_a: Linear_A
|
|
linear_b_ideograms: Linear_B_Ideograms
|
|
linear_b_syllabary: Linear_B_Syllabary
|
|
lisu: Lisu
|
|
lisu_sup: Lisu_Supplement
|
|
low_surrogates: Low_Surrogates
|
|
lycian: Lycian
|
|
lydian: Lydian
|
|
mahajani: Mahajani
|
|
mahjong: Mahjong_Tiles
|
|
makasar: Makasar
|
|
malayalam: Malayalam
|
|
mandaic: Mandaic
|
|
manichaean: Manichaean
|
|
marchen: Marchen
|
|
masaram_gondi: Masaram_Gondi
|
|
math_alphanum: Mathematical_Alphanumeric_Symbols
|
|
math_operators: Mathematical_Operators
|
|
mayan_numerals: Mayan_Numerals
|
|
medefaidrin: Medefaidrin
|
|
meetei_mayek: Meetei_Mayek
|
|
meetei_mayek_ext: Meetei_Mayek_Extensions
|
|
mende_kikakui: Mende_Kikakui
|
|
meroitic_cursive: Meroitic_Cursive
|
|
meroitic_hieroglyphs: Meroitic_Hieroglyphs
|
|
miao: Miao
|
|
misc_arrows: Miscellaneous_Symbols_And_Arrows
|
|
misc_math_symbols_a: Miscellaneous_Mathematical_Symbols_A
|
|
misc_math_symbols_b: Miscellaneous_Mathematical_Symbols_B
|
|
misc_pictographs: Miscellaneous_Symbols_And_Pictographs
|
|
misc_symbols: Miscellaneous_Symbols
|
|
misc_technical: Miscellaneous_Technical
|
|
modi: Modi
|
|
modifier_letters: Spacing_Modifier_Letters
|
|
modifier_tone_letters: Modifier_Tone_Letters
|
|
mongolian: Mongolian
|
|
mongolian_sup: Mongolian_Supplement
|
|
mro: Mro
|
|
multani: Multani
|
|
music: Musical_Symbols
|
|
myanmar: Myanmar
|
|
myanmar_ext_a: Myanmar_Extended_A
|
|
myanmar_ext_b: Myanmar_Extended_B
|
|
nabataean: Nabataean
|
|
nandinagari: Nandinagari
|
|
nb: No_Block
|
|
new_tai_lue: New_Tai_Lue
|
|
newa: Newa
|
|
nko: NKo
|
|
number_forms: Number_Forms
|
|
nushu: Nushu
|
|
nyiakeng_puachue_hmong: Nyiakeng_Puachue_Hmong
|
|
ocr: Optical_Character_Recognition
|
|
ogham: Ogham
|
|
ol_chiki: Ol_Chiki
|
|
old_hungarian: Old_Hungarian
|
|
old_italic: Old_Italic
|
|
old_north_arabian: Old_North_Arabian
|
|
old_permic: Old_Permic
|
|
old_persian: Old_Persian
|
|
old_sogdian: Old_Sogdian
|
|
old_south_arabian: Old_South_Arabian
|
|
old_turkic: Old_Turkic
|
|
oriya: Oriya
|
|
ornamental_dingbats: Ornamental_Dingbats
|
|
osage: Osage
|
|
osmanya: Osmanya
|
|
ottoman_siyaq_numbers: Ottoman_Siyaq_Numbers
|
|
pahawh_hmong: Pahawh_Hmong
|
|
palmyrene: Palmyrene
|
|
pau_cin_hau: Pau_Cin_Hau
|
|
phags_pa: Phags_Pa
|
|
phaistos: Phaistos_Disc
|
|
phoenician: Phoenician
|
|
phonetic_ext: Phonetic_Extensions
|
|
phonetic_ext_sup: Phonetic_Extensions_Supplement
|
|
playing_cards: Playing_Cards
|
|
psalter_pahlavi: Psalter_Pahlavi
|
|
pua: Private_Use_Area
|
|
punctuation: General_Punctuation
|
|
rejang: Rejang
|
|
rumi: Rumi_Numeral_Symbols
|
|
runic: Runic
|
|
samaritan: Samaritan
|
|
saurashtra: Saurashtra
|
|
sharada: Sharada
|
|
shavian: Shavian
|
|
shorthand_format_controls: Shorthand_Format_Controls
|
|
siddham: Siddham
|
|
sinhala: Sinhala
|
|
sinhala_archaic_numbers: Sinhala_Archaic_Numbers
|
|
small_forms: Small_Form_Variants
|
|
small_kana_ext: Small_Kana_Extension
|
|
sogdian: Sogdian
|
|
sora_sompeng: Sora_Sompeng
|
|
soyombo: Soyombo
|
|
specials: Specials
|
|
sundanese: Sundanese
|
|
sundanese_sup: Sundanese_Supplement
|
|
sup_arrows_a: Supplemental_Arrows_A
|
|
sup_arrows_b: Supplemental_Arrows_B
|
|
sup_arrows_c: Supplemental_Arrows_C
|
|
sup_math_operators: Supplemental_Mathematical_Operators
|
|
sup_pua_a: Supplementary_Private_Use_Area_A
|
|
sup_pua_b: Supplementary_Private_Use_Area_B
|
|
sup_punctuation: Supplemental_Punctuation
|
|
sup_symbols_and_pictographs: Supplemental_Symbols_And_Pictographs
|
|
super_and_sub: Superscripts_And_Subscripts
|
|
sutton_signwriting: Sutton_SignWriting
|
|
syloti_nagri: Syloti_Nagri
|
|
symbols_and_pictographs_ext_a: Symbols_And_Pictographs_Extended_A
|
|
symbols_for_legacy_computing: Symbols_For_Legacy_Computing
|
|
syriac: Syriac
|
|
syriac_sup: Syriac_Supplement
|
|
tagalog: Tagalog
|
|
tagbanwa: Tagbanwa
|
|
tags: Tags
|
|
tai_le: Tai_Le
|
|
tai_tham: Tai_Tham
|
|
tai_viet: Tai_Viet
|
|
tai_xuan_jing: Tai_Xuan_Jing_Symbols
|
|
takri: Takri
|
|
tamil: Tamil
|
|
tamil_sup: Tamil_Supplement
|
|
tangut: Tangut
|
|
tangut_components: Tangut_Components
|
|
tangut_sup: Tangut_Supplement
|
|
telugu: Telugu
|
|
thaana: Thaana
|
|
thai: Thai
|
|
tibetan: Tibetan
|
|
tifinagh: Tifinagh
|
|
tirhuta: Tirhuta
|
|
transport_and_map: Transport_And_Map_Symbols
|
|
ucas: Unified_Canadian_Aboriginal_Syllabics
|
|
ucas_ext: Unified_Canadian_Aboriginal_Syllabics_Extended
|
|
ugaritic: Ugaritic
|
|
vai: Vai
|
|
vedic_ext: Vedic_Extensions
|
|
vertical_forms: Vertical_Forms
|
|
vs: Variation_Selectors
|
|
vs_sup: Variation_Selectors_Supplement
|
|
wancho: Wancho
|
|
warang_citi: Warang_Citi
|
|
yezidi: Yezidi
|
|
yi_radicals: Yi_Radicals
|
|
yi_syllables: Yi_Syllables
|
|
yijing: Yijing_Hexagram_Symbols
|
|
zanabazar_square: Zanabazar_Square
|
|
arabic_ext_b: Arabic_Extended_B
|
|
arabic_ext_c: Arabic_Extended_C
|
|
cjk_ext_h: CJK_Unified_Ideographs_Extension_H
|
|
cypro_minoan: Cypro_Minoan
|
|
cyrillic_ext_d: Cyrillic_Extended_D
|
|
devanagari_ext_a: Devanagari_Extended_A
|
|
ethiopic_ext_b: Ethiopic_Extended_B
|
|
kaktovik_numerals: Kaktovik_Numerals
|
|
kana_ext_b: Kana_Extended_B
|
|
kawi: Kawi
|
|
latin_ext_f: Latin_Extended_F
|
|
latin_ext_g: Latin_Extended_G
|
|
nag_mundari: Nag_Mundari
|
|
old_uyghur: Old_Uyghur
|
|
tangsa: Tangsa
|
|
toto: Toto
|
|
ucas_ext_a: Unified_Canadian_Aboriginal_Syllabics_Extended_A
|
|
vithkuqi: Vithkuqi
|
|
znamenny_music: Znamenny_Musical_Notation
|
|
|
|
|
|
[gc]: Categoria Geral
|
|
|
|
L: Carta
|
|
M: Marca
|
|
N: Número
|
|
Z: Separador
|
|
C: De outros
|
|
P: Pontuação
|
|
S: Símbolo
|
|
Lu: Maiúsculas
|
|
Ll: Minúsculas
|
|
Lt: Titlecase
|
|
Mn: Não-espaçamento
|
|
Mc: Combinação de espaçamento
|
|
Me: Encerrando
|
|
Nd: Dígito decimal
|
|
Nl: Carta
|
|
No: De outros
|
|
Zs: Espaço
|
|
Zl: Linha
|
|
Zp: Parágrafo
|
|
Cc: Ao controle
|
|
Cf: Formato
|
|
Cs: Substituto
|
|
Co: Uso Privado
|
|
Cn: Não atribuído (nenhum caractere no arquivo tem essa propriedade)
|
|
Lm: Modificador
|
|
Lo: De outros
|
|
Pc: Conector
|
|
Pd: Traço
|
|
Ps: Aberto
|
|
Pe: Fechar
|
|
Pi: Citação inicial (pode se comportar como Ps ou Pe dependendo do uso)
|
|
Pf: Citação final (pode se comportar como Ps ou Pe dependendo do uso)
|
|
Po: De outros
|
|
Sm: Matemática
|
|
Sc: Moeda
|
|
Sk: Modificador
|
|
So: De outros
|
|
|
|
[bc]: Categoria Bidirecional
|
|
|
|
L: Da esquerda para direita
|
|
LRE: Incorporação da Esquerda para a Direita
|
|
LRO: Substituição da esquerda para a direita
|
|
R: Direita para esquerda
|
|
AL: Árabe da direita para a esquerda
|
|
RLE: Incorporação da direita para a esquerda
|
|
RLO: Substituição da direita para a esquerda
|
|
PDF: Formato direcional pop
|
|
EN: Número Europeu
|
|
ES: Separador de número europeu
|
|
ET: Terminator de número europeu
|
|
AN: Número árabe
|
|
CS: Separador de número comum
|
|
NSM: Marca não-espaçadora
|
|
BN: Limite Neutro
|
|
B: Separador de Parágrafos
|
|
S: Separador de segmentos
|
|
WS: Espaço em branco
|
|
ON: Outros neutros
|
|
|
|
[cdm]: Mapeamento de decomposição de caracteres
|
|
|
|
font: Uma variante de fonte (por exemplo, um formulário em preto)
|
|
noBreak: Uma versão sem interrupções de um espaço ou hífen
|
|
initial: Um formulário de apresentação inicial (árabe)
|
|
medial: Um formulário de apresentação médica (árabe)
|
|
final: Uma apresentação final (em árabe)
|
|
isolated: Uma forma de apresentação isolada (árabe)
|
|
circle: Uma forma circundada
|
|
super: Um formulário sobrescrito
|
|
sub: Um formulário subscrito
|
|
vertical: Um formulário de apresentação de layout vertical
|
|
wide: Um caractere de compatibilidade amplo (ou zenkaku)
|
|
narrow: Um caractere de compatibilidade estreita (ou hankaku)
|
|
small: Uma pequena forma variante (compatibilidade CNS)
|
|
square: Uma variante de fonte esquemática CJK
|
|
fraction: Uma forma de fração vulgar
|
|
compat: Caso contrário, caracteres de compatibilidade não especificados
|
|
|
|
[ccc]: Combinações canônicas
|
|
|
|
0: Espaçamento, divisão, encerramento, reordancia, e tibetano subjoined
|
|
1: Superposições e interior
|
|
7: Nuktas
|
|
8: Hiragana / Katakana marcas de voz
|
|
9: Viramas
|
|
10: Início das classes de posição fixa
|
|
199: Fim de classes de posição fixa
|
|
200: Em baixo, à esquerda, anexado
|
|
202: Embaixo anexado
|
|
204: Em baixo, à direita, anexado
|
|
208: Left attached (reordrant em torno de um personagem de base única)
|
|
210: Em anexo
|
|
212: Acima à esquerda anexado
|
|
214: Acima anexado
|
|
216: Acima do lado direito
|
|
218: Abaixo da esquerda
|
|
220: Abaixo
|
|
222: Abaixo da direita
|
|
224: Esquerda (quadrante em torno de um caractere de base única)
|
|
226: Certo
|
|
228: Acima à esquerda
|
|
230: Acima
|
|
232: Acima à direita
|
|
233: Duplo abaixo
|
|
234: Duplo acima
|
|
240: Abaixo (iota subscrito)
|
|
|