неразрывный пробел код символа ascii
Коды ASCII символов
Управляющие символы (большинство непечатные; наиболее важные подсвечены жёлтым)
Печатные символы (стандартные)
Символ | Dec | Hex | Oct | Описание |
---|---|---|---|---|
32 | 20 | 040 | Пробел | |
! | 33 | 21 | 041 | Восклицательный знак |
« | 34 | 22 | 042 | Кавычка (» в HTML) |
# | 35 | 23 | 043 | Решётка (знак числа) |
$ | 36 | 24 | 044 | Доллар |
% | 37 | 25 | 045 | Проценты |
& | 38 | 26 | 046 | Амперсанд |
‘ | 39 | 27 | 047 | Закрывающая одиночная кавычка (апостроф) |
( | 40 | 28 | 050 | Открывающая скобка |
) | 41 | 29 | 051 | Закрывающая скобка |
* | 42 | 2a | 052 | Звёздочка, умножение |
+ | 43 | 2b | 053 | Плюс |
, | 44 | 2c | 054 | Запятая |
— | 45 | 2d | 055 | Дефис, минус |
. | 46 | 2e | 056 | Точка |
/ | 47 | 2f | 057 | Наклонная черта (слеш, деление) |
0 | 48 | 30 | 060 | Ноль |
1 | 49 | 31 | 061 | Один |
2 | 50 | 32 | 062 | Два |
3 | 51 | 33 | 063 | Три |
4 | 52 | 34 | 064 | Четыре |
5 | 53 | 35 | 065 | Пять |
6 | 54 | 36 | 066 | Шесть |
7 | 55 | 37 | 067 | Семь |
8 | 56 | 38 | 070 | Восемь |
9 | 57 | 39 | 071 | Девять |
: | 58 | 3a | 072 | Двоеточие |
; | 59 | 3b | 073 | Точка с запятой |
62 | 3e | 076 | Знак больше | |
? | 63 | 3f | 077 | Знак вопроса |
@ | 64 | 40 | 100 | эт, собака |
A | 65 | 41 | 101 | Заглавная A |
B | 66 | 42 | 102 | Заглавная B |
C | 67 | 43 | 103 | Заглавная C |
D | 68 | 44 | 104 | Заглавная D |
E | 69 | 45 | 105 | Заглавная E |
F | 70 | 46 | 106 | Заглавная F |
G | 71 | 47 | 107 | Заглавная G |
H | 72 | 48 | 110 | Заглавная H |
I | 73 | 49 | 111 | Заглавная I |
J | 74 | 4a | 112 | Заглавная J |
K | 75 | 4b | 113 | Заглавная K |
L | 76 | 4c | 114 | Заглавная L |
M | 77 | 4d | 115 | Заглавная M |
N | 78 | 4e | 116 | Заглавная N |
O | 79 | 4f | 117 | Заглавная O |
P | 80 | 50 | 120 | Заглавная P |
Q | 81 | 51 | 121 | Заглавная Q |
R | 82 | 52 | 122 | Заглавная R |
S | 83 | 53 | 123 | Заглавная S |
T | 84 | 54 | 124 | Заглавная T |
U | 85 | 55 | 125 | Заглавная U |
V | 86 | 56 | 126 | Заглавная V |
W | 87 | 57 | 127 | Заглавная W |
X | 88 | 58 | 130 | Заглавная X |
Y | 89 | 59 | 131 | Заглавная Y |
Z | 90 | 5a | 132 | Заглавная Z |
[ | 91 | 5b | 133 | Открывающая квадратная скобка |
\ | 92 | 5c | 134 | Обратная наклонная черта (обратный слеш) |
] | 93 | 5d | 135 | Закрывающая квадратная скобка |
^ | 94 | 5e | 136 | Циркумфлекс, возведение в степень, знак вставки |
_ | 95 | 5f | 137 | Нижнее подчёркивание |
` | 96 | 60 | 140 | Открывающая одиночная кавычка, гравис, знак ударения |
a | 97 | 61 | 141 | Строчная a |
b | 98 | 62 | 142 | Строчная b |
c | 99 | 63 | 143 | Строчная c |
d | 100 | 64 | 144 | Строчная d |
e | 101 | 65 | 145 | Строчная e |
f | 102 | 66 | 146 | Строчная f |
g | 103 | 67 | 147 | Строчная g |
h | 104 | 68 | 150 | Строчная h |
i | 105 | 69 | 151 | Строчная i |
j | 106 | 6a | 152 | Строчная j |
k | 107 | 6b | 153 | Строчная k |
l | 108 | 6c | 154 | Строчная l |
m | 109 | 6d | 155 | Строчная m |
n | 110 | 6e | 156 | Строчная n |
o | 111 | 6f | 157 | Строчная o |
p | 112 | 70 | 160 | Строчная p |
q | 113 | 71 | 161 | Строчная q |
r | 114 | 72 | 162 | Строчная r |
s | 115 | 73 | 163 | Строчная s |
t | 116 | 74 | 164 | Строчная t |
u | 117 | 75 | 165 | Строчная u |
v | 118 | 76 | 166 | Строчная v |
w | 119 | 77 | 167 | Строчная w |
x | 120 | 78 | 170 | Строчная x |
y | 121 | 79 | 171 | Строчная y |
z | 122 | 7a | 172 | Строчная z |
< | 123 | 7b | 173 | Открывающая фигурная скобка |
| | 124 | 7c | 174 | Вертикальная черта |
> | 125 | 7d | 175 | Закрывающая фигурная скобка |
126 | 7e | 176 | Тильда (приблизительно) |
Расширенный набор символов (ANSI) в русской кодировке Win-1251
Всё (или почти всё) о пробеле
Как следует из заголовка, речь в статье пойдёт о неотъемлемой части любого русскоязычного (и не только) текста — о пробеле. Мы затронем историю пробела, виды пробелов, вопросы употребления пробела в веб-типографике.
История межсловного пробела
Межсловный пробел — сравнительно позднее изобретении в истории человеческой мысли. Глубоко история пробела изложена в книге Пола Санджера (Paul Saenger) «Space between Words: The Origins of Silent Reading», а также, несколько менее глубоко, в книге Иоганнеса Фридриха «История письма».
Также есть неплохая статья Антона Бизяева о пробелах и об их истории «В начале пробелов не было», которая была опубликована в 1997 году в журнале «Publish».
Вкратце, пробел появился достаточно поздно, в тех письменностях, где отсутствие разграничения слов приводило к сложности чтения (так называемое консонантное письмо, где записываются только согласные звуки). Однако в греческом и латыни, в которых записывали и гласные звуки, использование пробела было утеряно. Пол Санджер связывает это с тем, что чтение производилось вслух, что упрощало разграничение слов при восприятии текста.
Вновь пробел начал использоваться приблизительно в VII—IX вв. н. э., и эта традиция пришла из Ирландии, где у писцов и чтецов родным языком являлся древнеирландский, а религиозная литература записывалась на латыни. По-видимому, по этой причине монахи испытывали трудности с чтением вслух. Считается, что появление пробела плотно связано с постепенным переходом от чтения вслух к чтению про себя. Примерами книг на латыни с межсловными пробелами являются памятники британской литературы: Евангелие из Дарроу (VII в.) и Келлская книга (VIII—IX вв.).
В глаголице и кириллице пробел также отсутствовал, и в привычном нам смысле используется только с XVII века.
До того, как человечество изобрело наборный шрифт, никакой особенной классификации межсловных пробелов не было — ставили писцы пробелы на глазок и ставили. Напомню (мы писали об этом в статье «Выключка по ширине»), что рукопись и ксиллография относятся к способам создания текстов без подвижности литер. Естественно, пробелы могли получаться различной ширины, так как пропуски делались вручную.
Пробелы в ручном наборе
Когда подвижность литер появилась (а произошло это с появлением наборных шрифтов), появились соответственно и вопросы — а как же ставить пробелы, чтобы соблюдалась выключка по ширине?
Технология ручного набора такова, что набранная строка полностью зажимается в верстатке и в гранке, и, соответственно, должна иметь ширину, практически точно равную ширине полосы (подробнее с технологией ручного набора можно познакомиться в одноимённой книге М. В. Шульмейстера).
Строка при ручном наборе набиралась из литер (брусков, на торце которых делались выпуклые зеркальные копии букв, отпечатывающиеся на бумаге), а межсловные пробелы создавались с помощью так называемых шпаций — брусков различной толщины, у которых на торце нет печатающей поверхности. Выглядит это примерно вот так. Шпации для каждого кегля шрифта, естественно, выпускались свои, и имели различную ширину. Например, для шрифта кегля 10 пунктов (стандартный кегль для большинства текстовых изданий) выпускались шпации шириной 10, 5, 4, 3, 2 и 1 пункт.
Шпации шириной в кегль назывались кегельными или круглыми. Шпации в половину кегельной назывались полукегельными или полукруглыми. Также существует название «тонкая шпация», под которой понимают шпации толщиной 1—2 пункта для шрифта кегля 8—12 пунктов. То есть, для шрифта кегля 10 пунктов тонкая шпация обычно составляет 2 пункта (соответственно, 1⁄5 кегельной). Однако, в связи с отсутствием точного определения тонкой шпации, в руководствах издателя, редактора и верстальщика обычно говорят не об отбивке на тонкую шпацию, а об отбивке на столько-то пунктов (считая, что кегль шрифта равен 10 пунктам).
Таким образом, нужно понимать, что в зависимости от кегля шрифта доля круглой шпации (треть, четверть и т. п.) может иметь разную ширину в пунктах, и наоборот.
Традиционная ширина межсловного пробела
Итак, разобравшись с тем, что такое круглая и полукруглая шпации, перейдём к принятой в российском наборе ширине собственно межсловного пробела.
Шульмейстер пишет (стр. 94), что при наборе строки между словами ставится полукруглая. Когда строка набрана до конца, в большинстве случаев её ширина оказывается либо меньше, либо больше ширины полосы набора. Поэтому верстальщику приходится изменять ширину пробелов, уменьшая её минимум до 1⁄4 круглой и увеличивая максимум до 3⁄4 круглой (соответственно, при наборе кеглем 10 пунктов межсловные пробелы могут варьироваться от 3 до 7 пунктов). Естественно, бывают нюансы, зависящие от формата издания, но мы их касаться не будем.
Однако, Шульмейстер оговаривается, что сам по себе межсловный пробел в полукруглую великоват, и использование стандартного пробела в 1⁄3 круглой является как более экономичным с точки зрения расхода бумаги, так зачастую и более красивым. Также использование межсловного пробела в полукруглую не рекомендуется для узких шрифтов.
С появлением строкоотливных машин пробелы стали делаться равномерными по ширине в пределах одной строки, а ширина межсловного пробела стала варьироваться около 1⁄3 круглой.
Компьютерный набор и веб-типографика
В настоящее время мы ограничены возможностями используемых шрифтов, и, естественно, набором символов в Unicode. Нужно помнить, что далеко не все шрифты содержат большинство пробельных Unicode-символов.
При переходе к компьютерным системам вёрстки был совершён переход от указания ширины шпаций в пунктах к указанию ширины шпаций в долях круглой, так как шрифты стали легко масштабироваться до любого кегля, а пробельные элементы должны были оставаться пропорциональными кеглю шрифта.
Символы пробела в Unicode
Использование различных пробелов
Поскольку ширина межсловного пробела фиксирована в шрифте и изменяется автоматически при выключке по ширине, использование других пробельных символов в качестве межсловных оправдано только при наборе печатных изданий, и только при наличии глубокого понимания, для чего это делается.
В обычной вёрстке для веба для разделения слов достаточно пользоваться обычными и неразрывными межсловными пробелами.
Вместе тем, по правилам русскоязычной типографики в ряде мест должна использоваться тонкая шпация (точнее, в справочниках написано о двухпунктовой шпации, но мы будем употреблять термин «тонкая шпация» как наиболее соответствующий и с точки зрения устоявшейся терминологии, и с точки зрения внешнего вида строки при наборе).
Основные правила использования пробелов будут описаны ниже, но в целом мы рекомендуем следующий принцип для использования при вёрстке для веба.
Использование только тонкой шпации из всего разнообразия пробельных элементов позволяет, во-первых, сохранить гармоничный вид набранного текста, а во-вторых, не перегружать автора публикации разнообразными правилами употребления шпаций различной дробной ширины.
Обработка пробелов браузерами и поисковиками
При подготовке материала статьи мы провели своеобразный эксперимент на специально подготовленной странице. Яндекс и Google справляются с нестандартными символами хорошо, заменяя при поиске все нестандартные пробельные элементы на обычные (мы считаем, что это — правильное поведение). То есть, они не делают разницы между текстами «два слова», «два слова», «два слова» и т. п.
Основные правила употребления пробелов
Итак, ещё раз подчеркнём, что во всех правилах, перечисленных ниже, тонкая шпация используется только в том случае, когда автор отметает риск использования посетителем сайта браузеров, неверно отображающих тонкую шпацию. К ним относятся некоторые браузеры в *nix (возможно, это связано со встроенными шрифтами), MSIE версии 6.0 и раньше, браузеры для Mac (ими можно пренебречь, так как ошибка рендеринга заключается только в ширине шпации), возможно — некоторые браузеры для мобильных телефонов и КПК.
В том случае, если использование таких браузеров вероятно, мы рекомендуем использовать вместо тонкой шпации обычный или неразрывный межсловный пробелы.
Далее мы опишем те правила расстановки пробелов, которые чаще всего, по нашим наблюдениям, нарушаются при вёрстке текстов. Более подробную информацию о правилах набора текстов можно почерпнуть, например, в «Справочнике издателя и автора» А. Э. Мильчина и Л. К. Чельцовой.
Сокращения и символы
Числа и интервалы
Знаки препинания
Неразрывный пробел код символа ascii
Эта заметка послужила поводом для небольшой реконструкции всей Кухни Сидорова.
Теперь во всех ее уголках железобетонные кавычки в виде «дюймов» заменены на изящный пластик в виде лапок.
— Как хорошо на «Кухне», раньше говорил Мячиков.
На Кухне стало просто замечательно! восклицает теперь Петр.
Что произошло
Можно сказать, что терпение дизайнеров лопнуло! Хотя нормальный вывод тире, лапок и других специальных (но таких необходимых) типографских знаков и сейчас возможен не на всех платформах, унижение дизайнеров достигло черты, у которой Артемий Лебедев в конце 2000 года выпустил специальный 62 параграф своего ру/ководства (www.design.ru/kovodstvo) под названием Экранная типографика.
Данный параграф ру/ководства берет на себя смелость служить основным настольным (надесктопным) справочником по экранной типографике. К сожалению, уровень отечественных теоретических и практических исследований в области восприятия информации с экрана не превышает нулевой отметки. Поэтому приходится не только проводить подобные исследования, но и составлять стандарты.
Нижеприведенные правила учитывают специфику экранного чтения, русских типографских традиций, а также совместимости с разными платформами и кодировками. В данном параграфе рассматриваются особенности верстки только в применении к HTML (типографика и специфика набора для экрана, скажем, банкомата тоже интересная тема, но слишком мало кому нужная).
С недавних пор в Студии Лебедева все тексты в HTML должны обязательно верстаться в обогащенном варианте. Ни один текст не должен появиться на публике в сыром виде.
Вся Кухня Сидорова, включая кота Скриптовича, тоже проголосовала за!
Краткий справочник
Ниже приводится краткий справочник специальных символов.
название | знак | мнемоника | код |
амперсант | & | & NN1,2,3,4,6 | IE3,4,5 | & NN1,2,3,4,6 | IE3,4,5 |
знак меньше | NN1,2,3,4,6 | IE3,4,5 | NN1,2,3,4,6 | IE3,4,5 | |
знак больше | > | > NN1,2,3,4,6 | IE3,4,5 | > NN1,2,3,4,6 | IE3,4,5 |
неразрывный пробел | NN1,2,3,4,6 | IE3,4,5 | NN1,2,3,4,6 | IE3,4,5 | |
параграф | § | § NN3,4,6 | IE3,4,5 | § NN1,2,3,4,6 | IE3,4,5 |
copyright | © | © NN1,2,3,4,6 | IE3,4,5 | © NN1,2,3,4,6 | IE3,4,5 |
registered | ® | ® NN1,2,3,4,6 | IE3,4,5 | ® NN1,2,3,4,6 | IE3,4,5 |
знак градуса | ° | ° NN3,4,6 | IE3,4,5 | ° NN1,2,3,4,6 | IE3,4,5 |
левая елочка | « | « NN3,4,6 | IE3,4,5 | « NN1,2,3,4,6 | IE3,4,5 |
правая елочка | » | » NN3,4,6 | IE3,4,5 | » NN1,2,3,4,6 | IE3,4,5 |
нижняя лапка | | NN2,3,4,6 | IE3,4,5 | |
многоточие | NN2,3,4,6 | IE3,4,5 | ||
один. откр. кавычка | | NN1,2,3,4,6 | IE3,4,5 | |
один. закр. кавычка | | NN1,2,3,4,6 | IE3,4,5 | |
левая лапка | | NN2,3,4,6 | IE3,4,5 | |
правая лапка | | NN2,3,4,6 | IE3,4,5 | |
жирная точка | | NN2,3,4,6 | IE3,4,5 | |
средняя точка | · | · NN3,4,6 | IE3,4,5 | · NN1,2,3,4,6 | IE3,4,5 |
среднее тире | | NN2,3,4,6 | IE3,4,5 | |
длинное тире | | NN2,3,4,6 | IE3,4,5 | |
trademark | | ™ IE3,4,5 | NN2,3,4,6 | IE3,4,5 |
плюс-минус | ± | ± NN3,4,6 | IE3,4,5 | ± NN1,2,3,4,6 | IE3,4,5 |
номер | № | № NN4,6 | IE3,4,5 |
Следует отметить, что если для специального знака в кодовой таблице есть мнемоническое обозначение, которое поддерживается браузерами, то оно предпочтительнее цифрового кода. Ведь цифровой код определяет конкретное место символа в таблице и может быть разным в разных кодировках.
Больше, меньше, амперсант
Знаки служат для обрамления тегов, поэтому для показа на экране их приходится кодировать.
Текст предыдущего абзаца записан в так:
Но чтобы показать эти коды пришлось закодировать амперсант:
Неразрывный пробел
Пробел &nbsp; потому и называется неразрывным, что браузеру запрещается использовать его место для разрыва строки при автоматическом форматировании текста.
вид | код |
№ 13 | № 13 |
§ 1 | § 1 |
вид | код |
a) Первый пункт | a) Первый пункт |
1. Первый пункт | 1. Первый пункт |
вид | код |
220 в | 220&nbsp;в |
1024 байт | 1024&nbsp;байт |
вид | код |
XXI век | XXI век |
2001 г. | 2001 г. |
вид | код |
Пиксел это точка на экране. | Пиксел это точка на экране. |
вид | код |
32 541 | 32 541 |
4 937 543 246 | 4 937 543 246 |
вид | код |
Windows 2000 | Windows 2000 |
Photoshop 5.5 | Photoshop 5.5 |
вид | код |
Иван пошел в лес | Иван пошел в&nbsp;лес |
Там за горизонтом | Там за горизонтом |
Неразрывный блок NOBR
вид | код |
NOBR >9-87-74 NOBR > | |
NOBR >во-первых NOBR > |
Кавычки
Дмитрий Кирсанов в свой книге Веб-дизайн пишет:
Всего существует четыре типа кавычек: «французские» (иначе называемые «елочки»), немецкие (лапки), английские обычные, или двойные, и английские одинарные. В русском языке традиционно применяются французские «елочки», а для «кавычек внутри кавычек» немецкие лапки.
Артемий Лебедев считает, что одноуровневые (верхние) лапки стали de facto стандартом за последние 10 лет (из частной переписки).
На Кухне внимательно посмотрели на немецкие и английские лапки и решили, что английские более красивые.
Во всяком случае, знаком «дюйма» для кавычек мы больше пользоваться не будем.
Тире и дефис
Тире в середине предложения окружается: слева неразрывным, а справа обычным пробелом.
Код предыдущего абзаца записывается так:
Кодовые таблицы (справка)
ASCII
Эта кодировка ( A merican S tandart C ode for I nformation I nterchange) восьмибитная (однобайтовая), но охватывает только 128 символов. Она включает латинский алфавит, цифры и основные знаки пунктуации. Все остальные стандартные кодировки совместимы с ней, то есть, размещают на первых 128 местах те же символы и в том же порядке. Вот почему люди часто говорят ASCII, хотя реально используют совсем другие кодировки.
Первый стандарт кодирования русских букв ( К од О бмена И нформации 8 битный). Кодировка применялась еще в годах на ЕС ЭВМ. Сейчас это стандарт для русскоязычной электронной почты. Понятно, что символы ASCII в ней остались на своих местах (как и в других кодировках).
CP1251
Кодировка Windows (Code Page 1251). Содержит русские буквы.
CP866
Latin-1
ISO-8859-1 латиница с дополнительными символами
ISO-8859-5 кириллица
ISO-8859-6 арабский алфавит
ISO-8859-7 греческий алфавит
ISO-8859-8 иврит
В эту кодировку входят символы немецкого, французского, испанского и других алфавитов. Но русских букв в ней, конечно, нет!
Unicode
Стало понятно, что для кодов всех на свете символов одного байта никак не хватит! Так была придумана двухбайтовая кодировка Unicode. Эту кодировку обязаны понимать браузеры, начиная с версий.
В этой кодовой таблице (65 636 знакомест) есть все: китайский, корейский, японский и даже русский! Все живые, мертвые языки и 30% пока еще свободного места.
Unicode совместим с ASCII. Это означает, что первые 128 мест заняты под те же самые символы.