HTML Наборы символов
Для правильного отображения HTML-страницы браузер должен знать, какой набор символов (кодировку) использовать:
Пример
<meta charset="UTF-8">
HTML Наборы символов
Для HTML5 кодировка символов по умолчанию - UTF-8.
Но так было не всегда. Кодировка символов для раннего веба была ASCII.
Позже, с HTML 2.0 до HTML 4.01, ISO-8859-1 считался стандартом.
С XML и HTML5 наконец-то появился UTF-8 и решил множество проблем кодировки символов.
В начале: ASCII
Компьютерные данные хранятся в виде двоичных кодов (01000101) в электронике.
Для стандартизации хранения текста был создан Американский стандартный код для обмена информацией (ASCII). Он определил уникальное двоичное число для каждого сохраняемого символа для поддержки чисел от 0 до 9, прописных и строчных букв (a-z, A-Z) и специальных символов, таких как ! $ + - ( ) @ < > , .
Поскольку ASCII использовал 7 бит для символа, он мог представлять только 128 различных символов.
Самым большим недостатком ASCII было то, что он исключал неанглийские буквы.
ASCII все ещё используется сегодня, особенно в крупных компьютерных системах.
Для более детального ознакомления, пожалуйста, изучите наш Полный справочник ASCII.
В Windows: Windows-1252
Windows-1252 был набором символов по умолчанию в Windows, вплоть до Windows 95.
Это расширение ASCII с добавлением международных символов.
Он использует полный байт (8 бит) для представления 256 различных символов.
Поскольку Windows-1252 по умолчанию используется в Windows, она поддерживается всеми браузерами.
Для более детального изучения, пожалуйста, изучите: Полный справочник Windows-1252.
В HTML 4: ISO-8859-1
Набор символов по умолчанию в HTML 4 - это ISO-8859-1.
ISO-8859-1 является расширением ASCII с добавлением международных символов.
Пример
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
В HTML 4 набор символов, отличный от ISO-8859-1, может быть указан в теге <meta>:
Пример
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
Все процессоры HTML 4 также поддерживают UTF-8:
Пример
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
Когда браузер обнаруживает ISO-8859-1, обычно по умолчанию используется Windows-1252, поскольку в Windows-1252 есть еще 32 международных символа.
Для более детального изучения, пожалуйста, изучите: Полный справочник ISO-8859-1
В HTML5: Unicode UTF-8
Набор символов по умолчанию для HTML5 - это UTF-8.
Пример
<meta charset="UTF-8">
Набор символов, отличный от UTF-8, может быть указан в теге <meta>:
Пример
<meta charset="ISO-8859-1">
Консорциум Unicode разработал стандарты UTF-8 и UTF-16, поскольку наборы символов ISO-8859 ограничены и несовместимы с многоязычной средой.
Стандарт Unicode охватывает (почти) все символы, знаки препинания и символы в мире.
Все процессоры HTML5 и XML поддерживают UTF-8, UTF-16, Windows-1252 и ISO-8859.
Для более детального изучения, пожалуйста, изучите: Полный справочник Unicode на нашем сайте W3Schools на русском.