Кодировки – сложности распознания

Чтобы хоть как-то навести порядок в обилии кодировок, международная организация по стандартам ISO решила разработать единый стандарт. Однако и тут руководители проекта решили блеснуть своей оригинальностью, создав новую кодировку ISO-8859-5, вместо того чтобы взять за основу какую-либо из уже присутствующих. В результате получилось так, что данная кодировка не получила особого распространения и была не в состоянии распознать множества документов. По сей день данный стандарт не пользуется спросом среди разработчиков, несмотря на то, что ее поддерживает большинство современных браузеров.

Словом, как это всегда происходит – люди сами себе создали массу проблем, решение которых требует установки специальной системы на сервере, отсылающей сообщение с информацией о том, в какой именно кодировке будет получена страница. Браузер по факту получения этих сведений должен самостоятельно подстраиваться на требуемый стандарт. Однако и в этом случае не обошлось без сложностей. Неправильная настройка сервера может привести к такой ситуации, когда по факту приема сообщения, информирующего его о том, что документ представлен в кодировке win-1251, он будет передавать ее в браузер в стандарте KOI-8. Разумеется, следуя этому сигналу, интернет-обозреватель будет пытаться открыть страничку в KOI-8, отображая на мониторе пользователя абракадабру.

Чтобы как-то решить эту проблему, разработчики указывают кодировку не на самом сервере, а, непосредственно, в HTML-коде документа. Для этого существует специальный метатег, определяющий необходимый язык: .

Однако и в такой ситуации не все так просто, как того хотелось бы. В русскоязычном сегменте интернета популярен метод, включающий автоматическое определение веб-сервером кодировки документа – сервер отдает уже перекодированную страницу пользователю. В такой ситуации упомянутый выше метатег может наломать дров. Причина проста – приоритет указаний в документе перед командами сервера. Иными словами, сервер не может поменять содержимое тега, вследствие чего возникает парадокс между кодировками – несовпадение реального стандарта с условиями в метатеге.

В такой ситуации пользователь не сможет увидеть содержимого страницы, даже если попытается самостоятельно перекодировать ее посредством браузера. Выход из ситуации – сохранение странички и последующее удаление лишнего метатега, мешающего нормальному отображению документа. Чтобы не усложнять жизнь, рекомендуется вообще не использовать данный тег. В таком случае распознание документа будет осуществляться в кодировке, на которую изначально был настроен сервер. Чтобы максимально упростить процесс распознания, рекомендуется по умолчанию устанавливать кодировку Win-1251 – тогда 95% пользователей смогут увидеть документ в его корректной форме.

Однако существует еще одна ситуация, которая описана в завершающей части статьи: каскадные таблицы стилей или очередная проблема кодировок.

 
   
 
© 2006 —  Студия «Наутико»
Создание сайтов, поддержка сайтов, реклама
Россия, Санкт-Петербург