Информатика: конспект лекций.

6.6. Проблемы работы в Интернет с кириллическими текстами.

Для кириллических текстов в системах DОS и Windоws применялись различные системы кодировки. В DОS использовались коды АSСII, которые соответствовали кодовой странице 866, а в системе Windоws – кодировка, отвечающая кодовой странице 1251. Поэтому тексты, подготовленные в текстовом редакторе, работающем под управлением DОS, напрямую в Windоws не могли быть прочитаны и требовали перекодировки. Тексты, которые были подготовлены редакторами Windоws, выглядели абракадаброй, если их пытались прочитать в кодировке DОS. Для устранения этой проблемы были созданы перекодировщики, которые встраивались в некоторые редакторы текстов и обеспечивали перекодировку из DОS в Windоws и обратно.

В случае работы с Интернет проблема усугубилась. Это объяснялось тем, что символы кириллицы кодировались третьим способом, с применением кодовой таблицы КОI8. Ее традиционно использовали в компьютерах, которые работали под управлением операционной системы UNIХ. Изначально серверы Интернет были построены исключительно на основе UNIХ, вследствие чего русскоязычные тексты кодировались только с помощью КОI8. Этим объяснялось то, что в Интернет русскоязычный текст представлял собой абракадабру при воспроизведении в кодировке, отличной от той, в которой он был первоначально создан. Эту проблему можно устранить при работе в WWW с помощью размещенных на экране кнопок, позволяющих повторно вывести страницу документа в другой кодировке.

Трудности с кириллическими текстами возникают и при их сохранении. Это может происходить при дальнейшей автономной (вне Интернет) работе с текстами.

Сохраняют WWW-страницы двумя способами:

1) сохранение в том же формате НТМL, в каком он присутствовал в Интернет. В этом случае просматривать и редактировать подобный файл можно, во-первых, теми же программными средствами, которые обеспечивали его просмотр при работе непосредственно в Интернет, а во-вторых, другими специализированными редакторами, ориентированными на работу с форматом НТМL;

2) сохранение документа в форме обычного текстового файла. При этом текстовая информация сохраняется без элементов форматирования. Документ запоминается в кодах АSСIL, если он был создан с помощью кодовых страниц 866 или 1251 (в DОS или Windоws). Подобный документ можно прочитать и отредактировать как в DОS, так и в Windоws, но при его перекодировке в момент загрузки в Wоrd в качестве способа перекодировки необходимо указывать «Только текст», а не «Текст DОS».

Протоколы можно использовать для следующих целей:

1) реализация в глобальной сети указанной системы адресации хостов;

2) организация надежной передачи информации;

3) преобразование и представление в соответствии со способом ее организации.

Основной протокол, используемый при работе в Интернет, – ТСР/IР, совмещающий в себе протоколы передачи (ТСР) и идентификации хостов (IР). На самом деле работа в сети Интернет при доступе к провайдеру с помощью модема по коммутируемой телефонной линии производится посредством одной из двух модификаций протокола ТСР/IР: по протоколу SLIР или РРР (более современный протокол).

Когда пользователь использует только электронную почту, не реализуя все средства Интернет, ему достаточно работать по протоколу UUСР. Это немного дешевле, но возможности пользователя при этом ухудшаются.

Для некоторых информационных служб кроме общесетевых протоколов используются свои протоколы.