Введение в информатику       Принципы работы ПК       Информатика и ПК в быту       Об авторах             

2.27. Что такое сеть Интернет и как она работает?

Интернет (англ. Internet - между сетей) - гигантская всемирная компьютерная сеть, объединяющая десятки тысяч сетей всего мира. Её назначение - обеспечить любому желающему постоянный доступ к любой информации. Интернет предлагает практически неограниченные информационные ресурсы, полезные сведения, учёбу, развлечения, возможность общения с компетентными людьми, услуги удалённого доступа, передачи файлов, электронной почты и многое другое. Интернет обеспечивает принципиально новый способ общения людей, не имеющий аналогов в мире.

Благодаря сети стал доступен (бесплатно или за умеренную плату) огромный объём информации. Так, пользователь в любой стране может связаться с людьми, разделяющими его интересы, или получить ценные сведения в электронных библиотеках, даже если они находятся на другом конце света.

Нужная информация окажется в его компьютере за считанные секунды, пройдя путь по длинной цепочке промежуточных компьютеров, по кабелям и по радио, через горы и моря, по дну океана и через спутник.

Интернет финансируется правительствами, научными и образовательными учреждениями, коммерческими структурами и миллионами частных лиц во всех частях света, но никто конкретно не является её владельцем. Управляет сетью 'Совет по архитектуре Интернет', формируемый из приглашённых добровольцев.

Сеть была создана в 1984 году, и сейчас ею пользуются примерно сорок миллионов человек. Интернет всё время изменяется, поскольку имеет много квалифицированных пользователей, которые пишут программы для себя, а затем распространяют их среди желающих. Постоянно появляются новые серверы, а существующие обновляют свой 'репертуар'. Стремительно растут информационные потоки.

Как можно связаться с Интернет? Самый распространенный и недорогой способ - посредством модема и телефонной линии. При этом используются три типа подключения, отличающиеся друг от друга по объёму услуг и цене:

  1. почтовое - позволяет только обмениваться электронной почтой с любым пользователем Интернет, самое дешёвое;

  2. сеансное в режиме on-line ('на прямом проводе') - работа в диалоговом режиме - все возможности сети на время сеанса;

  3. прямое (личное), самое дорогостоящее - все возможности в любое время.

При работе в сеансном режиме доступ к Интернет обычно покупается у провайдеров (англ. provide - предоставлять, обеспечивать) - фирм, предоставляющих доступ к некоторой части Интернет и поставляющих её пользователям разнообразные услуги.

Как связываются между собой сети в Интернет?

Отдельные участки Интернет представляют собой сети различной архитектуры, которые связываются между собой с помощью маршрутизаторов. Передаваемые данные разбиваются на небольшие порции, называемые пакетами. Каждый пакет перемещается по сети независимо от других пакетов.

Сети в Интернет неограниченно коммутируются (т.е. связываются) друг с другом, потому что все компьютеры, участвующие в передаче данных, используют единый протокол коммуникации TCP/IP (читается 'ти-си-пи/ай-пи').

На самом деле протокол TCP/IP - это два разных протокола, определяющих различные аспекты передачи данных в сети:

  • протокол TCP (Transmission Control Protocol) - протокол управления передачей данных, использующий автоматическую повторную передачу пакетов, содержащих ошибки; этот протокол отвечает за разбиение передаваемой информации на пакеты и правильное восстановление информации из пакетов получателя;

  • протокол IP (Internet Protocol) - протокол межсетевого взаимодействия, отвечающий за адресацию и позволяющий пакету на пути к конечному пункту назначения проходить по нескольким сетям.

Схема передачи информации по протоколу TCP/IP такова: протокол ТСР разбивает информацию на пакеты и нумерует все пакеты; далее с помощью протокола IP все пакеты передаются получателю, где с помощью протокола ТСР проверяется, все ли пакеты получены; после получения всех пакетов протокол ТСР располагает их в нужном порядке и собирает в единое целое.

Каким образом пакет находит своего получателя?

Каждый компьютер, подключенный к сети Интернет имеет два равноценных уникальных адреса: цифровой IP-адрес и символический доменный адрес. Присваивание адресов происходит по следующей схеме: международная организация Сетевой информационный центр выдает группы адресов владельцам локальных сетей, а последние распределяют конкретные адреса по своему усмотрению.

IP-адрес компьютера имеет длину 4 байта. Обычно первый и второй байты определяют адрес сети, третий байт определяет адрес подсети, а четвертый - адрес компьютера в подсети. Для удобства IP-адрес записывают в виде четырех чисел со значениями от 0 до 255, разделенных точками, например: 145.37.5.150. Адрес сети - 145.37; адрес подсети - 5; адрес компьютера в подсети - 150.

Доменный адрес (англ. domain - область), в отличие от цифрового, является символическим и легче запоминается человеком. Пример доменного адреса: barsuk.les.nora.ru. Здесь домен barsuk - имя реального компьютера, обладающего IP-адресом, домен les - имя группы, присвоившей имя этому компьютеру, домен nora - имя более крупной группы, присвоившей имя домену les, и т.д. В процессе передачи данных доменный адрес преобразуются в IP-адрес. Механизм такого преобразования подробно описан в.

Основные сервисы системы Интернет.

World Wide Web (WWW, 'Всемирная паутина') - основной инструмент Интернет, её главный информационный сервис.

World Wide Web (WWW, 'Всемирная паутина') - гипертекстовая, а точнее, гипермедийная информационная система поиска ресурсов Интернет и доступа к ним.

Гипертекст - информационная структура, позволяющая устанавливать смысловые связи между элементами текста на экране компьютера таким образом, чтобы можно было легко осуществлять переходы от одного элемента к другому. На практике в гипертексте некоторые слова выделяют путем подчёркивания или окрашивания в другой цвет. Выделение слова говорит о наличии связи этого слова с некоторым документом, в котором тема, связанная с выделенным словом, рассматривается более подробно.

Гипермедиа - это то, что получится, если в определении гипертекста заменить слово 'текст' на 'любые виды информации': звук, графику, видео. Такие гипермедийные ссылки возможны, поскольку наряду с текстовой информацией можно связывать и любую другую двоичную информацию, например, закодированный звук или графику, Так, если программа отображает карту мира и если пользователь выбирает на этой карте с помощью мыши какой-либо континент, программа может тут же дать о нём графическую, звуковую и текстовую информацию.

Система WWW построена на специальном протоколе передачи данных, который называется протоколом передачи гипертекста HTTP (читается 'эйч-ти-ти-пи', HyperText Transfer Protocol).

Всё содержимое системы WWW состоит из WWW-страниц, называемых сайтами (англ. site - участок).

WWW-cтраницы (cайты) - гипермедийные документы системы World Wide Web. Создаются с помощью языка разметки гипертекста HTML (Hypertext markup language).

Язык HTML позволяет добавлять к текстовым документам специальные командные фрагменты - тэги (англ. tag - "этикетка, ярлык") таким образом, что становится возможным связывать с этими документами другие тексты, графику, звук и видео, задавать заголовки различных уровней, разделять текст на абзацы, строить таблицы и т.д. Например, заголовок документа может иметь такой вид: <TITLE> Клуб любителей персиков </TITLE>

Одну WWW-страницу на самом деле обычно составляет набор гипермедийных документов, расположенных на одном сервере, переплетённых взаимными ссылками и связанных по смыслу (например, содержащих информацию об одном учебном заведении или об одном музее). Каждый документ страницы, в свою очередь, может содержать несколько экранных страниц текста и иллюстраций. Каждая WWW-страница имеет свой 'титульный лист' (англ. 'homepage') - гипермедийный документ, содержащий ссылки на главные составные части страницы. Адреса 'титульных листов' распространяются в Интернет в качестве адресов страниц.

Личные страницы - такие WWW-страницы, которые принадлежат не фирмам и не организациям, а отдельным людям. Содержание и оформление такой страницы зависит только от её автора.

При работе с системой WWW пользователи имеют дело с программами-клиентами системы, называемыми браузерами.

Браузеры (англ. browse - листать, просматривать) - программы, с помощью которых пользователь организует диалог с системой WWW: просматривает WWW страницы, взаимодействует с WWW-cерверами и другими ресурсами в Интернет.

Существуют сотни программ-браузеров. Самые популярные браузеры: Netscape Navigator и Microsoft Explorer.

Браузеры WWW умеют взаимодействовать с любыми типами серверов, используя при этом их собственные протоколы. Информацию, полученную от любого сервера, браузер WWW выводит на экран в стандартной, удобной для восприятия форме. При этом переключения с одного протокола на другой для пользователя часто остаются незамеченными.

Программа удалённого доступа Telnet. Позволяет входить в другую вычислительную систему, работающую в Интернет, с помощью протокола TELNET. Эта программа состоит из двух компонент: программы-клиента, которая выполняется на компьютере-клиенте, и программы-сервера, которая выполняется на компьютере-сервере.

Функции программы-клиента:

  • установление соединения с сервером;

  • приём от абонента входных данных, преобразование их к стандартному формату и отсылка серверу;

  • приём от сервера результатов запроса в стандартном формате и переформатирование их в вид, удобный клиенту.

Функции программы-сервера:

  • ожидание запроса в стандартной форме;

  • обслуживание этого запроса;

  • отсылка результатов программе-клиенту.

Telnet - простое и поэтому универсальное средство связи в Интернет.

Программа пересылки файлов Ftp. Перемещает копии файлов с одного узла Интернет на другой в соответствии с протоколом FTP (File Transfer Protocol - 'протокол передачи файлов'). При этом не имеет значения, где эти узлы расположены и как соединены между собой.

Компьютеры, на которых есть файлы для общего пользования, называются FTP-серверами. В Интернет имеется более 10 Терабайт бесплатных файлов и программ.

Электронная почта (Electronic mail, англ. mail - почта, сокр. E-mail, читается 'и-мэйл'). Служит для передачи текстовых сообщений в пределах Интернет, а также между другими сетями электронной почты. К тексту письма современные почтовые программы позволяют прикреплять звуковые и графические файлы, а также двоичные файлы - программы.

При использовании электронной почты каждому абоненту присваивается уникальный почтовый адрес, формат которого имеет вид: <имя пользователя> @ < имя почтового сервера>. Например: earth@space.com, где earth - имя пользователя, space.com - имя компьютера, @ - разделительный символ 'эт коммерческое'.

Сообщения, поступающие по E-Mail, хранятся в специальном 'почтовом' компьютере в выделенной для получателя области дисковой памяти (его 'почтовом ящике'), откуда он может их выгрузить и прочитать с помощью специальной программы-клиента.

Для отсылки сообщения нужно знать электронный адрес абонента. При качественной связи электронное письмо доходит в любую точку мира в течение нескольких минут.

Пользователи электронной почты стремятся придерживаться правил сетевого этикета (нэтикета), а для выражения эмоций используют схематические изображения человеческого лица, так называемые смайлики (англ. smiley, 'улыбочка'), некоторые из которых приведены ниже.

Смайлики (рассматривайте, склонив голову влево)

:-) улыбка
:-))) хохот
:-~) насморк
:*) пьяница
:-{) усатый
:-[ вампир
-:-) панк

:-Q курит
:-@ кричит
:-( грусть
:'-( плачет
;-) хитрец
>:-( злится
: 0 зевает

:-)~ пускает слюнки
8:-) маленькая девочка
:-* cъел горькое
:'-) плачет от счастья
:-& поклялся молчать
O-) аквалангист
=8-) носит очки

Cистема телеконференций Usenet (от Users Network). Эта система организует коллективные обсуждения по различным направлениям, называемые телеконференциями. В каждой телеконференции проводится ряд дискуссий по конкретным темам.

Сегодня Usenet имеет более десяти тысяч дискуссионных групп (NewsGroups) или телеконференций, каждая из которых посвящена определённой теме и является средством обмена мнениями. Телеконференции разбиты на несколько групп:

  • news - вопросы, касающиеся системы телеконференций;

  • comp - компьютеры и программное обеспечение;

  • rec - развлечения, хобби и искусства;

  • sci - научно-исследовательская деятельность и приложения;

  • soc - социальные вопросы;

  • talk - дебаты по различным спорным вопросам;

  • misc - всё остальное.

Внутри этих категорий существует иерархия. Так, например, rec.music.beatles - это дискуссия о творчестве Битлз, входящая в подгруппу 'музыка' группы дискуссий по искусству.

Существует большой выбор программ чтения телеконференций, которые формируют материал дискуссий в упорядоченном виде и предоставляют в распоряжение корреспондентов.

Аналог телеконференций в других сетях - 'электронная доска объявлений' (Bulletin Board System, BBS).

Системы информационного поиска сети Интернет

В Интернет представлена информация на любые темы, которые только можно себе представить. Но найти в ней нужную информацию не так-то легко из-за того, что сеть по своей природе не имеет чёткой структуры. Поэтому для ориентировки в Интернет и быстрого получения свежей справочной информации разработаны системы поиска информации.

Все системы поиска информации Интернет располагаются на специально выделенных компьютерах с мощными каналами связи. Ежеминутно они бесплатно обслуживают огромное количество клиентов.

Поисковые системы можно разбить на два типа:

  • предметные каталоги, формируемые людьми-редакторами;

  • автоматические индексы, формируемые специальными компьютерными программами, без участия людей.

Системы, основанные на предметных каталогах. Используют базы данных, формируемые специалистами-редакторами, которые отбирают информацию, устанавливают связи для баз данных, организуют и снабжают данные в разных поисковых категориях перекрёстными ссылками. Кампании, владеющие предметными каталогами, непрерывно исследуют, описывают и каталогизируют содержимое WWW-cерверов и других сетевых ресурсов, разбросанных по всему миру. В результате этой работы клиенты Интернет имеют постоянно обновляющиеся иерархические (древовидные) каталоги, на верхнем уровне которых собраны самые общие категории, такие как 'бизнес', 'наука', 'искусство' и т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные WWW-страницы и серверы вместе с кратким описанием их содержимого.

Пример. Если нужно выяснить, какая в мире имеется информация о пище динозавров, достаточно спуститься по иерархии:

Науки ==> Млекопитающие ==> Палеонтология ==> Динозавры ==> Пища.

Yahoo!Каталоги, составленные людьми, более осмыслены, чем автоматические индексы. Их очень мало, так как их создание и поддержка требуют огромных затрат. Для примера рассмотрим самый популярный предметный каталог Yahoo!, который обладает одной из крупнейших баз данных. Имеет информационные базы для детей и подростков. Поддерживает два основных метода работы с каталогом - поиск по ключевым словам и поиск по иерархическому дереву разделов. Не принимает запросов на естественном языке.

Автоматические индексы. Переоценить их трудно. Поиск по ключевым словам в одной базе данных, занимающий в худшем случае несколько секунд, принесёт те же результаты, что и обшаривание всех WWW-страниц во всей сети Интернет.

Автоматический индекс состоит из трёх частей:

  • программы-робота;

  • базы данных, собираемой этим роботом;

  • интерфейса для поиска в этой базе, с которым и работает пользователь.

Все эти компоненты функционируют без вмешательства человека.

К автоматическим индексам следует прибегать только тогда, когда ключевые слова точно известны, например, фамилия человека или несколько специфических терминов из соответствующей области. Индексы получают информацию из каждого отдельного узла, регистрируют и индексируют её и добавляют к своим базам данных.

Среди известных индексов выделяется: AltaVista - одна из самых мощных полностью автоматических поисковых систем. Обладает полнотекстовой базой данных. Выдаёт наибольшее количество ссылок. Проиндексировано 30 млн. страниц с 300 тысяч серверов и 4 млн. статей из телеконференций Usenet. За один день AltaVista обслуживает около 20 млн. запросов.

В Интернет один и тот же узел сети может одновременно работать по нескольким протоколам. Поэтому крупные узлы сети сейчас обладают полным набором серверов, и к ним можно обращаться почти по любому из существующих протоколов.

<<назад     вперед>>