WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     || 2 | 3 | 4 | 5 |   ...   | 14 |
В.А.Капустин Основы профессиональной работы с информационными ресурсами Интернета Методическое пособие Санкт-Петербург 2003 © В.А.Капустин, 2003 Содержание ИСТОРИЯ СОЗДАНИЯ И РАЗВИТИЯ ИНФОРМАЦИОННЫХ РЕСУРСОВ ИНТЕРНЕТА 5 Введение 5 Сороковые годы XX-го века 5 Создание первых ЭВМ – электронно-вычислительных машин 5 Закон Ципфа 6 Идея гипертекста 6 50-е годы. Развитие ЭВМ 7 Языки программирования и операционные системы 7 Информационный поиск. Возникновение теории информационно-поисковых систем 7 Обработка текстов 8 Три технологические ветви 10 60-е годы XX-го века 10 Многозадачные и многопользовательские операционные системы 11 Обобщенные языки разметки текста 12 Вычислительная техника и связь 13 ARPAnet – предшественница Интернета 14 Информационные технологии 14 70-е годы – время рождения Интернета 15 "Старые" информационные ресурсы Интернета 15 Базы данных с удаленным доступом 16 Развитие других информационных технологий 17 Структурные языки разметки. 17 История Unix. 17 Разработчики Unix получают премию им. Тьюринга 19 80-е годы. 20 FTP-серверы обретают средства поиска 20 Рождение телеконференций 20 Культурные конфликты в телеконференциях. Flames 21 Проект BSD Unix 22 Unix и Интернет попадают к физикам-ядерщикам 22 Персональные компьютеры 23 Gopher 23 Проект "World Wide Web" – "Всемирная Паутина" 26 1989 год. Язык гипертекстовой разметки HTML 26 1990 г. Lynx и HTML 2 27 1993 г. Mosaic и "Великий взрыв" Всемирной Паутины 28 1994 г. – год торжества Netscape 29 2 1995 г. Microsoft Internet Explorer 31 1995 -1997. Битва за HTML 31 1998 г. Каскадируемые таблицы стилей и HTML 4 32 1999 г. XML, DOM, RDF 32 Другие технологии Интернета 33 Заключение 33 ТЕХНОЛОГИИ ИНТЕРНЕТА 34 Введение 34 Наивный взгляд 34 Организационное строение Интернета 36 Проблема стандартизации 37 Процедура стандартизации в Интернете 38 Понятие о сетевых протоколах. Протоколы физического уровня Протоколы сетевого уровня Обнаружение ошибок передачи Размер кадра. MTU Межсетевой уровень протоколов. Протокол IP. Нумерация сетевых интерфейсов Сетки Время жизни датаграммы Протоколы транспортного уровня Протоколы приложений Коды ответов протоколов уровня приложений Доменная система имен Правила записи доменных имен Имена доменов верхнего уровня Географические домены верхнего уровня Тематические домены верхнего уровня Служба доменных имен (DNS) с точки зрения пользователя Служба доменных имен (DNS) – как она работает Доменное имя: типичные ошибки пользователя Универсальный локатор ресурса (URL) Диагностика Интернета: программа ping Ключи программы ping Время ожидания ответа (-w) Размер информационной части посылаемой датаграммы (-l) Непрерывная работа pi ng (-t) Применение pi ng для увеличения скорости передачи данных Диагностика Интернета: программа traceroute (tracert.exe) В.А.Капустин. Основы профессиональной работы с информационными ресурсами Интернета Ключи программы tracert Диагностика Интернета: обнаружение циклов Кодовые таблицы ВВЕДЕНИЕ В HTML: Понятие о разметке Введение Первые формальные определения Создание HTML-документов Структура HTML-документа Заглавие HTML-документа Текст HTML-документа и его кодировка Абзац Логическая структура документа Простейшая оформительская разметка Выделения Шрифтовое оформление Размер шрифта Цвет шрифта Создание документов со связями Связь – это контейнер Готовимся создавать связи между документами Разметка связей Вторая связь и внешние связи ВВЕДЕНИЕ В ТЕОРИЮ ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМ И ИНФОРМАЦИОННОГО ПОИСКА Введение Информационная потребность. Понятие пертинентного документа Информационный шум Информационно-поисковые системы – ИПС Понятие релевантного документа Web-кольца – предметная ИПС Классификационные ИПС Взаимодействие культур при поиске в классификационной ИПС Ссылка и отсылка Словарные ИПС: введение Логические операторы Правое усечение Слова далекие и близкие В.А.Капустин. Основы профессиональной работы с информационными ресурсами Интернета Ранжирование результатов поиска Стратегия поиска: использование нескольких источников Пример из жизни Еще два элемента стратегии УКАЗАТЕЛЬ РИСУНКОВ ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ В.А.Капустин. Основы профессиональной работы с информационными ресурсами Интернета История создания и развития информационных ресурсов Интернета Введение Появление World Wide Web – "Всемирной Паутины", – кажется революционным, взрывным процессом. До 1993 г. никто не знал о WWW – сейчас Интернет считается основой информационных технологий. И большинство людей считают, что Интернет и Всемирная Паутина – одно и то же.

Но это не так. Интернет намного старше Всемирной Паутины, да и сейчас в нем есть много информационных ресурсов и технологий, отличных от WWW.

На этом занятии вы познакомитесь с тем, развитие каких технологий привело к возникновению Всемирной Паутины, какие еще информационные ресурсы и технологии существуют в Интернете.

Сороковые годы XX-го века Историю технологий вычислительной техники и информационных технологий, нашедших свое отражение в Интернете, можно прослеживать издалека – по крайней мере из XVI века – от изобретения книгопечатания. Мы, однако, не будем забираться так глубоко, а начнем знакомство с этими технологиями с середины нашего века – с сороковых годов.

В середине и второй половине сороковых годов XX-го века произошли три события, которые, в конце концов, положили начало технологиям, лежащим в основе Всемирной Паутины. Это были:

• Создание первых ЭВМ – электронно-вычислительных машин • Открытие закона Ципфа • Была предложена идея гипертекста Рис. 1 Технологические корни Интернета Создание первых ЭВМ – электронно-вычислительных машин В середине сороковых годов появились электронно-вычислительные машины (ЭВМ) в современном понимании этого слова. (См., например, страницы Компьютерного музея [http://www.computer-museum.ru/].) Программируемые неэлектронные вычислительные машины существовали задолго до этого; так, первой программисткой считается Ада Лавлесс, дочь поэта лорда Байрона – она программировала механическую вычислительную В.А.Капустин. Основы профессиональной работы с информационными ресурсами Интернета машину в середине прошлого века. ЭВМ почти одновременно появились в США, СССР и Германии.



Закон Ципфа Ципф – ученый-филолог – исследовал частоты использования букв и звуков в естественных языках. Он установил, что в 80% случаев употребляется лишь 20% букв (например, в русском языке очень часто употребляются буквы "О", "А", "И", а твердый знак используется чрезвычайно редко). Остальные 80% букв используются только в 20% случаев. То же самое относится и к звукам. Оба правила действуют (с небольшими отклонениями) во всех языках.

Современная формулировка закона Ципфа относит "правило 80/20" к любым парам "информационная потребность" – "источник информации":

Для удовлетворения 80% любых информационных потребностей достаточно 20% наличных источников информации.

К закону Ципфа мы не раз будем обращаться при изучении ИПС – информационно-поисковых систем. Он позволяет построить эффективные словарные ИПС, а его следствие – закон Бредфорда – позволяет найти редкую и рассеянную информацию.

Идея гипертекста Сейчас с гипертекстом встречается каждый, кто работает с компьютером (с Windows или Unix) – достаточно нажать клавишу , и вы видите на экране окно помощи, а в нем – зеленые (или другого цвета) строчки. Когда курсор мыши попадает на эти строчки, форма курсора меняется, а при щелчке левой кнопкой мыши происходит переход к другому разделу помощи.

Но в 1947 г., конечно, ни о Windows, ни даже о компьютерах речь не шла. Ванневар Буш ( [http://www.computer-museum.ru/Gallary_vic/4.htm]) анализировал возможности улучшения восприятия обычного текста. Он отметил, что тексты содержат как внутренние ссылки (например, "см. раздел такой-то главы такой-то"), так и внешние (прикнижную или пристатейную библиографию (например, "как показано в работе [1]"). Буш предложил расширить аппарат внутренних ссылок (например, раскрасив их в различные цвета, соответствующие смыслу ссылки: "читай вдоль красных ссылок – получишь учебник, вдоль синих – справочник" и т.п.). Для облегчения работы с такого рода печатными материалами Буш предполагал использовать микрофильмы (фотокопии печатных изданий) и специальное оборудование, которое он назвал "memex".

Но идея ссылочной структуры, отражающей всевозможные ассоциативные связи в текстах, Бушем была сформулирована четко, и Буш даже использовал термин Web (Паутина).

В.А.Капустин. Основы профессиональной работы с информационными ресурсами Интернета 50-е годы. Развитие ЭВМ Языки программирования и операционные системы Производительность ЭВМ растет. К компьютерам приходят не только инженеры, их создавшие, но и те, для кого эти устройства создавались – математики, решающие прикладные задачи (в первую очередь – для ядерных вооружений и ракетной техники).

Но математики думают о математике – о методах решения уравнений – а не о том, как устроена ЭВМ. Возникает потребность в создании средств, "изолирующих" математикавычислителя от архитектуры ЭВМ. И такие средства – языки программирования – появляются в середине 50-х годов.

Первым (в 1954 г.) из известных до настоящего времени появился язык FORTRAN, предназначенный именно для математических расчетов. В 1956 г. появился COBOL, используемый до настоящего времени в экономических про. (Именно с КОБОЛом связана, в основном, проблема 2000-го года – в незапамятные пятидесятые годы компьютеры имели всего по нескольку сотен "ячеек" памяти, и для значения года программы на КОБОЛе в то время использовали 2 цифры ;-) В самом конце пятидесятых годов был создан язык ALGOL-60, ставший родоначальником целого дерева современных языков программирования: Pascal, Modul a, C, Perl, ADA.

Языки программирования избавляли математиков от необходимости изучать системы команд конкретных ЭВМ, но не избавляли от необходимости знать особенности разнообразных устройств ввода-вывода и хранения информации. Потребность в том, чтобы снять с математиков и это бремя, приводит в самом конце 50-х годов к созданию сложных программных комплексов, получивших название операционные системы.

Операционная система – это первая программа, запускающаяся после включения компьютера.

Задачи операционной системы (ОС) – изолировать пользователя от особенностей устройств ввода-вывода и управления оперативной памятью.

Современные операционные системы, с которыми знакомо большинство обычных пользователей – MS-DOS, Wi ndows95/98, различные варианты Uni x, OS/2 – решают именно эти задачи (и одновременно многие другие) – вы никогда не задумываетесь над вопросом: "В каком секторе какой дорожки какого цилиндра начинается мой документ Word, и в какой момент времени диск повернется нужным сектором так, чтобы успеть подвинуть считывающую головку для того, чтобы я начал(а) работать с этим документом". Все подобные вопросы за нас сейчас решает операционная система.

Информационный поиск. Возникновение теории информационнопоисковых систем В 50-е годы компьютеры стали настолько мощными, что стали применяться не только для решения расчетных задач, но стали проникать и в другие области человеческой деятельности. Так, возникла идея, что можно занести каталог любой библиотеки на машинный носитель – и пусть машина ищет! Например, ищет по словам в аннотациях книг.





В.А.Капустин. Основы профессиональной работы с информационными ресурсами Интернета Не тут-то было. Оказалось, что многие задачи поиска решаются только за чрезвычайно большое время. Приведу цитату из одной статьи: "Магнитная лента физически истирается до завершения решения задачи" (на самом деле эта статья была написана в начале 70-х годов – в 50-х годах магнитные ленты в ЭВМ практически не использовались).

Поэтому начинает развиваться теория информационно-поисковых систем ИПС), анализирующая способы построения таких систем и, что для нас важнее, как осуществлять поиск с помощью этих ИПС – какие поисковые задачи осуществимы и могут быть выполнены быстро, а какие требуют для своего осуществления астрономических времен. Развитие этой теории не закончено до сих пор, однако первые практически важные результаты были получены в 60-е и 70-е годы, что позволило уже в те годы перейти к построению реальных ИПС.

К элементам этой теории мы еще вернемся.

Обработка текстов В пятидесятые годы появились первые прототипы фотонаборных автоматов, управляемых с помощью команд, нанесенных на перфокарты и перфоленты.

Рис. 2 Принцип работы фотонаборного автомата В.А.Капустин. Основы профессиональной работы с информационными ресурсами Интернета С помощью таких устройств появилась возможность заменить труд наборщиков, работавших со свинцовыми шрифтами.

Одна из основных задач наборщика состояла в так называемой "полной выключке" набираемого текста:

Машинистка переводит каретку А этот текст сверстан машинки в конце слова; наборщиком получается "рваное" правое поле - оба поля ровные Одна из основных задач наборщика Одна из основных задач наборщика соссостояла в так называемой "полной тояла в так называемой полной выключке" выключке" набираемого текста. набираемого текста.

Следующий абзац должен был Следующий абзац должен был начиначинаться с "красной" строки. Последняя наться с "красной" строки. Последняя строка абзаца "не разгоняется" пробелами. строка абзаца "не разгоняется" пробелами.

Для выключки текста наборщик берет две линейки и закрепляет их справа и слева от поля набора, затем, примерно набрав строку, подбирает пробельные плашки нужного размера и вбивает их между словами или даже между буквами.

Понятно, что оказалось нетрудно написать компьютерную программу, рассчитывающую размеры пробелов и выдающую соответствующие команды на перфоленту для фотонаборного автомата. Две оказались незадачи:

Абзац должен начинаться с "красной" строки.

Последнюю строку абзаца "разгонять" не нужно.

Для решения этих "незадач" нужно было уметь сообщать ЭВМ о начале абзаца (начало очередного абзаца – это конец и предыдущего). Но эту-то задачу вот уже несколько сотен лет решают корректоры и технические редакторы – если наборщик не заметил начала абзаца в машинописном тексте и набрал этот текст в одном абзаце, то корректор, проверяя набор, помечает ошибку специальным знаком (одним и тем же во всех издательствах и типографиях мира!), а наборщик, получив гранки с пометками корректора, исправляет набор:

Исходный текст Текст набран с ошибкой:

корректор сделал пометку Одна из основных задач наборщика Одна из основных задач наборщика состояла в так называемой состояла в так называемой "полной выклю"полной выключке" набираемого чке" набираемого текста. Следующий абтекста.

зац должен был начинаться с "красной" Следующий абзац должен был строки. Последняя строка абзаца "не разначинаться с "красной" строки. Последняя гоняется" пробелами.

строка абзаца "не разгоняется" пробелами.

Этот знак (вместе с другими аналогичными знаками, обозначавшими, например, пропущенные или переставленные буквы) назывался [корректорской] разметкой текста.

На устройствах подготовки данных ЭВМ тогда не было знака и других знаков корректорской разметки (да и сейчас нет). Поэтому нужно было придумать способ сообщить компьютеру о том, что начался новый абзац. И такой способ был придуман. Ни один абзац (и ни одна строка) не начинается с единственной точки В.А.Капустин. Основы профессиональной работы с информационными ресурсами Интернета … может быть, разве что с многоточия… Поэтому договорились считать, что строки, начинающиеся с единственной точки, будут считаться знаками (на компьютерном языке – директивами) разметки. Для абзаца использовали директиву.PAR от английского слова Paragraph – Абзац.

Сразу же возникла идея использовать такие строки для передачи дополнительной информации о разметке. Например, о размере абзацного отступа:

.PAR -.означает "висячий" выступ на полдюйма:

"Висячий" выступ, а отличие от втяжки, выступает за левое поле абзаца.

Все последующие строки выравниваются по левому полю.

Такая дополнительная информация получила название "атрибуты".

Научившись размечать абзацы, программисты научились и автоматически разбивать текст на страницы. Затем возникла задача сбора оглавления. Потом взялись за подстрочные примечания (мелким шрифтом в нижней части страницы). Это уже оказалось непросто – такие примечания бывают очень большими (например, в литературоведении встречаются примечания, размер которых превышает страницу!). А если таких примечаний на странице несколько По типографским правилам, все примечания на странице не могут занимать более ее половины, и существуют сложные процедуры переноса частей примечаний на следующие страницы.

Pages:     || 2 | 3 | 4 | 5 |   ...   | 14 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.