WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     || 2 | 3 | 4 | 5 |   ...   | 15 |
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ, МЕХАНИКИ И ОПТИКИ Сборник трудов молодых ученых и сотрудников кафедры ВТ Выпуск 1 Санкт-Петербург 2010 МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ, МЕХАНИКИ И ОПТИКИ Сборник трудов молодых ученых и сотрудников кафедры ВТ Санкт-Петербург 2010 Сборник трудов молодых ученых и сотрудников кафедры ВТ / Под ред. д.т.н., проф. Т.И. Алиева – СПб: СПбГУ ИТМО, 2010. – 90 с.

Сборник содержит избранные труды студентов, аспирантов и сотрудников кафедры ВТ, отобранные по результатам докладов, представленных на XXXVIII научной и учебно-методической конференции СПбГУ ИТМО и на научнопрактической конференции молодых ученых «Вычислительные системы и сети (Майоровские чтения)», состоявшихся в 2009 году. Конференции направлены на ознакомление научной общественности с результатами научных исследований, выполненных студентами, аспирантами и сотрудниками кафедры ВТ в рамках научного направления «Организация вычислительных систем и сетей», программы развития Национального исследовательского университета, аналитической ведомственной целевой программы «Развитие научного потенциала высшей школы (2006–2010 г.)», Федеральной целевой программы «Научные и научнопедагогические кадры инновационной России на 2009-2013 годы», а также в ходе выполнения научно-исследовательских и опытно-конструкторских работ, проводимых, в том числе, по заказу предприятий и организаций Санкт-Петербурга.

ISBN 978-5-7577-0360-2 В 2009 году Университет стал победителем многоэтапного конкурса, в результате которого определены 12 ведущих университетов России, которым присвоена категория «Национальный исследовательский университет». Министерством образования и науки Российской Федерации была утверждена Программа развития государственного образовательного учреждения высшего профессионального образования «Санкт-Петербургский государственный университет информационных технологий, механики и оптики» на 2009–2018 годы.

© Санкт-Петербургский государственный университет информационных технологий, механики и оптики, «САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ, МЕХАНИКИ И ОПТИКИ» Сборник трудов молодых ученых и сотрудников кафедры ВТ СОДЕРЖАНИЕ ПРЕДИСЛОВИЕ.................................................................................................................................... ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ Беликов П.А., Кириллов В.В., Громов Г.Ю. Классификация неструктурированных данных в контексте управления жизненным циклом информации.......................... Зараковский А.В., Насонова Н.В., Фдорова М.В. Анализ функциональных возможностей rdf-хранилищ......................................................................................... Громов Г.Ю., Громова И.В., Беликов П.А. Информационные технологии в управлении дистанционным обучением...................................................................... Бессмертный И.А., Шеховцов М.М. Индексация фактов для ускорения логического вывода в базах знаний.................................................................................................... Колюшин С.А., Ожиганов А.А. Принципы построения сайтов с использованием системы управления контентом.................................................................................... Кириллов В.В., Лаптева А.А. Использование Oracle APEX для создания корпоративных интернет-приложений........................................................................ КОМПЬЮТЕРНЫЕ СИСТЕМЫ Герасимов А.А., Кустарев П.В. Способы формального описания асинхронных схем.................................................................................................................................. Муравьева-Витковская Л.А., Сафин Д.О. Подход к созданию моделей коммутаторов компьютерных сетей........................................................................................... Басов М.А. Методы повышения производительности RISC-процессоров..................... Касаткин Н.В., Сергеев А.О. Клонирование компьютеров в локальной сети с использованием свободного программного обеспечения.......................................... Асафьев Г.К. Современные системы имитационного моделирования............................ Румянцев А.С. Отказоустойчивый алгоритм маршрутизации для сетей на кристалле. СЖАТИЕ И ОБРАБОТКА МУЛЬТИМЕДИЙНЫХ ДАННЫХ Артюхин А.Ю., Тропченко А.А. Современные форматы аудиофайлов......................... Балакшин П.В., Тропченко А.Ю. Развитие и применение алгоритмов распознавания речи для скрытых марковских моделей....................................................................... Пиуновский Е.В. Построение биортогональных вейвлетов с помощью лифтинговой схемы для решения задач сжатия аудиосигналов....................................................... Сборник трудов молодых ученых и сотрудников кафедры ВТ 4 СОДЕРЖАНИЕ МЕТОДЫ И СИСТЕМЫ ЗАЩИТЫ ИНФОРМАЦИИ Дроздов В.Ю., Ожиганов А.А. Сравнение гибридной и асимметричной криптосистем............................................................................................................................... Тропченко А.Ю., Ван Цзянь Методы маркирования цифровых изображений в коэффициентах дискретно-косинусного преобразования.......................................... Шибаева Т.А. Метод защиты программного обеспечения от вредоносных программ................................................................................................................ Тропченко А.Ю., Ван Цзянь Анализ методов маркирования цифровых изображений в пространственной области.......................................................................................... Сборник трудов молодых ученых и сотрудников кафедры ВТ ПРЕДИСЛОВИЕ Кафедра вычислительной техники (ВТ) Санкт-Петербургского государственного университета информационных технологий, механики и оптики — одна из старейших, она более 70 лет ведет подготовку высококвалифицированных специалистов в области вычислительной техники. С первых лет существования в далеком 1939 г. на кафедре начали выполняться работы по исследованию механических и электромеханических счетно-решающих устройств, а уже в 1956 г. кафедра приступила к проектированию первой в институте электронной вычислительной машины для оптических расчетов «ЛИТМО-1».



В 1962 г. при кафедре вычислительной техники была организована отраслевая лаборатория цифровых вычислительных управляющих машин, в которой были развернуты работы по созданию формализованных методов проектирования цифровых вычислительных устройств и разработке преобразователей аналоговых сигналов в цифровые. Там же проводились исследования по алгоритмизации процессов проектирования с целью создания базы для использования универсальных ЭВМ при проектировании новых вычислительных машин и устройств. С этой целью были проведены исследования с применением методов статистического и имитационного моделирования для анализа структур и алгоритмов на этапах логического и операционного проектирования вычислительных машин.

В дальнейшем на кафедре были развернуты работы (которые продолжаются и по настоящее время) по таким актуальным направлениям, как оптоэлектронные методы и средства преобразования информации для ЭВМ и цифровых систем, разработка цифровых и оптикоэлектронных систем обработки информации, информационно-управляющие и встроенные системы, разработка моделей и методов анализа и системотехнического проектирования вычислительных систем и сетей, проектирование, разработка, сопровождение и реинжиниринг корпоративных информационных систем.

В настоящий сборник включены научные статьи студентов и аспирантов кафедры ВТ, отобранные по результатам докладов, представленных на XXXVIII научной и учебнометодической конференции СПбГУ ИТМО и на научно-практической конференции молодых ученых «Вычислительные системы и сети (Майоровские чтения)», состоявшихся в 2009 г.

Представленные статьи содержат результаты исследований и разработок, выполненных на кафедре студентами и аспирантами под руководством и при участии преподавателей в рамках научного направления кафедры «Организация вычислительных систем и сетей». Статьи охватывают вопросы программного и информационного обеспечения вычислительных машин, автоматизации проектирования и моделирования вычислительных систем и сетей, построения информационных систем с базами знаний, разработки методов и средств обработки мультимедийных данных и обеспечения информационной безопасности.

Широкий диапазон научных исследований, выполняющихся на кафедре ВТ, обусловил разнообразие тематики представленных статей, которые помещены в 4 раздела: «Информационные технологии», «Компьютерные системы», «Сжатие и обработка мультимедийных данных», «Методы и системы защиты информации».

Сборник трудов молодых ученых и сотрудников кафедры ВТ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ УДК 004.633.КЛАССИФИКАЦИЯ НЕСТРУКТУРИРОВАННЫХ ДАННЫХ В КОНТЕКСТЕ УПРАВЛЕНИЯ ЖИЗНЕННЫМ ЦИКЛОМ ИНФОРМАЦИИ П. А. Беликов, В. В. Кириллов, Г. Ю. Громов При внедрении в информационные системы стратегий управления жизненным циклом информации и данных одной из основных проблем является трудоемкость процесса классификации информации для установления формальных критериев ее соответствия уровням хранения. Предлагается алгоритм классификации неструктурированных данных на основе вычисления потенциалов отдельных элементов.

Ключевые слова: информация, управление жизненным циклом, классификация, неструктурированные данные, системы хранения данных, уровни хранения.

Введение Ввиду того что с каждым годом объем хранимых данных и информации возрастает на 50—100 % [1], внедрение концепций и технологий, которые позволят повысить эффективность систем хранения, становится все более актуальной задачей. Одной из них является концепция управления жизненным циклом информации. Согласно данной концепции, различные классы информации размещаются на различных уровнях хранения и соответственно на различных физических носителях. Целью данной работы является создание алгоритма классификации, требующего минимальных трудозатрат пользователей, как на этапе внедрения, так и на этапе эксплуатации системы хранения данных (СХД).

Жизненный цикл информации Выделяют следующие основные этапы жизненного цикла информации [2].

1. Создание информации (данных).

2. Активные данные (информация), или данные (информация), только что поступившие в СХД.

3. «Менее активные» данные (информация), используемые и обновляемые время от времени.

4. Архивные данные (информация), данные (информация), используемые время от времени и при этом не подвергающиеся изменению.

5. Сжатые (архивные) данные, данные (информация), необходимость хранения которых регламентируется соответствующими законодательными актами [3] или же внутренними инструкциями организации.

6. Удаление информации.

При этом каждый из этапов 2—5 ассоциирован со своим уровнем хранения (см. рис. 1).

Основной задачей является классификация информации для дальнейшего установления формальных критериев миграции информации и данных между различными этапами жизненного цикла и/или физическими носителями. Применительно к данной задаче важным является очевидное выделение различных видов информации и данных:





— структурированные данные, хранимые в различных СУБД и в плоских файлах;

— частично-структурированные данные, хранимые в XML-файлах;

Сборник трудов молодых ученых и сотрудников кафедры ВТ 8 ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ — неструктурированные данные, мультимедиа, HTML-страницы, файлы текстовых процессоров.

Рис. 1. Этапы жизненного цикла информации и соответствующие им элементы СХД Анализ первых двух видов информации, очевидно, не представляет какой-либо трудности. Работа с третьим видом является более сложной задачей. На данный момент задача анализа и классификации неструктурированных данных реализуется в рамках концепции управления жизненным циклом данных (Data Lifecycle Management - DLM). При этом используются такие атрибуты, как тип файла, его размер и возраст. Содержимое учитывается только на основе заданных пользователем метаданных [4], что ведет за собой неминуемое снижение производительности труда (рост трудозатрат) пользователя. Предлагаемый алгоритм (метод) классификации данных позволит значительно снизить трудозатраты за счет отсутствия необходимости составления дополнительного описания к различным данным.

Потенциальный метод классификации неструктурированных данных Предлагаемый метод классификации на основе вычисления потенциалов классифицируемых данных по отношению к существующим в СХД классам данных и информации (рис. 2).

При создании данного метода исследовались методы распознавания образов [5] и, в частности, гипотеза компактности [6].

К1 P1 P2 КК PP1 < P3 < PКРис. 2. Классификация данных на основе вычисления потенциалов Потенциал в данном случае представляет собой числовой критерий посимвольного соответствия классифицируемой информации известным эталонам. Он может быть гарантированно применен для любых текстовых данных. Потенциал для отдельной лексемы вычисляется следующим образом: начиная с первого символа лексемы каждый следующий символ, соответствующий эталону добавляет единицу к потенциалу лексемы, добавление производится до тех пор, пока не встретится символ, отсутствующий в эталоне. Суммарный потенциал файла (набора лексем) вычисляется как сумма потенциалов каждой лексемы.

Алгоритм состоит из 2 этапов.

1. Выделение значащих лексем.

Сборник трудов молодых ученых и сотрудников кафедры ВТ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ 2. Сравнение значащих лексем с соответствующими порядковыми номерами в классифицируемых данных и лексем в данных — эталонах классов и вычисление потенциалов.

Второй этап алгоритма повторяется последовательно для каждого класса информации, заданного в СХД. Класс, потенциал по отношению к которому будет максимальным, и яв- ляется искомым.

Первым этапом алгоритма является разделение анализируемых данных на отдельные значащие части. Эта задача выполняется следующим образом.

1. Приведение данных в шестнадцатеричное представление (рис. 3).

2. Выделение значащих лексем, разделенных шестнадцатеричными байтами «00100000» в случае данных, созданных при помощи текстового процессора Microsoft Word 2003 или другими разделителями.

3. Порядковая нумерация значащих лексем для дальнейшего анализа.

Рис. 3. Шестнадцатеричное представление тестового файла test.doc, содержащего лексему «test» Второй этап алгоритма выполняется следующим образом.

1. Для каждой лексемы вычисляется потенциал (рис. 4).

2. Потенциалы каждой лексемы суммируются для вычисления полного потенциала данных.

Эталон:

74 65 73 74 = Hex(test) P = Классифицируемая лексема:

74 65 73 64 = Hex (tesd) test 1 1 1 Рис. 4. Вычисление потенциала для лексемы «tesd» Вычисленные суммарные потенциалы относительно каждого класса информации (эталона, хранимого в СХД) сравниваются. Класс, для которого получен максимальный потенциал, является искомым. Для достижения максимально точных результатов рекомендуется использовать в качестве эталонов формы, не содержащие значимой информации (числовых данных и др.).

Заключение На современном этапе внедрение стратегии управления жизненным циклом включает в себя 3 этапа.

1. Анализ данных.

2. Определение класса данных.

3. Перемещение данных на соответствующий этап жизненного цикла и физический носитель.

Сборник трудов молодых ученых и сотрудников кафедры ВТ 10 ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ Предлагаемый алгоритм позволяет автоматизировать первый и второй этап и за счет этого увеличить производительность труда пользователей. Предложенный в данной работе алгоритм может быть в дальнейшем модернизирован с использованием технологий нейронных сетей и алгоритмов искусственного интеллекта и, как следствие, использован для анализа и классификации мультимедийных данных.

ЛИТЕРАТУРА 1. Petrochelli Т. Data Protection and Information Lifecycle Management. Prentice Hall, 2005. 288 p.

2. Волков Д. Два взгляда на ILM [Электронный ресурс]: .

3. Федеральный закон «Об архивном деле в Российской Федерации» от 22.10.2004 № 125-ФЗ.

4. Gauri S. ACE: Classification for Information Lifecycle Management [Electronic resource]:

.

5. Поветкин А. Распознавание образов методом потенциальных функций [Электронный ресурс]: .

Pages:     || 2 | 3 | 4 | 5 |   ...   | 15 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.