WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 || 3 | 4 |   ...   | 15 |

6. Классификация. Гипотеза компактности [Электронный ресурс]: .

УДК 004.АНАЛИЗ ФУНКЦИОНАЛЬНЫХ ВОЗМОЖНОСТЕЙ RDF-ХРАНИЛИЩ А. В. Зараковский, Н. В. Насонова, М. В. Фдорова Проведен сравнительный анализ характеристик распространенных открытых реализаций RDF-хранилищ. Подробно проанализированы (в том числе и посредством бенчмарков) основные параметры RDF-хранилищ Jena, Sesame и Virtuoso. На основании результатов тестирования сделаны выводы о применимости этих хранилищ в САПР и экспертных системах, использующих семантический анализ текстовой информации.

Ключевые слова: RDF-хранилище, RDF, SPARQL, Jena, Sesame, Virtuoso, семантический анализ, тестирование, бенчмарки.

Введение RDF-хранилище (RDF store) — аналог базы данных для хранения RDF-триплетов и запросов к ним. В дополнение к обычным функциям баз данных RDF-хранилище имеет возможность объединять данные из разных источников, используя URI для идентификации одинаковых объектов.

Фундаментальное отличие RDF-хранилища от реляционной базы данных заключается в возможности автоматически сопоставлять две различные записи из разных источников, если они относятся к одному объекту. Благодаря гибкости модели данных RDF эта процедура четко определена: любые два ресурса с одним URI будут считаться эквивалентными в итоговом наборе данных [1, 2].

Целью данной работы является выбор RDF-хранилища, которое будет использоваться в качестве основы нашего проекта — экспертной системы, использующей семантический Сборник трудов молодых ученых и сотрудников кафедры ВТ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ анализ текстовой информации. Это хранилище должно максимально полно удовлетворять нашим требованиям функциональности и по возможности наиболее эффективно использовать ресурсы машин, на которых оно будет работать.

Требуемая функциональность Для хранения данных, полученных в результате семантического анализа технической документации, требуется выбрать оптимальное RDF-хранилище.

Существующие RDF-хранилища не отличаются богатыми функциональными возможностями, а в основном реализуют базовые функции. Ниже перечислены основные возможности таких хранилищ:

— федеративность;

— поддержка именованных графов;

— хранение истории изменений;

— репликация (RDF-данные с сервера могут частично кэшироваться на машине клиента, оставаясь доступными даже при отсутствии связи с сервером);

— безопасность (безопасность именованных графов обеспечивает ролевая система контроля доступа);

— уведомления (клиент получает через JMS уведомления об изменениях триплетов и именованных графов);

— масштабируемость;

— совместимость со стандартами RDFS, OWL, SPARQL, Prolog;

— поддержка типов данных;

— кроссплатформенность.

Наша задача упрощается вследствие отсутствия специфических требований, следующих из предметной области, сводясь, таким образом, к стандартной. Исходя из этого получаем следующие требования к хранилищу:

— открытость;

— хорошая документированность;

— возможность загрузки данных в хранилище в формате RDF/XML;

— поддержка языка запросов SPARQL;

— наличие собственного API, либо совместимость с Jena API.

Описание RDF-хранилищ На сегодняшний день существует множество RDF-хранилищ, как от коммерческих компаний, так и от независимых разработчиков: Boca, D2RQ и D2R Server, Franz Inc’s AllegroGraph, Intellidimension’s RDF Gateway, Jena’s Joseki, Mulgara, OpenLink Virtuoso, Oracle Spatial 10g, OWLIM, Sesame, Tucana Suite, YARS, 3Store и другие. Рассмотрим несколько наиболее распространенных решений [3].

Jena — это популярный Java-фреймворк. Позволяет хранить данные как в реляционной базе данных (поддерживаются MySQL и PostgreSQL), так и в собственном формате. В данной статье рассмотрен вариант использования Jena с MySQL.

Aduna Sesame — это достаточно популярный открытый фреймворк для хранения данных и выполнения запросов к ним. Важным преимуществом этого фреймворка является его очень хорошая документированность.

OpenLink Virtuoso — универсальный сервер, обеспечивающий управление SQL-, XML- и RDF-данными. Распространяется как под открытой, так и под коммерческой лицензиями.

Сравнение RDF-хранилищ Открытость. У всех рассматриваемых хранилищ имеется открытая версия.

Язык запросов. Все перечисленные RDF-хранилища поддерживают язык запросов SPARQL, рекомендованный консорциумом W3C и ставший в последнее время довольно поСборник трудов молодых ученых и сотрудников кафедры ВТ 12 ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ пулярным. Фреймворк Jena требует отдельной установки SPARQL-сервера, но это не вызы- вает особых затруднений.

Добавление данных в хранилище. Добавить RDF-данные в хранилище Sesame можно через web-интерфейс, а также программно в форматах RDF/XML, TriG, TriX, N-Triples, N3,Turtle. Virtuoso понимает форматы RDF/XML, Turtle, N3 / N-Triples, однако не предоставляет удобного интерфейса для их добавления.

API. Sesame и Jena имеют собственные API; Virtuoso обеспечивает совместимость по API и с Jena, и с Sesame.

Документация и информация по продукту Наиболее подробно документирован фреймворк Sesame — на сайте проекта доступна документация по всем актуальным версиям продукта. По Jena также имеется достаточно документации, в том числе и подробная информация по всем способам хранения RDF-триплетов. RDFхранилище компании OpenLink является частью универсального сервера Virtuoso, и документация существует как часть общего руководства по этому программному продукту.

Таким образом, выбранным нами критериям удовлетворяют последние версии всех рассмотренных выше RDF-хранилищ. Область семантического контента в настоящее время активно развивается, и создатели RDF-хранилищ стараются реализовать в своих продуктах всю необходимую функциональность, которая может пригодиться разработчикам семантических приложений и одновременно обеспечить поддержку постоянно развивающихся стандартов W3C, таких как язык запросов SPARQL.

Несмотря на то что обеспечить требуемую функциональность способно практически любое поддерживаемое разработчиками RDF-хранилище (в том числе и все рассмотренные выше), выборка по функциональности не решает поставленной задачи, т.к. выдвинутые требования не сузили круг возможных вариантов. Таким образом, без формулирования дополнительных критериев оценки наш выбор будет основываться либо на переборе всех предполагаемых решений с целью выявить наиболее эффективное опытным путем, либо на построении системы на базе любого из них. Первый вариант приведет к значительным временным затратам на решение проблем интеграции готовых модулей с очередным хранилищем. При выборе второго варианта возможно выбрать плохо подходящее для наших задач хранилище, что исходя из архитектуры нашей системы повлечет за собой дополнительные затраты на переработку работающих с ним компонентов. Следовательно, перед нами встает дополнительная задача предварительного тестирования хранилищ.

Важным показателем является не только само наличие некой функциональности, но и эффективность ее реализации. Оценить характеристики, отражающие эффективность функций хранилища, позволяют специализированные тестовые пакеты (бенчмарки). В общем значении, бенчмарк — это программа, предназначенная для измерения показателей производительности системы, а также других ее функциональных характеристик, напрямую не связанных с быстродействием. Помимо возможности измерения количественных характеристик RDF-хранилищ, важным преимуществом использования тестовых пакетов является то, что они позволяют генерировать набор данных произвольного размера, которого у нас на начальном этапе работы над проектом еще нет.

Бенчмарки Ниже представлены несколько бенчмарков для RDF-хранилищ [4]:

1. Lehigh University Benchmark (LUBM).

2. Ontology Benchmark (UOBM) — дополняет LUBM возможностями тестирования умозаключений и масштабируемости.

3. A Benchmark for Spatial Semantic Web Systems — расширяет LUBM пространственными данными.

Сборник трудов молодых ученых и сотрудников кафедры ВТ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ 4. Berlin SPARQL Benchmark (BSBM) — позволяет сравнивать производительность хранилищ RDF и именованных графов, а также систем, поддерживающих SPARQL.

5. The SP2Bench SPARQL Performance Benchmark — обеспечивает масштабируемый генератор RDF-данных и ряд стандартных запросов для них.

6. The ISLab Instance Matching Benchmark.

7. THALIA Testbed — позволяет тестировать выразительность языков, выполняющих разметку реляционных данных на RDF.

Перечисленные выше бенчмарки обладают разной функциональностью и позволяют тестировать самые разнообразные характеристики с учетом различных нюансов. При этом, многие из них в качестве основы используют бенчмарк LUBM, обеспечивающий возможности тестирования по базовому набору параметров:

— время загрузки RDF-данных;

— размер хранилища;

— время ответа на запрос.

Этих критериев вполне достаточно для оценки характеристик хранилищ, предполагаемых к использованию в системах «общего назначения», к которым относится и наш проект.

Результаты тестирования [5] рассмотренных выше хранилищ по этому набору критериев приведены в таблице (tз — время загрузки триплетов в хранилище; tо — время ответа на запрос всей информации об определенном субъекте) Критерий Jena Sesame Virtuoso tз, с (15 млн триплетов) 70 22 tз, с(450 тыс триплетов) 6,3 2,3 1,tз, с(200 тыс триплетов) 5,2 2,4 1,tо, мс 560 400 300—tо, с (на запрос 2) 53 70—80 tо, с (на запрос 3) 14 >260 Заключение Проанализировав существующие RDF-хранилища, авторы пришли к выводу, что по функциональности поддерживаемые разработчиками и постоянно обновляемые хранилища различаются слабо. Более значимым показателем для их сравнения является эффективность реализации данной функциональности, т.е. насколько хорошо они справляются с задачей обеспечения быстрой и удобной работы с хранящимися в них данными. Как видно из полученных количественных показателей, лучшим хранилищем по этим параметрам является Virtuoso. Однако Sesame по большинству параметров также показывает неплохие результаты, положительно выделяясь среди остальных решений наличием отличной документации (что очень важно при реализации первого проекта) и большим сообществом пользователей, осуществляющих его поддержку и дальнейшее развитие.

ЛИТЕРАТУРА 1. Manola F., Miller E., McBride B. RDF Primer [Electronic resource]: .

2. Allemang D., Hendler J. Semantic Web for the working ontologist [Electronic resource]:

.

3. Навернюк М. Список инструментов Semantic Web [Electronic resource]:

.

Сборник трудов молодых ученых и сотрудников кафедры ВТ 14 ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ 4. Bizer Ch. RDF Store Benchmarking [Electronic resource]: .

5. Becker Ch. RDF Store Benchmarks with DBpedia [Electronic resource]:

fu-berlin.de/benchmarks-200801/>.

УДК 004.ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В УПРАВЛЕНИИ ДИСТАНЦИОННЫМ ОБУЧЕНИЕМ Г. Ю. Громов, И. В. Громова, П. А. Беликов Рассмотрены возможные решения наиболее важных проблем современного дистанционного образования, оказывающих существенное влияние на развитие технологий и методов управления в этой сфере образовательной деятельности вузов России, использован опыт ведущих европейских высших образовательных учреждений.

Ключевые слова: дистанционное образование, виртуальное представительство, ассоциированный центр, тьютор, мультимедийный контент, портфолио.

Введение Стратегическими задачами развития образования России в ближайшей перспективе являются повышение качества и доступности образования, а также создание системы непрерывного образования (образования в течение всей жизни). Перспективным направлением в решении этих стратегических задач является развитие и внедрение в практику дистанционного образования. Дистанционное образование (ДО) строится сегодня на основе базовых информационно-коммуникационных технологий (ИКТ) и сетевых информационно-образовательных сред. ИКТ сегодня представляют собой пример одной из наиболее динамично развивающихся сфер техники и технологий: обновление ИКТ происходит практически ежегодно.

Поэтому и информационно-образовательные среды ДО должны иметь гибкую структуру, легко перестраиваться вслед за изменениями ИКТ и обеспечивать опережающее развитие образования в новом информационном обществе.

Стремление объединить наработки системы образования с новейшими информационными технологиями вызвано желанием сформировать в России открытое образовательное пространство, доступное для самых широких слоев населения. По этой же причине многие государственные и негосударственные учебные заведения разрабатывают и внедряют в практику технологии дистанционного, или открытого, обучения. Управление этими системами основано на использовании информационных технологий [1—7].

В результате анализа систем дистанционного обучения в российских университетах определены наиболее важные объекты управления.

Управление ролями пользователей Управление ролями пользователей подразумевает обеспечение степени доступа к электронным учебно-методическим комплексам (УМК), размещенным в системе, и результатам учебного процесса. Степень доступа определяется не только группой безопасности пользователя, но и рядом дополнительных факторов, к которым относятся: назначение тьютором (преподавателем) на дисциплину, назначение куратором на учебный план, права владения Сборник трудов молодых ученых и сотрудников кафедры ВТ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ подразделением, отношение подразделения к учебному плану или его элементам, права владения схемой, где размещены элементы УМК, права автора УМК или его элементов.

Управление разработкой электронных УМК Учебно-методические материалы, размещаемые в системе, организованы в виде электронных УМК. Структура УМК, разработанная на основе комплексного подхода, — иерархическая модульная, она включает рабочую программу, описание электронного курса и набор обучающих, информационных и аттестующих материалов, представленных в виде электронных конспектов, практикумов, информационных ресурсов, компьютерных тестов, виртуальных лабораторий и тренажеров.

Управление траекторией обучения Электронный УМК содержит правила прохождения учащимися электронных учебнометодических материалов и проведения контроля уровня подготовки. Используя систему правил, управляющих доступом к модулям УМК, авторы курса могут программировать последовательность прохождения модулей учащимся на основании результатов аттестаций.

Мониторинг и управление организацией учебного процесса Для управления организацией учебного процесса в системе ДО необходима система формирования расписания аттестаций студентов. Аттестации проводятся в соответствии с графиком, формирующимся на основании заявок учебных кафедр. График публикуется в интернет-ресурсах университета. На основании графика устанавливается лимит времени работы в компьютерных классах для каждого студента. Он определяется исходя из количества тем, по которым необходимо пройти аттестацию, времени тестирования по каждой теме и объему обучающих ресурсов системы по дисциплинам, включенным в график аттестаций.

Управление сетевым общением В системе используются следующие виды сетевого общения: доски объявлений, опросы, форум, чат, электронная почта. Сетевое общение позволяет пользователям обсуждать интересующие их вопросы, узнавать новости о последних изменениях в системе, участвовать в опросах, получать консультации и советы у преподавателей и других специалистов. Права доступа к встроенным средствам электронного общения определяется группой безопасности, к которой принадлежит пользователь, и параметрами, которые устанавливает владелец ресурса.

Мониторинг и управление качеством образования Электронный журнал дает пользователям возможность просмотра результатов успеваемости студентов по различным видам контроля знаний. Это приложение доступно всем пользователям системы ДО, однако объем отображаемой информации зависит от роли конкретного пользователя. Система содержит результаты запроса из базы данных различного рода информации (результаты обучения, мониторинг, статистика), представленные в удобном виде, имеется возможность продления сроков сессии с целью ликвидации студентами академических задолженностей.

Pages:     | 1 || 3 | 4 |   ...   | 15 |






















© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.