WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     || 2 | 3 | 4 | 5 |
ТЕХНОЛОГИИ И АЛГОРИТМЫ РЕЗЕРВНОГО КОПИРОВАНИЯ В.Г. Казаков, С.А. Федосин Мордовский государственный университет им. Н.П. Огарева 430005, г. Саранск, ул. Большевистская, д. 68 Аннотация. В статье представлен обзор современных технологий в системах хранения и резервного копирования, рассмотрены традиционные и нетривиальные схемы копирования. Охарактеризованы мировой и российский рынки систем резервирования, дана сравнительная характеристика репрезентативных программных продуктов.

Annotation. This document presents a survey of present-day storage and backup technologies. It also gives a review of backup techniques that include traditional backup schemes and nontrivial ones. Next, we discuss market and industry trends. Last, the paper classifies several commercial backup systems according to functionality and prices.

1 1. Введение Информации, хранящейся в компьютерных системах, угрожает множество опасностей. Данные могут быть утеряны по причинам ошибок программного обеспечения, неумелой работы пользователей, сбоев физических носителей и средств связи, злонамеренной порчи данных. Абсолютной защиты от всех этих угроз не существует, риск утраты данных существует всегда.

Как показывает общемировая статистика [16], основными причинами потерь данных являются неисправная работа аппаратных средств (44%) и человеческие ошибки (32%), в основном тех, кто имеет максимальный уровень доступа к системам хранения данных компании. 14% всех случаев потерь данных происходят вследствие ошибок программного обеспечения, другие 7% происходят из-за компьютерных вирусов, а вследствие стихийных бедствий – только 3%.

Сбои приводят к приостановлению бизнес-процессов и потере данных, тем самым ставят под вопрос существование бизнеса в целом. Пожалуй, единственный способ надежно сохранить нужную информацию - периодически создавать резервные копии [43].

Внедряя системы хранения данных и резервного копирования, компания сталкивается со сложными задачами оценки ее текущих потребностей, планировании будущих объемов данных, выбора технологий и архитектур, которые должны максимально соответствовать требованиям безопасности, возможности последующего масштабирования, удовлетворять техническим требованиям скорости записи, чтения, восстановления данных и многим другим условиям. Выявить оптимальное решение очень непросто, особенно учитывая широкое многообразие существующих путей реализации систем хранения и резервного копирования, а также довольно высокую динамику изменения цен и появления новых технологий на IT рынке.

У клиентов разные приоритеты, однако, существует общая для всех проблема – стремительный рост объемов хранимых данных, составляющий 50-100% в год [52]. Так по результатам исследования компании IDC – совокупный объем информации, хранящейся в электронном виде, в 2006 году составил 161 эксабайт (1 эксабайт равен 1018 байт). Аналитики предполагают, что за период с 2006 по 2010 годы общий объем информации увеличится, по крайней мере, в шесть раз. Соответственно, все серьезнее становится проблема надежного хранения данных и скорости доступа к ним [53].

При таких темпах роста традиционные системы становятся неэффективными, необходима оптимизация процессов хранения, создания резервных копий, внедрение решений класса ILM (Information Lifecycle Management - управление жизненным циклом информации) [52].

Резервное копирование в глазах большинства специалистов все еще не является достаточно надежным. 45% респондентов заявили, что в примерно 10% случаях испытывали неудовлетворительный результат при использовании всякого рода систем резервного копирования, причем по сравнению с данными опроса 2004 года этот показатель удвоился [8].

Отчасти это объясняется неверным выбором инструментов. По данным компании IDC, причиной 40% случаев полной утраты данных американскими компаниями является пренебрежительное отношение к технологиям хранения. При этом только 10% из этих компаний смогли вернуться к бизнесу и лишь 4% из них выжили в течение последующих трех лет [58].

Действительно, построение высокоэффективной системы хранения данных, отвечающих реальным требованиям организации, а также выбор наиболее подходящей системы резервного копирования – процесс весьма сложный и трудоемкий.

В данной статье представлена информация о широком спектре современных технологий хранения и резервного копирования данных, о тенденциях их развития и областях применимости, представлена ситуация на соответствующем сегменте рынка.

2. Сущность систем резервного копирования Рассмотрим определение понятия резервного копирования по версии SNIA (Storage Networking Industry Association) [36].

Резервная копия (англ. backup copy) – данные, хранимые на энергонезависимых носителях, обычно удаленно, предназначенные для восстановления, в случае если оригинал копии данных утерян или недоступен.

Резервное копирование (англ. backup) – процесс создания резервных копий.

Все системы резервного копирования данных можно разделить на три типа согласно используемому методу копирования: это может быть пофайловое копирование, блочное или копирование данных на уровне приложений.

Система блочного резервного копирования (англ. image-level или block-level backup) работает напрямую с носителем, игнорируя файловую структуру, и сохраняя вс содержимое полностью – операционную систему, рабочие данные, настройки и прочее. Преимуществом выполнения данного вида резервного копирования является высокая скорость. Однако обычно при выполнении операций копирования требуется приостановить работу приложений, чтобы копия была целостной (англ. consistent).



Некоторые системы (англ. sparse image backup) обнаруживают неиспользуемые блоки и исключают их копирование. При использовании блочного резервного копирования, довольно затруднительным является восстановление частных файлов.

При выполнении операций резервного копирования на файловом уровне (англ.

file-level или file-based backup) используется файловая система. В этом случае относительно простой задачей является восстановление некоторых конкретных файлов.

В целом же операции резервного копирования длятся дольше, возникает дополнительная загрузка операционной системы, а также появляется проблема доступа к открытым файлам.

Резервное копирование может производиться на уровне приложений (англ.

application-level backup). Операции копирования и восстановления производятся посредством использования специально предусмотренного в резервируемом приложении программного интерфейса API (англ. Application Programming Interface).

Резервная копия представляет собой набор файлов и возможно других объектов, определяемых самим приложением, которые вместе являются отображением состояния приложения на некоторый момент времени. При данном способе резервного копирования может иметь место проблема совместимости между разными версиями приложений и систем резервного копирования, реализующих соответствующий интерфейс.

Современные системы резервного копирования реализуются как программно (англ. software-based), так и аппаратно (англ. hardware-based), а также в сочетании программных и аппаратных компонентов.

Использование чисто программных средств относительно более дешево и универсально. Они выполняют свои задачи вне зависимости от того, где и как расположено помещение для серверов, или от того, как осуществляется доступ к корпоративным приложениям с рабочих станций сотрудников. Программные решения слабо зависят от принятой архитектуры хранения и защиты данных.

Выделенные аппаратные мощности для резервного копирования позволяют не загружать основные сервера компании. Чисто аппаратные методы резервного копирования, а также другие аппаратные способы предотвращения сбоев, такие, как кластеризация серверов или использование RAID-массивов с горячей заменой дисков, довольно дороги, и предъявляют особые требования к используемому аппаратному и программному обеспечению. Подобные системы также весьма требовательны к квалификации обслуживающего персонала. Аппаратные системы резервного копирования обычно составляют часть масштабных систем хранения данных, развертываемые крупными компаниями.

Программно-аппаратная система резервного копирования состоит из аппаратных и программных компонентов. Вся логика резервного копирования, как правило, сосредоточена в программных компонентах и реализуется ими. Они управляют устройствами, процессом резервного копирования и восстановления данных, поддерживают расписание работ и реализуют дополнительные сервисные функции. Аппаратные компоненты предназначены для выполнения операций записи, хранения резервных копий и восстановления данных.

2.1. Архивирование. Отличие от резервного копирования Большинство домашних пользователей и малых компаний не различают резервное копирование и архивирование, для них резервные копии являются и архивом [11, 8]. Рассмотрим определения понятия архивирования по версии SNIA (Storage Networking Industry Association) [36].

Архив (англ. archive) – данные, хранимые в течение длительного количества времени, в целях ведение контроля, анализа, справочных целей.

Архивирование (англ. archive) – процесс создания архивов; копирование или перемещение данных в целях хранения.

Архивирование отличается от резервного копирования, прежде всего тем, что направлено на длительное хранение информации и не предусматривает требований к скорому доступу при необходимости [11].

Если к данным архива доступ может быть получен относительно быстро, то архив называют «активным» (англ. active archive), а в случае, когда доступ требует значительного количества времени – «не активным» или «холодным» (англ. cold archive). См. [9].

Зачастую «активные» архивы используются совместно с «не активными», образуя иерархические структуры. К примеру, на «переднем крае», для частого использования могут находиться массивы дисковых накопителей, при этом менее востребованные данные хранятся на магнитных лентах.

Для «не активных» архивов практически всегда используются накопители на магнитных лентах, прежде всего из-за очень длительного срока службы.

В дисковых архивах обычно используются жесткие SATA диски, как правило, их объединяют вместе так, чтобы большая часть находилась в отключенном состоянии, и активизировалась при необходимости. Такие массивы жестких дисков называют MAID (англ. Massive Array of Inactive Disks).

Факторы, учитываемые при выборе носителей, включают не только цену на объем хранимых данных, но и, конечно же, ожидаемы срок годности носителей. Ставя задачу хранения данных в течение ста лет, и предполагая срок полезной службы используемых носителей равный 8-10 годам, нужно ожидать, что будет необходимо произвести замену оборудования как минимум 10 раз [9].

2.2. Приоритеты, учитываемые при выборе систем резервного копирования При выборе систем резервного копирования выставляется ряд требований к характеристикам процессов резервирования и хранения, которые описываются в контракте с поставщиком и называются, как правило, SLA (англ. Service Level Agreement) - соглашением об уровне услуг. При постановке и анализе общих технических требований обычно оперируют такими понятиями как RPO, RTO, Backup Window и т.д. См. [11].





Backup Window (окно резервного копирования) – количество времени, необходимое для выполнения операций резервного копирования на целевой системе.

RPO (англ. Recovery Point Objective) – момент времени к которому требуется восстановить данные. RPO определяет насколько часто требуется производить операции резервного копирования и какое количество резервных копий требуется хранить.

RTO (англ. Recovery Time Objective) – время в течении которого требуется восстановить систему в случае необходимости. RTO будет низким в случае если существует локальная копия всех необходимых данных. Использование технологии CDP также характеризуется низким RTO.

RTA (англ. Recovery Time Actual) – действительное время восстановления.

Используется в сочетании с поставленным временем RTO. Определяется экспериментально, при проведении тестирования.

Data security (безопасность данных) – уровень защиты от неавторизованного доступа к хранимой информации. Это может подразумевать как шифрование данных, так и защиту от физического доступа к системам хранения и т. п.

2.3. Ограничивающие факторы Внедряя, какую либо систему резервного копирования необходимо понимать, что это скажется тем или иным образом на производительности обслуживаемой системы, к примеру, выбирая распределенное хранение резервных копий нужно предполагать рост трафика в сети.

Каждый подход в построении системы предполагает определенное соотношение между объемом хранимых данных, скоростью создания копий, скоростью восстановления, количеством специально обученного персонала, стоимостью приобретения и обслуживания. При этом увеличение скорости создания копий на 10% может увеличить расходы в два раза, поэтому при выборе систем нужно тщательно выбирать требования к характеристикам и планировать их изменение в будущем, чтобы предусмотреть возможность масштабирования.

Все технические характеристики системы, а также стоимость внедрения и владения существенно зависят от применяемых технологий хранения и резервного копирования.

3. Современные технологии в системах хранения и резервного копирования Резервное копирование, являясь составной частью единой системы хранения данных компании, всецело зависит от совокупности используемых технологий, поэтому будем рассматривать технологии резервного копирования совместно с технологиями хранения.

3.1. Типы носителей данных Выбор носителей данных непосредственно влияет на главные характеристики процессов создания копий, хранения и восстановления.

С течением времени, появляется масса новых технологий, изменяются технические характеристики носителей, цены за единицу объема, стоимость обслуживания, устаревают форматы хранения данных и интерфейсы устройств. Это обуславливает одну из проблем при хранении данных, ведь зачастую носители заменяются не потому, что закончился их срок службы, а потому, что появляются новые технологии с гораздо лучшими характеристиками или с меньшими эксплуатационными расходами [9].

В системах хранения и резервного копирования чаще других используются три вида носителей данных. Остановимся на каждом из них.

3.1.1. Магнитные ленты Первоначально магнитные ленты (англ. magnetic tape) начали использоваться в 50-х годах, и практически с этого момента этот тип носителей данных является наиболее используемым для архивного хранения данных и резервного копирования.

Современные ленточные накопители могут вмещать до терабайта неупакованных данных (к примеру, DLT-S4, LTO-4, SAIT-2 хранят 800 Гб). Обычно библиотеки магнитных лент используются 10-15 лет до последующей замены на более новые [9].

3.1.2. Жесткие диски Ещ несколько лет назад жесткие диски (англ. hard disk) очень редко применялись в масштабных системах резервного копирования, и практически не использовались при архивировании данных. Соотношение емкости и цены с каждым годом становится все более выигрышным. В настоящее время использование массивов жестких дисков в качестве основных накопителей при хранении данных уже не редкость. По прогнозам ожидается, что в ближайшее время будет наблюдаться постепенный переход от использования магнитных лент в качестве основного носителя к использованию жестких дисков.

По прогнозу IDC общемировой рынок дисковых систем хранения будет продолжать бурный рост, общий объем продаваемых накопителей данных будет увеличиваться на 50% ежегодно [23, 19].

На сегодняшний день капитальные вложения для внедрения систем резервного копирования с использованием жестких дисков выше, чем с применением магнитных лент. В то же время, эксплуатационные расходы сравнимы, а во многих случаях ниже, при использовании решений на базе жестких дисков [3]. Считается, что срок службы массивов активных жестких дисков равен 5-7 годам [9].

3.1.3. Оптические накопители Оптические диски первого и второго поколения, такие как CD и DVD используются повсеместно. Такие оптические накопители имеют срок службы до лет при соблюдении специальных условий хранения [9]. Широкое распространение постепенно получает новое поколение оптических дисков - Blu-ray Disc и HD DVD, имеющих многократно большие емкости. Все же можно с уверенностью сказать, что на сегодня оптические диски довольно плохо подходят для создания массивных хранилищ ни их основе. Все может измениться с появлением новых технологий. Уже существуют прототипы дисков с применением технологии голографической памяти (англ.

holographic memory).

Pages:     || 2 | 3 | 4 | 5 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.