0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Архивация данных: кому она нужна и чем отличается от резервного копирования

Архивация данных: кому она нужна и чем отличается от резервного копирования

По оценкам IDC, объем данных в мире, подлежащих хранению, растет со скоростью около 50 % в год. При этом примерно 80 % из них являются архивными, т. е. должны храниться долгое время и не требуют постоянного доступа к ним. В России эти цифры, возможно, даже больше – вследствие законодательства об информационной безопасности, требующем хранить сетевой трафик в течение длительного времени. Поэтому системы архивации в настоящее время приобретают особую актуальность.

Резервное копирование (backup)

Резервные копии нужны для восстановления утраченной или испорченной информации. Также резервное копирование применяется для архивирования (сохранения данных для использования их в будущем).

Копировать можно:

  • отдельные файлы;
  • группу файлов, объединенных по какому-то признаку;
  • операционную систему;
  • диски или разделы дисков (посекторно или поблочно);
  • виртуальные машины

Виды резервного копирования

Существует несколько видов резервного копирования.

Полное резервное копирование

Во время полного резервного копирования сохраняются все данные. Когда старые бэкапы теряют актуальность, они удаляются целиком, чтобы освободить место. Такое резервное копирование требует много дискового пространства на носителе для резервной копии. Полное резервное копирование занимает много времени и, и поэтому проводится в нерабочее время. Такой способ позволяет сохранить важную информацию, но из-за больших сроков копирования он не очень подходит для восстановления быстро меняющихся данных. Полное резервное копирование для больших объемов рекомендуется сочетать с другими видами создания бэкапов: дифференциальным и инкрементным копированием

Статья в тему:  Проблемы с динамиками в скайпе

Дифференциальное копирование

Дифференциальное создание резервной копии – это копирование только тех файлов, которые были изменены с момента последнего полного копирования. Это позволяет уменьшить объем данных на резервном носителе и при необходимости ускорить процесс восстановления данных. Так как дифференциальное копирование обычно производится гораздо чаще, чем полное, оно очень эффективно, так как позволяет восстанавливать те данные, которые подвергались изменению совсем недавно, и отслеживать изменения файлов с момента полного копирования.

Инкрементное копирование

Этот вид копирования отличается от дифференциального тем, что при первом запуске инкрементного копирования происходит создание резервных копий только тех файлов, которые были изменены с тем пор, как в последний раз выполнялся полный или дифференциальный бэкап. Последующие процессы инкрементного копирования добавляют только те файлы, которые подверглись изменению с момента предыдущего резервирования. При этом изменившиеся или новые файлы не замещают старые, а добавляются на резервный носитель отдельно. Конечно, в этом случае процесс восстановления занимает больше времени, так как нужно последовательно восстановить всю историю изменений файлов.

Время резервного копирования

Для того чтобы правильно планировать резервное копирование, необходимо рассчитать два показателя: RPO и RTO.

RPO (recovery point objective) – это максимальный период времени, за который могут быть потеряны данные в результате аварии. Например, у нас есть информационная система, и если произойдет авария, и мы готовы ее восстановить за один час. Это значит, что за этот час новые данные не будут поступать в нашу информационную систему, и RPO равняется часу. Эти данные невозможно восстановить из резервной копии, потому что они не поступали в информационную систему. Показатель RPO говорит нам, как часто делать резервные копии нашей системы. На основании RPO мы можем выбрать нужную систему резервного копирования и какие технологии применять, чтобы вписаться в этот промежуток времени. Можно ли свести его к нулю? Можно, если использовать два хранилища, которые работают зеркально.

Статья в тему:  Через что открывать mdf. Как открыть файл Mdf

RTO (recovery time objective) — это промежуток времени, в течение которого система может оставаться недоступной в случае аварии. Например, в серверной произошла авария, и мы хотим, чтобы система была снова доступна через час. Это и есть значение RTO. Мы должны создать такой план аварийного восстановления, чтобы за этот час восстановить работоспособность информационной системы на резервном оборудовании или площадки.

Мало рассчитать это время, еще необходимо убедиться в том, что и система резервного копирования, и план аварийного восстановления позволяют достигнуть этих значений. То есть необходимо произвести тестовое восстановление на копии реальных данных.

Инструменты резервного копирования

Все инструменты резервного копирования можно поделить на следующие группы:

  • Встроенные инструменты
  • Бесплатные программы
  • Коммерческие системы
  • Облачное резервное копирование

Встроенные инструменты резервного копирования

Современные операционные системы уже включают в себя инструменты резервного копирования. Например, для Windows, начиная с Microsoft Vista, доступна программа Windows Backup And Restore (Архивация и Восстановление). Эта программа позволяет создавать полный бэкап операционной системы с возможностью инкрементного копирования. Windows Backup And Restore позволяет создавать автоматический полный бекап на сменный носитель, оптические диски или в специальное место на удаленном сервере.

Для копирования небольшого количества файлов и каталогов часто используется команда xcopy. Эту команду можно использовать с планировщиком Windows.

Для UNIX-систем самой популярной программой резервного копирования файлов является утилита rsync. Оно обладает богатыми возможностями, включая инкрементное резервное копирование, обновление всего дерева каталогов и файловой системы, как локальных, так и удаленных резервных копий, сохранение прав доступа к файлам, ссылок и многое другое.

Статья в тему:  Домены первого уровня. Домены верхнего уровня

Также имеет графический пользовательский интерфейс Grsync, но главное преимущество с Rsync заключается в том, что резервные копии могут быть автоматизированы с использованием сценариев и заданий cron системными администраторами прямо в командной строке.

Бесплатные и платные программы резервного копирования

Существует множество бесплатных и платных программ резервного копирования, которые можно легко найти в интернете. Большинство из них копируют файлы и каталоги, некоторые из них позволяют произвести резервное копирование виртуальных машин и осуществить посекторное копирование носителей.

Главное – это перед использованием на реальных данных проверить на тестовой копии тех же самых данных. Кроме того, необходимо проверить можно или восстановить данные из архива.

Облачное резервное копирование

Существуют решения, которые позволяют копировать в облако не только данные, но и целые виртуальные машины. Так

Такие системы, как CommVault или Veeam позволяют делать резервные копии в облако для:

  • образов виртуальных машин,
  • конфигураций операционных систем,
  • баз данных,
  • файлов, размещенных на серверах и рабочих станциях.

При резервном копировании в облако через сеть Интернет особенно важно учитывать значения RPO и RTO, так как каналы с Интернет обычно достаточно медленные.

Если ваша виртуальная инфраструктура размещена в облаке, то облачный провайдер может предложить услугу резервного копирования. В таком случае потребителям не потребуется искать, выбирать, покупать и устанавливать программное обеспечение.

Для резервного копирования достаточно в панели управлении включить услугу в разделе Backup, затем выбрать период хранения резервных копий и нажать на кнопку Изменить.

Статья в тему:  Firewall какой лучше. Выбираем брандмауэр

Ключевые слова

Несколько терминов, связанных с резервным копированием, которые полезно знать.

Облако — компьютер где-то в интернете, на котором хранятся какие-то данные или исполняются какие-то приложения. Применимо к резервному копированию: можно хранить часть своих бэкапов в облаке, то есть на компьютере где-то в интернете. Так делают сервисы типа Dropbox и Яндекс-диск.

Версионирование — это когда вы сохраняете не только самую свежую копию проекта, но и несколько предыдущих его версий. Например:

  • диплом-01-05-2020.doc
  • диплом-02-05-2020.doc
  • диплом-03-05-2020.doc
  • диплом-27-05-2020.doc
  • диплом-финал.doc
  • диплом-финал2.doc
  • диплом-финал99_точно-финал7.doc

И всё это великолепие лежит у вас на внешнем диске. Если что, всегда можно вернуться за копией недельной давности и дёрнуть оттуда пару нужных ссылок, которые ты уже успел удалить. Это очень полезная техника бэкапов, когда вы работаете над большим проектом, где многое меняется.

Все версии проекта, который идёт с конца августа 2019 года. Видно, когда по этому проекту шла работа, насколько часто там что-то происходило. Интересно, что название проекта никто так и не удосужился написать

Зеркало — полная копия компьютера или сервера. Как правило, делается автоматически: например, каждую ночь ваш компьютер может делать полный «слепок» файловой системы и складывать его на зеркальный жёсткий диск.

Time Machine — если у вас Мак, в него встроена эта система резервирования: она делает так, чтобы у вас была резервная копия всей системы со всеми файлами, а ещё сверху хранит их старые копии. Можно заглянуть в свой курсач двухнедельной давности. Или, если у тебя сегодня случайно удалился файл, можно будет посмотреть на эту папку в Time Machine и найти этот файл во вчерашней версии.

Статья в тему:  Ноутбук hp не заходит в bios. Как зайти в биос на ноутбуке hp

Избыточность — насколько много у вас резервных копий данных. Обычно для спокойной работы нужно две копии, одна из которых физически вынесена из того места, где вы работаете. Например:

  • исходный файл у вас на ноутбуке в офисе;
  • первая резервная копия на внешнем жёстком диске;
  • вторая резервная копия в облаке Яндекса.

Если враги вынесут всю технику и жёсткие диски из офиса, у вас останется резервная копия у Яндекса.

Рядом с ноутбуком — небольшой NAS от компании Synology. В прямоугольных отсеках стоят жёсткие диски, на них происходит резервное копирование

NAS — network attached storage, сетевое хранилище. Это коробочка, в которой стоят жёсткие диски. К ней можно подключиться по локальной сети и сливать на неё свои бэкапы, в том числе в автоматическом режиме. Полезно, когда у вас в офисе несколько компьютеров и всем нужно хранить где-то бэкапы.

RAID — система, которая помогает делать избыточные копии данных и защищает от сбоёв жёстких дисков. У вас может быть четыре жёстких диска, объединённых в RAID-массив. Если один из них сломается, его можно будет восстановить по кусочкам данных с других дисков. Всё это автоматически.

Флешка. Самый простой способ сделать бэкап — скопировать важные файлы на флешку и убрать её в шкаф. Шкаф нужен для того, чтобы в случае отказа питания или шумной вечеринки флешка точно осталась нетронутой.

Статья в тему:  Триколор список регионов недоступен – что делать

Облачное хранилище Dropbox: в 2020 году автор статьи осознал, что у него там хранятся бэкапы аж с 2010 года. 10 лет работы аккуратно заархивировано и доступно для изучения!

Архив. Бэкап актуален, когда ты работаешь над проектом каждый день и тебе нужна защита от сбоёв прямо сейчас. Бэкапы делаются каждый день, дважды в день или даже раз в час, зависит от интенсивности работы. Но когда проект сделан и выпущен, эти бэкапы уже не нужны, нужны бэкапы следующего проекта.

А вот архив — это про долгосрочное хранение. Сделал ты проект, сдал и теперь хочешь, чтобы он сохранился лет на 50, чтобы в старости можно было перебирать воспоминания. Вот это архив.

Требования к архиву отличаются от требований к бэкапу. Архив должен быть нерушимым и рассчитанным на десятки лет. Флешки и компакт-диски для архивов не подходят — они деградируют и «сыпятся». Магнитные жёсткие диски нужно периодически «обновлять».

Печатная копия — дедовский метод архивирования: распечатываешь всё, что человек может прочитать, и хранишь в папке, папка в сейфе, сейф в архиве, архив в подземном бункере. Это не имеет отношения к регулярной работе, просто такой способ сохранить ценную информацию на много лет вперёд. Текущие рабочие проекты так не резервируют, но когда работа сделана, можно и заархивировать на печатной копии.

Статья в тему:  Включить кукисы. Быстрое включение cookies в браузере Opera

Печатные копии особенно актуальны для фотографий: вангуем, что через 20 лет вы уже десять раз смените телефоны, и фотографии из 2020-х у вас не сохранятся. А если дома лежит альбом с распечатанными фотографиями, то он сможет погибнуть только в случае пожара. Осторожнее с кальянными углями!

Ссылка на основную публикацию
Статьи c упоминанием слов:

Adblock
detector