Режим обслуживания vSAN c использованием Ensure Accessibility. Отличие RAID-1 и RAID-5.

В статье Режим обслуживания (maintenance) в 2-Node Direct Connect vSAN configuration я предупреждал о возможных проблемах при включении режима обслуживания на хосте, который отмечен как “preferred fault domain” (предпочтительный домен ошибок) в двухузловом кластере vSAN подключенном по схеме Direct Connect. А сегодня  в своей статье vSAN Maintenance Mode – RAID-1 and RAID-5 using “Ensure Accessibility» рассказал о поведении vSAN с RAID-1 и RAID-5  при вводе нескольких хостов в режим обслуживания — Maintenance Mode (EMM) с ограниченными ресурсами.

Когда кластер vSAN переводится в режим обслуживания доступны три опции:  “Full data migration,” “Ensure accessibility,” и “No data migration.”. Наиболее часто используется “Ensure accessibility” (Обеспечить доступность), и этой опции  уделил внимание в своей статье.

Ключевым фактором является то, что происходит, когда существует ограниченное количество физических хостов или доменов ошибок. Для простоты в приведенных ниже примерах будет использоваться объект VMDK объемом 30 ГБ в кластере vSAN с 5 хостами с  FTT 1 и будет сравниваться поведение между методом отказоустойчивости (FTM) RAID-1 и RAID-5.

Понимание опции «Ensure Accessibility»

Перед вводом хоста в режим обслуживания vSAN определит, сможет ли достаточное количество компонентов, составляющих объект, оставаться доступными после того, как хост завершит процесс EMM (Maintenance Mode). Выбрав «Ensure Accessibility», пользователь решил принять меньший уровень отказоустойчивости в интересах минимизации времени и перемещения данных, сохраняя при этом доступность объекта.

Даже если есть другие хосты для повторной синхронизации данных для обеспечения полной отказоустойчивости, выбор «Ensure Accessibility» не будет выполнять никакой дополнительной операции повторной синхронизации, если объект остается полностью доступным после вывода хоста из эксплуатации. Диспетчер объектов vSAN будет смотреть это состояние и ждать 60 минут (по умолчанию), прежде чем он попытается инициировать любые повторные синхронизации, чтобы восстановить уровень устойчивости, первоначально назначенный политикой.

Опция «Ensure Accessibility» в полностью доступном кластере.

На рисунке 1 мы видим поведение входа хоста в режим обслуживания для объекта RAID-1 при выборе «Ensure Accessibility». В этом случае vSAN признал, что нет необходимости вносить какие-либо корректировки, поскольку данные будут оставаться доступными, но менее устойчивым.

Рисунок 1. Объект RAID-1. Событие EMM с полностью доступным кластером

В отличие от зеркала RAID-1, когда устойчивость создается путем создания копии объекта (иногда называемой «реплика»), stripe RAID-5 в vSAN состоит из не менее 4 компонентов, распределенных по 4 хостам. Все 4 компонента содержат данные с четностью и имеют подразумеваемый FTT 1. Как и в примере на рисунке 1, vSAN понимает, что доступ к хосту, содержащему один компонент объекта RAID-5, по-прежнему имеется в этом состоянии и повторная синхронизация для восстановления полной отказоустойчивости до истечения 60 минут выполняться не будет. В кластере vSAN с 5 объектами, использующими RAID-5, событие EMM будет выглядеть так, как показано на рисунке 2. vSAN признает, что нет необходимости вносить какие-либо корректировки, поскольку данные остаются доступными, но менее устойчивыми.

Рисунок 2. Объект RAID-5. Событие EMM с полностью доступным кластером

В обоих случаях «Ensure Accessibility» не приводило к перемещению данных, но поддерживало доступность объекта.

Вариант EMM «Ensure Accessibility» с уменьшенной устойчивостью, но доступны другие ресурсы

Если дополнительный хост перешел в режим обслуживания, используя «Ensure Accessibility», vSAN определит, нужно ли перемещать данные, чтобы оставаться доступными, и, если нужно, будет произведено перемещение компонентов этой реплики на другой хост в кластере. На рисунке 3 показано это поведение с RAID-1, где устойчивость уже ухудшена, но для объекта существуют другие хосты.Рисунок 3. Объект RAID-1. Событие EMM с пониженной устойчивостью, но доступны другие ресурсы

В случае RAID-5 vSAN переместит один из этих компонентов на свободный хост, сохраняя доступный stripe, при этом пониженная устойчивость все еще сохраняется.Рисунок 4. Объект RAID-5. Событие EMM с пониженной устойчивостью, но доступны другие ресурсы

В этих примерах «Ensure Accessibility» привело к перемещению данных для поддержания доступности объекта. Доступность объекта может быть сохранена, поскольку для хранения данных имеются доступные хосты.

Вариант EMM «Ensure Accessibility» с уменьшенной устойчивостью и недостаточными ресурсами

Следующие два примера предназначены исключительно для изучения того, как vSAN обрабатывает данные в этом крайнем случае и не являются процедурами, которые будут использоваться в производственной среде. Это просто проверяет поведение, которое vSAN использует для поддержания доступности, когда устойчивость уже ухудшена из-за того, что другие хосты находятся в режиме обслуживания или работают с чрезвычайно маленькими кластерами.

В этих условиях поведение объекта RAID-1 и объекта RAID-5 различается. Для конфигурации RAID-1 на рисунке 5 нет изменений в доступности данных, так как один объект может находиться на одном хосте.

Рисунок 5. Объект RAID-1. Событие EMM с ухудшением устойчивости и недостаточными ресурсами

С объектами RAID-5 (и RAID-6) vSAN будет соблюдать инструкцию «Ensure Accessibility» и сделает он это весьма своеобразно. vSAN понимает, что он не может поддерживать доступность объекта только двумя из четырех доступных компонентов, поэтому до события EMM он будет перестраивать этот объект в один объект RAID-0. На рисунке 6 показан этот результат.

Рисунок 6. Объект RAID-5. Событие EMM с ухудшением устойчивости и недостаточными ресурсами

Для этого назначенного объекта RAID-5 мы видим использование Monitor> vSAN> Virtual Objects, в котором объект указывает на эффективный уровень защиты RAID-0. В этом примере объект состоял только из одного компонента (размером всего 30 ГБ), но гораздо больший объект мог состоять из нескольких компонентов.

Рисунок 7. Объект RAID-5 перестроен на RAID-0 при выборе «Ensure Accessibility» с недостаточными ресурсами

Обратите внимание, что vSAN не изменил предполагаемую политику RAID-5 . В этом случае он принимает инструкции по обеспечению доступности данных. Когда дополнительные хосты вернутся в сеть, vSAN повторно синхронизирует данные, чтобы удовлетворить требование применяемой политики. Метка «RAID-0» представляет собой эффективное условие «отсутствия устойчивости», а не желаемое условие, определяемое политикой хранения.

Этот пример демонстрирует упрощенным образом, как vSAN будет управлять stripe RAID-5 при удалении нескольких хостов с ограниченными ресурсами. Включение нескольких хостов в режим обслуживания в одном кластере vSAN, особенно с ограниченными ресурсами, не рекомендуется. Это может привести к ненужному трафику синхронизации ресинхронизации, уменьшению ресурсов критически важных ресурсов и предотвращению достаточного количества доменов отказов для хранения политик хранения.

Запуск кластера с не более чем одним хостом в режиме обслуживания является хорошей практикой для любого вида деятельности по обслуживанию. Сопоставьте это с предлагаемой практикой запуска кластера vSAN с хотя бы одним хостом, чем минимум, требуемый политиками хранения, и это позволит vSAN автоматически восстанавливать уровни отказоустойчивости во время запланированных или незапланированных отключений.

Резюме

При вводе хоста в режим обслуживания выбор «Ensure Accessibility» следует рассматривать как гибкий способ размещения обновлений хоста и его перезапуска. Запланированные события, такие как операции режима обслуживания и незапланированные события, такие как сбои в работе хоста, могут привести к тому, что условие политики хранения будет отличается от заданной политики. vSAN постоянно контролирует это, и когда ресурсов становятся достаточно для выполнения правил политики, он будет соответствующим образом корректировать данные.

Читайте также:

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

Добро пожаловать в блог IT-пилот

Введите Ваш Email чтобы подписаться

Подписка оформлена!