Техническая библиотека CITForum.ru CITKIT.ru - все об Open Source Форумы Курилка
Все новости / Все статьи Деловая газета - шквал(!) IT-новостей :: CITCITY.RU
Первая полоса ИТ-Инфраструктура Телекоммуникации Безопасность BI Интеграционные платформы КИС IT-бизнес Ширпотреб Точка зрения

18.07.2018

Новости:


Все новости

ИТ-Инфраструктура

Организация совместного пользования данными

Зачастую пользователи, выбирая ту или иную топологию системы хранения данных, не предполагают о наличии других вариантов организации подобной системы. Однако соответствующая информация могла бы помочь им построить по-настоящему оптимизированную среду для работы приложений при меньших затратах и/или эффективнее организовать процесс управления системами хранения информации. При выборе топологии обычно руководствуются преимуществами, которые она может обеспечить для работы конкретного приложения. При этом часто упускаются из вида возможности топологии в плане организации совместного использования ресурсов хранения данных.

Популярные виды топологий систем хранения включают в себя DAS (система хранения, непосредственно подключаемая к серверу), SAN (сети хранения данных), NAS (сетевая система хранения, т. е. подключаемая не к серверу, а к сети). Большие симметричные мультипроцессорные вычислительные системы (SMP) предполагают использование собственных топологий. Это связано с развитыми возможностями конфигурирования и масштабирования SMP-систем.

Кластеры процессоров (в данном случае сами по себе серверы и их внутренняя организация не рассматриваются) с кластерной файловой системой, возможно, представляют наименее понятные типы современных топологий «процессор – система хранения данных». Основные достоинства кластерных топологий:

  • совместное использование данных разными приложениями;
  • хорошая поддержка инкрементальной модели вычислений;
  • существенно меньшая потребность в администрировании;
  • лучшая, чем у NAS-устройств, масштабируемость и производительность;
  • невысокая стоимость пользования.

Непосредственно подключаемые системы хранения – DAS

Топология непосредственно подключаемого хранилища данных подразумевает наличие хост-компьютера и диска (или дисковой подсистемы). Осуществляется прямое соединение хоста и дискового хранилища (рис. 1).  Работающие на хост-компьютере приложения получают доступ к данным на диске при помощи файловой системы. Менеджер томов представляет логические номера устройств (Logical Unit Number, LUN) в виде доступного для файловой системы пространства хранения данных. Некоторые приложения умеют извлекать данные непосредственно из устройств хранения, минуя файловую систему (например, базы данных с прямым доступом к блоковому хранилищу данных).


Рис. 1. Типичная топология DAS, непосредственно подключаемая система хранения данных

В данной реализации DAS-приложения могут совместно пользоваться данными, одними и теми же томами, файловой системой, оперативной памятью. Производительность приложений ограничена только мощностью процессора и производительностью дискового хранилища данных.

Сети хранения данных (SAN)

Сети хранения данных имеют как сходства с DAS, так и определенные различия (рис. 2). Аналогично DAS, приложения на хост-сервере в сети хранения совместно пользуются файловой системой, связанной с этим хостом. Например, приложение, связанное с производством, и приложение, связанное с финансовой деятельностью, на сервере Хост 1 могут пользоваться файлом данных электронных таблиц в файловой системе 1. Но, в отличие от DAS, в SAN можно обратиться к файлу электронных таблиц, который физически размещается на любой содержащей файловую систему 1 дисковой подсистеме. На рис. 2 показано несколько файловых систем, причем каждая из них относится к определенному работающему с ней хосту. Файловые системы могут быть виртуализированы на нескольких SAN (дисковая подсистема 1, 2 и 3).


Рис. 2. Типичная топология SAN (сеть хранения данных) и возможности совместного доступа к данным

Приложения

Хотя устройствами SAN и можно пользоваться совместно, доступ к файловым системам возможен только с тех хостов, которым данная файловая система принадлежит.

Причина простая: сердцем файловой системы является нечто, напоминающее каталог карточек в библиотеке. Называется это «метаданными» и является единственным способом определения физического местоположения нужного файла на диске. Без помощи каталога карточек (часто это компьютерная база данных) найти в библиотеке нужную книгу непросто. Только хост-сервер имеет доступ к метаданным своей файловой системы. Именно поэтому другие хосты не могут «знать», как добраться до файлов в не принадлежащих им файловых системах. Различные тома в дисковых системах  разделяются с целью предотвращения доступа файловых систем к не принадлежащим им логическим номерам (LUN).

Симметричные мультипроцессорные системы (SMP)

В симметричных мультипроцессорных решениях для выполнения приложений используется несколько процессоров.

С точки зрения приложения хост SMP идентичен хосту DAS. В обоих случаях приложения могут совместно пользоваться файлами из файловой системы. Приложения совместно пользуются также оперативной памятью, что, в зависимости от типа первого, и соотношения числа операций чтения и записи, может существенно ускорить совместную работу приложений. Процессы захвата (блокирования) файлов в архитектурах SMP выполняются с огромной скоростью (захватом файла в многозадачных и сетевых ОС называется метод контроля целостности данных, не позволяющий двум программам одновременно изменять содержимое файла: при выполнении операции записи в файл доступ к нему блокируется для записи из других программ). В отличие от DAS, SMP-системы могут в реальном времени делить между процессорами нагрузку, создаваемую приложениями. Поэтому они обладают вычислительной мощностью нескольких однопроцессорных систем. Так как каждый процессор, во-первых, имеет высокоскоростной доступ к кэшируемым совместно используемым данным и, во-вторых, доступ к одним и тем же данным в той же файловой системе, то SMP-система в случае, когда приложения должны взаимодействовать на уровне файловой системы, будет обладать большей производительностью. Кроме того, мультипроцессорные топологии можно сконфигурировать для получения более высокой производительности и балансировки создаваемой приложениями нагрузки между несколькими процессорами. Хост-сервер SMP можно также поделить на несколько виртуальных машин.

Кластеры процессоров

Кластеры процессоров собирают из нескольких процессорных узлов. Показания к постройке кластера:

  • Необходимость высокой доступности – в этом случае узлы кластера напоминают множественные DAS; совместное использование данных узлами не требуется.
  • Организация совместного доступа к данным – улучшение возможностей совместного пользования данными разными приложениями. Можно получить многие из возможностей организации совместного доступа, присущих SMP-решениям, причем с гораздо лучшим масштабированием, чем у DAS-систем. (В качестве узлов при строительстве кластера можно использовать SMP-системы.) Для достижения этого уровня совместного доступа к данным требуется наличие кластерной файловой системы (CFS).
  • Получение высокой производительности – совокупная производительность многих узлов кластера.

Кластеры можно масштабировать до получения максимальной производительности. Для нормальной работы приложений на нескольких узлах кластера порой требуется масштабируемость систем хранения, присущая только SAN. Кроме того, резервирование межсоединений (требуется для систем высокой готовности) легко получить с помощью резервированной коммутирующей среды SAN. В кластерах высокой готовности (когда отдельная файловая система находится на каждом узле) обычно поддерживается дублирование данных. Это нужно для того, чтобы «выживший» узел мог иметь доступ к «тем же» данным, что и узел, вышедший из строя.

С появлением CFS (кластерной файловой системы) отпала необходимость в «зеркалировании», или репликации данных в другую файловую систему, так как каждый узел, где работают приложения, имеет доступ к файлам на других узлах кластера. Механизм просмотра (метаданные) для кластерной файловой системы может быть централизован (асимметричные метаданные), или равно распределен между узлами (распределенные метаданные) в целях оптимизации производительности при масштабировании. И наконец, конфликты доступа к файлам могут разрешаться централизованно или в распределенном между узлами кластера виде.  

Системы хранения, подключаемые к сети, и файловые серверы

Сетевые хранилища (NAS) и файловые серверы построены по сходной архитектуре. Системы NAS отличаются от традиционных файловых серверов лишь тем, что NAS специально созданы и настроены только для работы с файлами. Традиционные файловые серверы являются серверами общего назначения и выполняют одну задачу: сделать хранимые файлы доступными для сетевых клиентов. Файловые серверы работают с сетевыми файловыми протоколами (NFS и CIFS), что обеспечивает совместное использование данных сетевыми клиентами и связанными с ними приложениями. А NAS-устройства в общем случае не предоставляют поддержки работы приложений, потому что они ориентированы только для работы с файлами в сети, а приложения должны исполняться на серверах приложений или сетевых клиентах. NAS-устройства часто работают под управлением собственной или специализированной операционной системы и могут иметь собственную файловую систему. В некоторых случаях даже применяются специализированные аппаратные средства и/или аппаратные ускорители выполнения сетевых протоколов. И как результат, NAS-устройства обычно обладают большим быстродействием по сравнению с файловыми серверами. Недостатком NAS является то, что приложение не может быть локальным для такого устройства. Кроме того, некоторая потеря производительности при обработке сетевых протоколов (например, NFS в сети TCP/IP) может сделать NAS-устройства непригодными для обслуживания приложений с высокой интенсивностью операций ввода/вывода и приложений, которым требуется организация скоростного доступа к совместно используемым данным.

Для каждого типа организации совместного пользования данными существуют свои преимущества. В таблице 1 приведено сравнение топологий по следующим параметрам:

  • соотношение простоты и стоимости администрирования;
  • производительность и масштабирование;
  • функциональная совместимость (интероперабельность) с другими системами и приложениями;
  • простота и скорость совместного доступа к данным;
  • стоимость и использование стандартных компонентов;
  • пригодность для инкрементальных вычислений.

Таблица 1. Сравнение топологий организации совместного доступа к данным
Топология Достоинства Недостатки
DAS Относительно небольшие затраты за счет использования стандартных промышленных компонентов.
Простая и понятная настройка.
Могут выполнять приложения и выступать
в качестве файлового сервера.
Относительно высокая производительность внутри DAS-«островка» при небольших затратах.
Наименее гибкая из всех типов топологий организация совместного доступа к данным.
Меньшая, чем для NAS, производительность при выполнении файловых функций.
Большая нагрузка на администраторов
и высокая стоимость сопровождения/
поддержки.
Для организации совместного доступа требуется репликация данных. Это ведет
к дополнительным затратам
на администрирование и хранение реплицированных данных.
Наличие «островков» DAS ведет
к неэффективности использования ресурсов хранения.
Очень сложно организовать резервное копирование на центральное ленточное устройство.
SAN Есть совместный доступ к устройствам хранения (но не к данным).
Поддержка централизованного скоростного резервного копирования.
Лучше всего подходит для инкрементальной модели построения вычислительной системы («плати-по-мере-необходимости»).
Можно объединить системы хранения в пул (лучшая масштабируемость, эффективность
и простота управления).
Относительно высокоскоростной доступ
к данным.
Дает приложениям возможность доступа
к системам хранения разного класса.
Хост-системы SAN могут выполнять приложения и в то же время выполнять функции файловых серверов.
Помогает интеграции в гетерогенной среде.
Нет совместного доступа к данным
от приложений на разных хостах (только совместный доступ к устройствам хранения). Так же, как и для DAS, организация совместного пользования данными требует их (данных) репликации.
Устройства, выполняющие ключевые функции в сетях хранения данных, очень дороги.
Крупные SMP Позволяют предоставить вычислительную мощность нескольких процессоров одному или нескольким приложениям.
Эффективности вычислений способствует возможность распределения процессорных ресурсов между несколькими приложениями и/или процессами.
Возможность выполнения технических/ научных приложений (класс приложений, которые требуют наличия больших объемов памяти и нескольких процессоров).
Высокоскоростной совместный доступ приложений к данным при помощи механизмов совместного пользования памятью и файловой системой.
Встроенная защита от сбоев.
Очень высокая стоимость решений и очень дорогая поддержка от изготовителей.
Серьезно проигрывает по соотношению цена/производительность процессорным кластерам (где есть CFS и используются стандартные промышленные компоненты)
на большинстве приложений.
Не вписывается в модель инкрементальных вычислений, так как сразу надо покупать дорогую платформу SMP с заведомо большей, чем в данный момент требуется, вычислительной мощностью.
Процессорные кластеры С позиций невысокой стоимости и высокой производительности напоминает DAS.
Так же, как SAN, обладают масштабируемостью ресурсов хранения
и производительности, вписываются
в модель инкрементальных вычислений, есть возможность объединения в пул свободных ресурсов хранения. Придают SAN дополнительную управляемость.
Аналогично крупным SMP могут обладать защитой (устойчивостью) от сбоев, функциями высокоскоростного совместного доступа к данным и могут выполнять технические/научные приложения класса HPC (высокопроизводительные вычисления).
Могут выполнять функции файловых серверов и вместе с тем выполнять приложения.
Соответствуют инкрементальной модели вычислений.
Как и NAS, разрешают совместное использование данных для сотен работающих в сети приложений. Превосходят NAS-системы
по производительности и возможностям наращивания емкости.
Не эффективны с точки зрения вложенных средств, если предполагается только поддержка работы файловых служб в сети Ethernet,
а производительность и масштабирование емкости не очень важны.
Не эффективны для нишевых приложений, где нужен единый большой массив памяти.
NAS и файловые серверы Файловые серверы выполняют приложения
и поддерживают работу файловых служб.
Простая инсталляция и/или организация сетевого хранения данных.
Меньшая, чем для всех остальных систем, производительность из-за сетевых файловых протоколов.
Нет гибкости – NAS-системы не могут выполнять приложения.
Множественные «островки» NAS создают дополнительную административную нагрузку, уменьшают эффективность использования ресурсов хранения и затрудняют централизованное резервное копирование.
Неэффективный захват файлов в некоторых файловых протоколах.

Выводы

Так как каждый способ организации совместного пользования данными имеет свои сильные и слабые стороны, то одни топологии лучше приспособлены для определенной среды (приложений), чем другие. В таблице 2 приведено сравнение топологий с точки зрения соответствия требованиям приложений общего назначения и специализированных приложений. Каждой топологии присвоен определенный рейтинг в зависимости от степени соответствия потребностям специализированных приложений и приложений общего назначения.

Таблица 2. Типы организации совместного доступа и потребности приложений. Рейтинг по пятибалльной системе.

Анализ преимуществ различных топологий

При анализе соотношения преимуществ того или иного способа организации совместного пользования данными к стоимости были получены следующие данные.

DAS. Невысокие затраты благодаря применению стандартных процессоров и устройств хранения данных. Является «островком» центра обработки данных, требует интенсивного администрирования. Применение может быть неэффективно, так как «островки» не могут объединять в пул неиспользуемые в данный момент вычислительные ресурсы и ресурсы хранения.

Сложно организовать совместное пользование данными разными приложениями. Часто требуется наличие нескольких ленточных устройств. Невозможно централизованное управление и скоростное централизованное резервное копирование. Стоимость владения высока, и требуется больше системных администраторов.

SAN. Стоимость низкая – средняя, в зависимости от доступности стандартных промышленных компонентов и стоимости подключения к сети SAN (для оценки стоимости SAN используют уровень стоимости одного порта – отношение полной стоимости всех компонентов SAN к общему количеству портов). Прямой доступ к данным от разных хост-платформ негативно отразится на управлении системой. Это связано с тем, что хост-платформы могут совместно пользоваться только устройствами хранения, а не самими данными.  Нет возможности объединения в пул неиспользуемых ресурсов файловых систем. Это может привести к неэффективности работы сети.

NAS. Надежные устройства, имеют простое управление и легко позволяют сотням сетевых приложений осуществлять совместное пользование данными. Правда, производительность NAS-устройств невелика. Причина — в файловых протоколах (NFS, CIFS). Нет возможности прямого выполнения приложений (т. е. приложение нельзя запустить на самом NAS). Нет возможности простыми способами объединить в пул свободные ресурсы хранения нескольких NAS-«островков». Удобный совместный доступ к данным от клиент-серверных приложений, хотя из за сетевых протоколов производительность невысокая. Стоимость выше, чем у широко распространенных устройств, так как вендоры стараются предлагать полные законченные программно-аппаратные решения. Трудности с масштабированием и недостатки DAS-топологии (невозможность консолидации ленточных и серверных ресурсов, неэффективное использование емкости систем хранения).

Кластеры (с CFS и SAN). Обладают относительно невысокой стоимостью благодаря использованию стандартных промышленных компонентов (процессоров, устройств хранения). Обеспечивается высокоскоростной совместный доступ приложений к данным. Объем сети хранения увеличивается, а благодаря CFS осуществляется нормальный совместный доступ к данным. Производительность существенно выше, чем у NAS, плюс дополнительные достоинства «встроенных» функций высокой надежности и относительной простоты управления как для одиночной файловой системы.

Итак, можно сказать, что каждый тип топологии «процессор – система хранения» имеет право на существование, но используется только для работы в определенных средах (приложений).



IT News

Последние комментарии:

Самое интересное:


© 2004–2009 Проект CITCITY.ru