Влияние рабочих нагрузок на жесткие диски на совокупную стоимость владения

Twitter Facebook Linked in

Загрузить в формате PDF

Введение
Объем цифровых данных, создаваемых ежегодно, растет в геометрической прогрессии, поэтому увеличивается спрос на устройства для хранения. Несмотря на недавнюю популярность твердотельных устройств для хранения данных (SSD), подавляющее большинство цифровых данных по-прежнему хранится на магнитных записывающих носителях, а именно на жестких дисках, которые являются основой практических всех центров обработки данных. Кроме того, большие центры обработки данных сегодня используются в самых разных отраслях, в частности в здравоохранении, розничной торговле и производстве. Они обеспечивают интерактивный поиск, выполнение покупок, общение в социальных сетях и другие решения, предлагаемые отраслью ИТ.

Независимо от того, построен ли центр обработки данных как набор СХД высшего класса с избыточностью данных, реализованной на аппаратном уровне в виде массивов RAID, или же он оснащен бюджетным оборудованием, а избыточность данных реализована на программном уровне (обеспечивается глобальной распределенной файловой системой), отказы и замены дисков обходятся дорого и могут значительно увеличить совокупную стоимость владения центром обработки данных. Из результатов анализов, проводимых в отрасли, следует, что расходы в каждом случае составляют от 100 до 300 долл. США и учитывают отказ, техническое обслуживание, ремонт, замену оборудования и т. д.1,2

В среде, где растут требования к производительности вычислений и емкости хранения, совокупная стоимость владения становится основным показателем практически для любого оператора центров обработки данных. В совокупную стоимость владения обычно входят все расходы, связанные со строительством и эксплуатацией центра обработки данных, например капитальные и эксплуатационные затраты, стоимость оборудования и программного обеспечения, а также администрирование, техническое обслуживание и ремонт центра обработки данных. Надежность жестких дисков наряду с надежностью другого оборудования центра обработки данных значительно влияет на эксплуатационные расходы, связанные с техническим обслуживанием центра обработки данных.

Вопреки некоторым наблюдениям, жесткие диски являются одними из самых надежных аппаратных компонентов центра обработки данных. Например, серверы, используемые для хранения данных и вычислений, содержат множество других компонентов, которые ограничивают надежность системы в большей степени, чем жесткие диски. Среднее время наработки на отказ вентиляторов охлаждения обычно составляет около 100 тыс. часов. Среднее время наработки на отказ для блоков питания серверов, как правило, оценивается в 400 тыс. часов. Такие компоненты гораздо менее надежны, чем типичный жесткий диск быстрого доступа, среднее время наработки на отказ которого составляет более чем 1000 тыс. часов.

Разумеется, в центре обработки данных (или внутри типичного сервера) может располагаться гораздо больше дисков, чем вентиляторов или источников питания. Большее количество дисков, естественно, повышает вероятность того, что один из них рано или поздно выйдет из строя и будет требовать замены.

К счастью, есть несколько факторов, которые могут помочь оператору центра обработки данных.

Во-первых, опыт компании Seagate показывает, что надежность жесткого диска очень зависит от условий эксплуатации, определяемых и контролируемых оператором центра обработки данных. Один из двух, на первый взгляд, идентичных дисков может стать в пять раз менее надежным, если его поместить в неблагоприятную рабочую среду. Поэтому оператор центра обработки данных может настраивать рабочую среду, повышая надежность при минимальной совокупной стоимости эксплуатации.

Во-вторых, компания Seagate производит различные типы дисков, предназначенные для отличной работы в разных условиях эксплуатации: в настольных системах, системах быстрого доступа и системах непрерывного доступа. Компания Seagate понимает, что необходимо для повышения надежности, и разработала ряд рекомендаций, призванных обеспечить максимально высокий ее уровень.

На практике существует множество разных способов эксплуатации (и нагрузки) дисков в центре обработки данных. Главные параметры нагрузки на жесткий диск — это время эксплуатации, рабочая температура и рабочая нагрузка пользователя. Каждый из этих параметров можно представить как функцию, зависящую от архитектуры центра обработки данных (включая топологию, конструкцию сервера, общую емкость для хранения в центре обработки данных и ее использование, виртуализацию, баланс рабочей нагрузки и т. д.) и приложений конечного пользователя (общего объема данных, передаваемых в обоих направлениях, скорости передачи данных в зависимости от времени и т. д.). Давайте проанализируем отдельно важность времени эксплуатации, рабочей температуры и рабочей нагрузки пользователя на надежность.

Время эксплуатации
Влияние времени эксплуатации на надежность жесткого диска довольно легко представить.

Приведенное здесь простое математическое уравнение показывает, как время эксплуатации и надежность продукта, выраженная в виде среднего времени наработки на отказ, в совокупности определяют вероятность отказа компонента. По мере увеличения времени эксплуатации увеличивается и интегральная вероятность отказа.

Интегральная вероятность отказа (частота) = 1−e−время/среднее время наработки на отказ

Итак, чем меньше времени устройство включено, эксплуатируется и используется, тем ниже вероятность его отказа.

На деле ожидается, что время использования жестких дисков в настольных системах составит в среднем около 2400 часов включенного состояния в год, что соответствует приблизительно 6,5 ч/день. Наши ожидания в отношении сред быстрого доступа и сред непрерывного доступа таковы: диск будет использоваться 100 % времени (24 часа в день), т. е. будет включен 8760 часов в год. Разумеется, мы ожидаем, что нагрузка у дисков быстрого доступа и непрерывного доступа будет более высокой. Поэтому при разработке и тестировании жестких дисков конструкция и тестовые протоколы подбираются в соответствии с ожидаемыми условиями эксплуатации, включая время, температуру и рабочую нагрузку.

Температура напряжения
Высокая температура также отрицательно сказывается на надежности практически всех электронных и электромеханических устройств, в том числе жестких дисков. Интенсивность отказов, как правило, быстро возрастает с повышением температуры, согласно общеизвестному уравнению Аррениуса. Влияние температуры на надежность и среднее время наработки на отказ понятно и всегда учитывается при проектировании и тестировании диска. Проверенное правило: поддерживать как можно более низкую температуру жестких дисков в пределах диапазона, указанного для продукта. Типичный диапазон рабочей температуры для жестких дисков составляет от 5 до 60 °C независимо от выбранного типа диска. В любом плане повышения надежности жестких дисков в центре обработки данных следует учитывать затраты на обеспечение эффективного охлаждения.

Рабочая нагрузка
Понять, как рабочая нагрузка влияет на надежность, несколько сложнее.

По определению, главная функция жестких дисков заключается в хранении и извлечении данных, при этом на каждом квадратном дюйме поверхности для хранения находятся сотни Гбит данных. Диски могут записывать и извлекать данные со средней скоростью передачи данных приблизительно 200 МБ/с или больше.

Такая высокая плотность записи и передачи данных достигается благодаря тому, что магнитные компоненты чтения и записи находятся на расстоянии нескольких нанометров (1 нм = 0,001 мкм) от быстро движущегося вращающегося носителя. Это сложная техническая конструкционная задача, обусловливающая необходимость проектирования, тестирования и классификации дисков для конкретной рабочей среды с определенным диапазоном времени эксплуатации и пользовательской рабочей нагрузки, а также другими факторами.

Рабочая нагрузка — это инженерный термин, обозначающий степень рабочего напряжения, которому подвергается диск во время обычной эксплуатации. Например, диск А может считывать и записывать несколько ГБ данных ежедневно, а другой диск такой же конструкции, диск Б, может считывать и записывать несколько сотен ГБ данных каждый день. В этом случае можно сказать, что напряжение диска Б ввиду рабочей нагрузки гораздо выше.
Чтобы получить представление о том, какая рабочая нагрузка является слишком большой, рассмотрим ниже три типичных сценария (диски А, Б и В).

К примеру, возьмем жесткий диск Seagate Constellation ES.3 емкостью 4 ТБ. Этот диск поддерживает скорость передачи данных прибл. 175 МБ/с. Предположим, что все три таких диска работают в одинаковых условиях в одном сервере. Первый диск (диск A) постоянно передает данные со скоростью 5 МБ/с (в среднем 158 ТБ/год), а второй (диск Б) — со скоростью 10 МБ/с (в среднем 315 ТБ/год). Наконец, третий диск (диск В) передает данные со скоростью 100 МБ/с (в среднем 3150 ТБ/год).

Из приведенных выше сценариев легко увидеть, что напряжение из-за рабочей нагрузки диска Б в 2 раза, а диска В — в 20 раз выше, чем напряжение диска А.

Считая зависимость линейной, придем к следующим обоснованным выводам: предположим, что интенсивность отказов диска Б будет в 2 раза, а диска В — в 20 раз более высокой, чем у диска А. Тем не менее, данные Seagate свидетельствуют о том, что считать зависимость интенсивности отказов от рабочей нагрузки линейной неверно.

В результате многолетних исследований и экспериментов инженеры Seagate научились определять сложное влияние рабочей нагрузки на надежность диска и пришли к заключениям, перечисленным ниже.

  • У каждого типа жесткого диска имеется конкретный порог безопасной рабочей нагрузки, который теперь определен как лимит рабочей нагрузки.
  • Пока рабочая нагрузка не превышает лимит, напряжение из-за рабочей нагрузки практически не влияет или вообще не влияет на интенсивность отказов и надежность изделия.
  • Когда лимит рабочей нагрузки превышен, надежность изделия начинает снижаться.

Поэтому очень важно знать, каково действительное напряжение центра обработки данных из-за рабочей нагрузки, и выбирать соответствующие жесткие диски. В таблице 1 приведены рекомендации Seagate по выбору самых подходящих дисков для различных сред центров обработки данных.

Таблица 1. Рекомендации по выбору жестких дисков с учетом рабочей нагрузки

Рабочая нагрузка Рекомендуемый класс продукта Лимит рабочей нагрузки, ТБ/год
Низкая Диски с быстрым доступом (для низких нагрузок) < 180
Высокая Диски с быстрым доступом < 550

Предположим, что все диски, А, Б и В, были дисками быстрого доступа. Следовательно, надежность дисков А и Б будет почти одинаковой (обе рабочие нагрузки не превышают лимит, 550 ТБ/год). Что касается диска В, то его средняя рабочая нагрузка 3150 ТБ/год значительно превышает рекомендуемый лимит для дисков быстрого доступа, поэтому риск отказа в этом случае более высок.

С помощью этой таблицы операторы центра обработки данных могут выбрать правильный тип жестких дисков, соответствующий рабочей нагрузке. Выполнение рекомендаций способствует обеспечению максимально возможной надежности используемых жестких дисков и снижению долгосрочной совокупной стоимости владения.

На рис. 1 видно, что диски А и Б относятся к одной безопасной зоне и не подвержены ускоренному разрушению из-за рабочей нагрузки. Напротив, диск В работает за пределами рекомендуемых лимитов рабочей нагрузки, поэтому его надежность может снизиться.

hdd-workload-tco-500x318.jpg

Заключение
Совокупная стоимость владения — один из основных показателей практически для всех операций центра обработки данных.

Надежность жесткого диска может негативно отразиться на совокупной стоимости владения в целом, если используемые диски не соответствуют рабочим условиям центра обработки данных. Помимо времени использования и температуры операторам центра обработки данных при выборе жестких дисков настоятельно рекомендуется учитывать прогнозируемую рабочую нагрузку и ее влияние на надежность.

Seagate предоставляет четкие указания по правильному выбору жестких дисков для любой среды рабочих нагрузок в центре обработки данных. Поддержание низкой температуры жестких дисков в пределах указанного диапазона, а также соблюдение характеристик времени использования и рабочей нагрузки — вот необходимые условия обеспечения долгосрочной надежности диска и снижения совокупной стоимости владения. Следование таким указаниям должно обеспечить максимально возможную надежность диска и минимально возможные расходы, связанные с заменой, техническим обслуживанием и тестированием жестких дисков.

Автор: Андрей Хуршудов, кандидат наук. Моделирование облачных систем и аналитика данных, Seagate Technology.

Ресурсы

  1. The Datacenter as a Computer: An Introduction to the Design of Warehouse-Scale Machines, Luiz André Barroso and Urs Hölzle, 2009 (Центр обработки данных как компьютер: введение в проектирование машин уровня хранилищ данных. Луис Андре Баррозо и Урс Хельцле, 2009)
  2. Characterizing Cloud Computing Hardware Reliability, Kashi Venkatesh Vishwanath and Nachiappan Nagappan, SoCC’10, June 10–11, 2010, Indianapolis, Indiana, USA (Определение надежности вычислительного оборудования для облаков. Каши Венкатеш Вишванатх и Начиаппан Нагаппан, SoCC’10, 10–11 июня 2010 г., Индианаполис, Индиана, США)
  3. http://www.seagate.com/internal-hard-drives/enterprise-hard-drives/hdd/enterprise-capacity-3-5-hdd/

 

Twitter Facebook Linked in