что такое горячая замена
Горячая замена
Горячая замена (англ. Hot Swap — горячая замена и англ. HotPlug — горячее подключение) — термины означающие отключение или подключение электронного оборудования в/к (компьютерной) системе во время её работы без выключения питания и остановки (системы) (HotPlug), а также замену (переподключение) блока в целом (Hot Swap). Также существует термин, обозначающий противоположность горячей замене — Холодная замена, то есть все (пере)подключения производятся после остановки системы и снятия напряжения (остаточного потенциала).
Оборудование делится по этому принципу на допускающее горячую замену и не допускающее.
Содержание
История
Ранее оборудование, предназначенное для подключением во время работы, связанного с заменой, использовалось только в дорогих системах и считалось сложным в проектировании. В последнее время подобные системы стали распространенными даже на недорогих компьютерах.
Конструкция системы
Компьютеры, рассчитанные на замену оборудования «на ходу», должны тем или иным способом определять, что устройство отсоединено, а также содержать электрические цепи, нечувствительные к скачкам напряжения при подключении и отключении. Кроме того, программная часть должна быть рассчитана на внезапную потерю связи с устройством.
Некоторые схемы горячей замены требуют предварительно выполнения команды на отсоединение, что упрощает их конструкцию, однако угрожает целостности данных, если устройство не будет отсоединено правильным способом или в нем возникнет ошибка.
Более сложные схемы обладают запасом избыточности и легко восстанавливают данные при внезапном отключении устройства.
Термин «горячая замена» используется в двух значениях. С одной стороны, он обозначает возможность отсоединить или присоединить устройство без отключения питания. С другой стороны, он также может подразумевать еще и автоматическое определение устройства при подсоединении. Первое значение термина распространяется на интерфейсы RS-232, FireWire и простейшие реализации SCSI, второе значение — на USB, FireWire, PCI Express и сложные варианты SCSI.
Конструкция гнезда
В большинстве современных устройств, допускающих горячую замену, используются подвижные контакты. Один из них делается длиннее других, чтобы первым входить в контакт с присоединяемой частью, через него подключается заземляющий провод. Остальные контакты делаются короче, всего может быть до 3 различных длин. Задержка между подключением первого контакта и последующих составляет от 25 до 250 миллисекунд.
Цепи питания подключаются в две стадии: в первой с помощью более длинных контактов подключается цепь, ограниченная по току, а затем более короткими — питание полной мощности. Все цепи, участвующие в соединении, содержат защиту от статического электричества.
Вот пример типичной последовательности подключения:
Особую трудность представляет соединение нескольких устройств, так как подсоединение второго, третьего устройства может нарушать работу уже подключенного. Для борьбы с этим явлением используют фильтры в выходных цепях или временное логическое отключение передачи данных.
Горячее подключение в программном обеспечении
Термин «горячее подключение» также используется применительно к программному обеспечению и означает возможность изменять программу без остановки ее выполнения. Такую возможность поддерживают лишь несколько языков программирования, включая Lisp, Erlang и Smalltalk. Язык Java поддерживает эту возможность только в процессе работы отладчика (Java Platform Debugger Architecture, JPDA).
Хорошо известным примером функции горячей замены является соединение по универсальной последовательной шине (USB), которое позволяет пользователям добавлять или удалять периферийные устройства, такие как мышь, клавиатура, принтер или портативный жесткий диск. Такие устройства могут быть заменены или заменены в горячем режиме в зависимости от поставщика.
Большинство смартфонов и планшетов с загрузочными лотками могут заменять SIM-карты без отключения питания системы.
Специальные цифровые фотоаппараты и видеокамеры обычно имеют легкодоступные отсеки для карт памяти и батарей, которые можно быстро заменить с минимальным прерыванием работы. Батареи можно циклически перезаряжать путем внешней подзарядки резервных батарей, когда они не используются. Многие фотоаппараты и видеокамеры имеют внутреннюю память, позволяющую производить съемку, когда карта памяти не вставлена.
СОДЕРЖАНИЕ
Обоснование
Системные соображения
Машины, поддерживающие горячую замену, должны иметь возможность изменять свою работу для измененной конфигурации либо автоматически при обнаружении изменения, либо при вмешательстве пользователя. Все электрические и механические соединения, связанные с горячей заменой, должны быть спроектированы таким образом, чтобы ни оборудование, ни пользователь не могли пострадать во время горячей замены. Другие компоненты в системе должны быть спроектированы таким образом, чтобы удаление компонента с возможностью горячей замены не прерывало работу.
Механический дизайн
Защитные накладки, экраны или лицевые панели могут использоваться как на съемных компонентах, так и на самом основном устройстве, чтобы предотвратить контакт оператора с цепями, находящимися под напряжением, обеспечить антистатическую защиту добавляемых или удаляемых компонентов или предотвратить случайное прикосновение съемных компонентов и закорачивание включенных компонентов в рабочем устройстве.
Дополнительные направляющие прорези, штифты, выемки или отверстия могут использоваться для помощи в правильной установке компонента между другими токоведущими компонентами, в то время как механические защелки, ручки или рычаги могут использоваться для помощи в правильной установке и удалении устройств, которые требуют большое количество силы для подключения или отключения, или для помощи в правильном соединении и удержании вместе силовых и коммуникационных разъемов.
Вариации
Некоторые реализации требуют процедуры выключения компонента перед удалением. Это упрощает конструкцию, но такие устройства не являются надежными в случае отказа компонентов. Если компонент удаляется во время его использования, операции с этим устройством завершаются ошибкой, и пользователь несет ответственность за повторную попытку, если это необходимо, хотя обычно это не считается проблемой.
Более сложные реализации могут рекомендовать, но не требуют, чтобы компонент был выключен, с достаточной избыточностью в системе, чтобы позволить продолжить работу, если компонент удален без выключения. В этих системах горячая замена обычно используется для регулярного обслуживания компьютера или для замены вышедшего из строя компонента.
Разъемы
В большинстве современных методов «горячей» замены используется специальный разъем с расположенными в шахматном порядке контактами, так что одни контакты обязательно будут подключены раньше других. В большинстве конструкций с шахматным расположением выводов контакты заземления длиннее, чем у других, что гарантирует отсутствие подключения чувствительных цепей до появления надежного заземления системы. Все остальные штырьки могут быть одинаковой длины, но в некоторых случаях используются три длины штифта, так что входящее устройство сначала заземляется, линии данных подключаются вторым, а питание подается третьим, в быстрой последовательности по мере того, как устройство вставляется. Штыри одинаковой номинальной длины не обязательно контактируют в одно и то же время из-за механических допусков и наклона соединителя при вставке.
Когда-то считалось, что смещенные контакты были дорогим решением, но теперь многие современные семейства разъемов поставляются со смещенными контактами в стандартной комплектации; например, они используются на всех современных последовательных SCSI-дисках. В настоящее время коммерчески доступны специализированные контакты разъема питания с возможностью горячей замены с повторяемыми номиналами прерывания постоянного тока до 16 А. Печатные платы имеют ступенчатые выступы на концах для прямого подключения к разъему объединительной платы в горячем режиме.
Хотя скорость закупоривания невозможно точно контролировать, практические соображения предоставят пределы, которые можно использовать для определения наихудших условий. Для типичной шахматной конструкции штырей, где разница в длине составляет 0,5 мм, время между длинным и коротким контактом штифта составляет от 25 мс до 250 мс. Вполне практично разработать схемы с горячей заменой, которые могут работать с такой скоростью.
Силовая электроника
Типичная последовательность подключения оперативно заменяемого компонента к слоту может быть следующей:
Силовые схемы с горячей заменой теперь можно приобрести на коммерческой основе в специально разработанных ASIC, называемых диспетчерами питания с горячей заменой (HSPM).
Радиопередатчики
В середине 1990-х годов несколько производителей радиопередатчиков в США начали предлагать заменяемые высокомощные транзисторные модули RF.
Повторное внедрение силовых модулей пошло на пользу индустрии радиопередатчиков, поскольку способствовало развитию инноваций. Модульные передатчики оказались более надежными, чем трубчатые передатчики, если передатчик правильно выбран для условий на передающей площадке.
Сигнальная электроника
Схема, прикрепленная к сигнальным контактам в компоненте с горячей заменой, должна включать некоторую защиту от электростатического разряда (ESD). Обычно это делается в виде ограничивающих диодов на землю и на напряжение источника постоянного тока. Эффекты электростатического разряда можно уменьшить за счет тщательного проектирования механического корпуса вокруг заменяемого в горячем режиме компонента, возможно, путем покрытия его тонкой пленкой из проводящего материала.
Программное обеспечение
Горячая замена также облегчает разработку систем, в которых обрабатываются большие объемы данных, как, например, целые геномы в алгоритмах биоинформатики.
Товарные знаки
Термин «HOT PLUG» был зарегистрирован в качестве товарного знака в США в ноябре 1992 г. на компанию Core International, Inc. и аннулирован в мае 1999 г.
Hot Plug — что это в биосе?
Приветствую! Чтобы подключить устройство к ПК, имею ввиду внутреннее — нужно выключать комп. Это логично и правильно. Но бывают ситуации, когда нужно заменить например жесткий диск, не выключая компьютер, часто это необходимо в серверах. Оказывается это возможно — нужно просто включить одну опцию!
Hot Plug — что это такое?
Одна из функций режима AHCI, позволяющая подключать устройство SATA не выключая ПК.
Другими словами — горячее подключение.
На практике это означает, что вы можете к работающему ПК подключить жесткий диск и он сразу определится. Выключать комп необязательно. Но существует еще одна функция — Hot Swap, она нужна уже для горячей замены, и возможно для корректной работы этой функции нужно чтобы Hot Plug был включен. Обычно такие функции используются в серверах, потому что там часто нужно на ходу менять жесткие диски не останавливая сам сервер. Это касается как обычных дисков, так и SSD.
Обычному пользователю такая функция не нужна, потому что чтобы подключать при работающем ПК — нужно чтобы он был разобран. То есть иметь прямой доступ к SATA-кабелю да и.. такой необходимости обычно нет у обычных пользователей.
Тем не менее, все таки советую не экспериментировать и если нужно подключить диск — то делать это при выключенном ПК.
Hot Plug работает только с дисками SATA. Просто раньше был другой интерфейс подключения — IDE, такие диски не поддерживаются.
Вообще AHCI — это режим работы SATA-дисков, при котором доступны дополнительные функции типа очередность команд NCQ, Hot Plug.
Хотя, на форуме IXBT пришли к выводу что функцию Hot Plug нужно включать в любом случае, так как это снижает риск подвисания диска. На форуме Overclockers вычитал что для SSD — особенно включать нужно.
В биосе настройка может быть для каждого порта:
Кстати вот пример специального SSD диска, который можно заменить в ПК как кассету:
Да, серверные компьютеры — у них немного другой корпус, как раз предназначен для удобной быстрой горячей замены дисков.
Заключение
Добавить комментарий Отменить ответ
Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.
Что такое «горячая замена»?
Сам термин «горячая замена» (hot swap — ) означает возможность замены оборудования без остановки сервера. Как правило подразумевается использование такой возможности для замены неисправных элементов системы.
Конечно, это специальные системы и серверы, сконструированные с такой возможностью. В обычном домашнем компьютере без его отключения можно заменить разве что — флэшку, клавиатуру или мышь.
Наверняка, вы слышали о возможности проводить горячую замену жестких дисков в сервере, но это далеко не единственный тип таких устройств (в иностранной литературе этот класс устройств обычно называется hot swappable). Естественно, это должен быть специальным образом сконфигурированный с достаточной избыточностью — тогда замена одного диска не скажется на работе сервера.
Но это далеко не единственный класс устройств, который может быть исполнен в варианте, подразумевающем «горячую замену», такими могут быть и блоки питания, и вентиляторы, и коммутационные разъемы.
В нашем вам на помощь придет услуга «remote hand» и возможности хранить некоторое количество запасных частей у нас — если в вашем сервере, например, вентилятор требует замены, нет необходимости специально ехать к нам.
Наши опытные специалисты готовы по вашему указанию взять новый диск, вентилятор, блок питания из хранимых вами на нашей территории и произвести замену на вашем сервере.
Это сэкономит вам кучу времени и позволит избежать проблем. На всякий случай предупредим, что данная услуга не предоставляется «по умолчанию», и требует указания в контракте.
Надёжность и долговечность серверного оборудования
Решил написать эту статью после знакомства с публикацией «HP, Dell и IBM: компоненты, отвечающие за надёжность сервера», поскольку имею другое мнение насчёт некоторых моментов. Эта статья не претендует на инновационные подходы, а просто описывает полученный опыт и, надеюсь, предотвратит банальные ошибки.
Итак, начнём с того, что попробуем выяснить, зачем бесперебойность и беспрерывность серверам? Собственно, серверам бесперебойность не обязательна, но она нужна сервисам, которые предоставляют эти сервера. Наилучшая беспрерывность обеспечивается только распределёнными системами, которые могут функционировать независимо друг от друга с автоматическим переключением между ними (для скорости) и разнесённые географически (катастрофоустойчивость). Но это выдвигает особые (не всегда реализуемые) требования к программному обеспечению. Недостатками таких решений являются повышеная стоимость, проблемы с репликацией данных, передача состояния для бесшовного переключения на резервную систему. Дополнительными плюсами является то, что при правильной реализации системы, возможно повышение быстродействия — клиенты делятся между двумя или более локациями, а при сбое перераспределяются.
Но есть задачи, настолько критичные и специфические, что требуют особой бесперебойности серверов, для них делают особые сервера, например менфреймы, с возможностью горячей замены всех компонентов, включая процессоры, память и даже материнские платы. Но такие решения стоят гораздо дороже обычных серверов и те кто их покупает — понимаю зачем это надо.
Вернёмся к серверам начального и среднего уровней. Существенно повышает беспрерывность работы серверов возможность горячей замены компонентов.
Горячая замена блоков питания
В моей практике, сгоревших БП (блоков питания) было немного, но наличие в сервере hot-swap БП, подключённых по схеме N+N во многих случаях существенно увеличивает бесперебойность работы сервера. Если в сервере больше двух БП, то зачастую реализована схема N+1, что не позволяет питать сервер от двух независимых источников или линий питания. Электропитание с подачей в стойку двух независимых линий повышает бесперебойность в самых различных ситуациях, например при обслуживании или аварии систем энергообеспечения в датацентре. Был случай, в сервере вышел из строя БП и создал короткое замыкание, что привело к срабатыванию защиты PDU и его отключению, соседние сервера с БП по схеме 1+1, подключённые также к другому PDU продолжили работу. Резервирование БП позволяет изменять подключение сервера к сети энергообеспечения, не прерывая его работу, например, оптимизировать укладку кабелей (конечно, правильно укладывать кабеля надо при установке сервера, но мы живём в не идеальном мире).
Вопреки заблуждению сертификация 80 Plus указывает на энергоеффективность блока питания, и не обязывает производителя к обеспечению какого либо уровня надёжности.
Также резервирование БП предотвращает большинство проблем связанных с кабелями питания. Плохой контакт некачественных кабелей, случайное их выдергивание персоналом при работах. Если у вас сервер с одним блоком питания, использование для него качественного и неизношенного кабеля, который плотно устанавливается в гнездо, и при нагрузке не издаёт посторонних звуков (потрескивание) более важно — невозможна замена без остановки сервера. В случае сервера с резервированными БП, плохой контакт кабеля может привести к выходу блока питания из строя.
Горячая замена дисков
Горячую замену дисков можно производить практически со всеми вариантами интерфейсов. Конечно, есть и некоторые ограничения.
IDE устройства редко переносят отключение/подключение второго устройства на шлейф — велик риск пропадания работающего устройства из системы. Главная проблема интерфейса IDE в правильной обработке операционной системой этого события. Так как интерфейс IDE не предусматривает горячей замены, в большинстве случаев необходимо вручную запустить сканирование устройств для определения нового оборудования. Важный момент — интерфейс подключается/отключается к обесточенному диску (подключение: сначала интерфейс, потом питание, отключение: сначала питание, потом интерфейс).
ОТКАЗ ОТ ОБЯЗАТЕЛЬСТВ: выполняя отключение/подключение устройств IDE Вы делаете это на свой страх и риск — никто не гарантирует сохранение работоспособности оборудования, и стабильность работы ОС.
Интерфейсы FC, SAS, SATA (AHCI) — поддерживают горячую замену дисков в полном объеме, проблемы могут быть в операционной системе. Если дисковый контроллер SATA находится в режиме совместимости IDE — то, возможно, понадобится вручную запустить сканирование шины. В режиме AHCI в большинстве случаев диск определится автоматически. Рекомендую использовать AHCI, если ваша ОС это позволяет, т.к. этот режим также повышает производительнось диска; TRIM поддерживается только в этом режиме работы контроллера.
При отключении дисков для продления срока их службы рекомендую предварительно отключать их программным методом и извлекать после остановки шпинделя, т.е. через примерно 30 секунд после выключения для дисков 7200RPM. Если диск невозможно отключить программно и он установлен в hot-swap корзинке, рекомендую вытащить диск на минимальное расстояние, при котором диск будет отключен, подождать остановки шпинделя и извлечь окончательно. В большинстве систем — это расстояние полностью отведённой ручки корзинки. Конечно, эти действия не несут практического смысла, если диск вышел из строя, но, возможно, он просто «завис» и вам не поменяют его по гарантии и придется использовать в некритичном оборудовании.
Так же важно понимать, что диск находится в составе RAID или как отдельное блочное устройство. При использовании отдельного диска необходимо предварительно его отмонтировать для избежания сбоев в работе ОС и программного обеспечения. Даже если диск не используется в текущий момент, после извлечения примонтированого диска зачастую наблюдаются лаги всей ОС. Конечно же, диск, на котором установлена ОС, извлечь без «зависания» не получится.
Большинство серверов позволяет подсветить индикатором диск по команде с сервера, по возможности пользуйтесь этой функцией, для минимизации ошибочных извлечений дисков. Например на серверах SuperMicro номер корзинки указан на самой корзинке, и может не совпадать с номером слота на бэкплейне. Такая-же проблема есть у многих производителей.
Так же перед отключением желательно получить информацию о диске (модель, объем, серийный номер) для сопоставления сразу после извлечения диска. Во многих случаях при ошибочном извлечении другого диска это позволит устранить ошибку сразу, а иногда даже предотвратить сбой в работе или потерю данных.
В случае использования RAID-массивов, рекомендую отключать диски программно (помечать как сбойные), перед извлечением это устранит снижение производительности дисковой системы сразу после отключения диска.
Проблем с SSD дисками при частом горячем подключении/извлечении не заметил, хотя использовал несколько именно в таком режиме.
На этом первая часть заканчивается, в следующей частях про RAID массивы, память для серверов, системы удалённого управления и про важность мониторинга.