- идентификация системного блока;
- внутренний осмотр;
- проверка работы ядра;
- тестирование оборудования.
Шаг 1. Идентификация системного блока
Этот шаг может быть проведен прямо на складе, где хранятся системники, если позволяет освещение, также потребуется стол и стул для заполнения паспорта. Возможно потребуются расходные материалы для маркировки, а также влажные салфетки или влажная тряпка для предварительной очистки внешних поверхностей. На большинстве предприятий на оборудование наносят инвентарные номера. Если это так, и инвентарные номера хорошо видны, то этого вполне хватит для этого шага. Во всех остальных случаях следует нанести идентификационные данные (например, номер по порядку) на корпус системника, так чтобы легко было отличить один системник от другого. Возможно, идентификационные данные придется продублировать и внутри системника. В паспорт вносим идентификатор (инвентарный номер или номер по порядку), можно также дать имена (марка, модель, если они есть), но это не обязательно. Далее делается внешний осмотр. В принципе градация может быть следующая: удовлетворительный (внешний вид позволяет поставить системник пользователю) и неудовлетворительный (внешний вид не позволяет поставить системник пользователю). Результаты внешнего осмотра вносим в паспорт.
Шаг 2. Внутренний осмотр
Прежде чем начинать внутренний осмотр, требуется очистить системник от пыли. На многих предприятиях сисадмины пренебрегают ежегодной процедурой очистки системников от пыли, поэтому этот шаг в первую очередь посвящен им.
Для этой процедуры потребуется помещение, свободное от сотрудников (можно сделать очистку на улице, если позволяют условия и погода). Помещение должно иметь стол, стул и электрическую розетку, если будет использоваться пылесос. Для этой процедуры потребуются: небольшая малярная кисть, деревянная палочка (можете купить лапшу быстрого приготовления, в комплекте которой есть целых две деревянных палочки), клизма типа груши (типа грелки нам не подойдет) и естественно крестообразная отвертка. Будет очень замечательно, если будет в наличии старый советский пылесос, которым можно было производить побелку, если такого нет, то сойдет обычный. Можно обойтись и без пылесоса, используя клизму, но при больших объемах будут болеть запястья. Можно использовать компрессоры и баллончики со сжатым газом. Потребуются также спецодежда и средства защиты: технический халат (комбинезон), рабочие хб-перчатки, респиратор и защитные очки. Использовать или не использовать средства защиты – решать вам. Кроме этого потребуются следующие расходные материалы: термопаста, тряпка или влажные салфетки.
Снимаем боковую стенку корпуса, после чего кисточкой (салфеткой или тряпкой) очищаем горизонтальные поверхности (не дочиста, а чтобы не пылить). Собранный «мох» желательно поместить в емкость, которую можно сделать из пластиковой бутылки (привет Андрею Александровичу Бахметьеву). Далее очищаем провода и разъемы, идущие от блока питания, отключаем разъемы, отворачиваем и снимаем блок. Снимаем крышку блока питания и очищаем «авгиевы конюшни».
Обращаю ваше внимание, что если вы чистите потоком воздуха, то лучше зафиксировать крылья вентилятора, например, той же самой китайской палочкой. Это делается с целью не повредить двигатель вентилятора и движущиеся части, если этого не делать в лучшем случае вентилятор будет шуметь, а в худшем не будет работать электродвигатель. После очистки блока питания можно визуально осмотреть: конденсаторы на предмет вздутия, остальное на предмет перегорания, результаты осмотра блока питания записать в паспорт. Категорически не рекомендуется использовать блок питания при вздутых конденсаторах или других элементах с признаками перегорания.
Откладываем блок питания в сторону, теперь снимем планки памяти (очень часто они располагаются близко к радиатору, поэтому можно ненароком задеть). Если более 5 лет не менялась термопаста, то лучше снять радиатор с материнской платы, в остальных случаях постарайтесь снять вентилятор с радиатора. Спешка в данном деле приведет к потере времени. Поэтому если сомневаетесь, лучше снять радиатор. Эта процедура может потребовать снятия материнской платы с шасси корпуса, так как некоторые кулеры устанавливаются на подкладку под материнской платой. В этом случае очистка будет произведена более качественно.
После очистки кулера и радиатора не торопитесь устанавливать вентилятор (радиатор) на место, очистите элементы, особенно конденсаторы, располагающиеся рядом с радиатором, и осмотрите их. Результаты осмотра запишите в паспорт. В том числе следует очистить слоты оперативной памяти потоком воздуха (тут то клизма и может пригодиться). Вот теперь можно ставить на место вентилятор (радиатор).
Перед очисткой остальной части материнской платы (если вы не снимали материнскую плату с шасси корпуса), следует отключить все разъемы приводов и жестких дисков, снять все не интегрированные карты и планки (видеокарта, сетевая карта, планка USB и т.д.), так как на следующем шаге нам все равно придется их снимать. Все снятые карты следует очистить, осмотреть, и результаты осмотра, а также модель и марку отметить в паспорте. После очистки осматриваем оставшиеся элементы материнской платы, включая чипсет (на нем достаточно часто бывают микровзрывы, например, в результате короткого замыкания на USB-устройстве).
Если приводы и жесткие диски мешают очистке ниш корпуса, то следует их снять. После снятия привода (жесткого диска) кисточкой очищаем поверхности устройства, делаем осмотр и заносим марку и модель в паспорт. Заканчиваем чистку протиранием влажной тряпкой или салфеткой больших поверхностей с запылением. Перед установкой оперативной памяти чистим контакты резинкой или сухой салфеткой. Перед установкой на место блока питания, проверяем его. Есть несколько вариантов проверки: вариант первый – проверка устройством Power Supply Tester, вариант второй – проверка мультиметром с замыканием зеленого и черного контактов под нагрузкой (например, вентилятор) и вариант третий – подключаем к тестовому (заранее известно, что оно рабочее) оборудованию (в данном случае подойдет материнская плата с процессором и оперативной памятью с таким же разъемом питанием, как и на блоке питания). Результаты заносим в паспорт. Обратите внимание на то, что материнскую плату со вздувшимися конденсаторами лучше не использовать.
Шаг 3. Проверка ядра
Под ядром понимается: блок питания, материнская плата, процессор, оперативная память. Для материнской платы без интегрированного видеоадаптера в состав ядра входит видеокарта. Для выполнения данного шага потребуется стол, стул, источник бесперебойного питания, монитор и клавиатура. Из расходных материалов может потребоваться аккумулятор CMOS (CR2032), и корпусной спикер.
Во время старта слушаем звуковые сигналы из подключенного спикера. Если экран так и не загорелся, пробуем подключить тестовый (заранее известно, что он исправен) блок питания, при отрицательном результате сбрасываем настройки BIOS перемычкой Clear CMOS (Clear BIOS, Clear RTC и т.д.).
Если же ядро «стартануло с одним пиком», то в BIOS смотрим дату на предмет замены батарейки CR2032 (если вы не сбрасывали настройки Clear CMOS), характеристики ядра: модель и скорость процессора, количество ядер, тип и объем оперативной памяти, модель материнской платы. Следует также посмотреть температуру процессора, если процессор сильно греется, то возможно вы неправильно установили кулер.
На этом же шаге слушаем «шумность» вентиляторов. Результаты записываем в паспорт: исправно ли ядро, характеристики ядра, необходимость замены батарейки CMOS и вентиляторов кулера, корпуса и блока питания.
После чего выключаем системник и устанавливаем все снятые карты, подключаем кабели и шлейфы, в общем как до очистки. Пробуем включить в полном снаряженном состоянии. Цель данной меры подготовить системник для тестирования. Возможна такая ситуация, когда какое-либо оборудование начинает «вешать» систему. Тут возможны два варианта, либо блок питания не «осиляет» это оборудование, либо это оборудование неисправно. В обоих случаях мы должны это оборудование отключить, и сделать отметку в паспорте. Если есть возможность, подключите это оборудование на исправную систему с целью проверки его работоспособности.
Шаг 4. Тестирование оборудования
Для выполнения этого шага требуется то же, что и на прошлом шаге плюс: мышь, загрузочный диск с комплектом тестовых программ, сетевой коммутатор или маршрутизатор для проверки работы сетевой карты, колонки для проверки звуковой карты, USB-устройство, например, флешка.
Мы должны протестировать центральный процессор, причем желательно видеть график температуры как самого ЦП, так и материнской платы, а также колебания питания. Нам нужно протестировать оперативную память на наличие битых ячеек и жесткий диск на наличие bad-секторов. Желательно также протестировать чипсет, видеоадаптер и прочие устройства на предмет работоспособности. Лучше всего это сделать с загрузочного диска, так как в этом случае нам не будут мешать службы, автозапускаемые программы и антивирусные программы. Есть и недостаток такого подхода – отсутствие нужного драйвера устройства на загрузочном диске не даст проверить полноценно.
Программ для стресс-тестирования достаточно много, перечислю лишь наиболее известные: AIDA64 (бывшая Everest), SiSoft Sandra, S&M, OCCT. Кроме стресс-тестирования, для проверки оперативной памяти можно использовать старую добрую Memtest86. А вот с программами проверки жестких дисков можно запутаться. Во-первых, лучше воспользоваться официальными программами диагностики от производителей жестких дисков. Во-вторых, до сих пор пользуется популярностью программа проверки диска Victoria, а есть еще одна популярная программа — mhdd. В-третьих, проверка бэд-блоков есть и в других программах, например, универсальной утилите по разбивке диска и восстановления данных — DiskGenius.
Имейте в виду, что тестирование может занять очень много времени. Также следует четко понимать, что если будут успешно пройдены все тесты, то с определенной долей вероятности можно считать оборудование исправным. Поэтому тестировать надо, но без фанатизма. Можно утвердить следующую политику: если стресс-тест пройден успешно, то можно считать оборудование исправным, а специализированными тестами пользоваться только при подозрении. В любом случае, надо быть готовым, что оно в любой момент выйдет из строя. Хотя практика показывает, что старые компьютеры работают более стабильно, чем новые.
Итоги
И так паспорт содержит исчерпывающую информацию о текущем состоянии системного блока, пора принимать решение. Конечно же решение будете принимать вы, здесь же приведены лишь рекомендации. Давайте разделим системники на группы: высший сорт, первый сорт, второй сорт, третий сорт и некондиция. К высшему сорту будут относится системники, имеющие:
- удовлетворительный внешний вид;
- осмотр оборудования — без замечаний;
- малошумящие вентиляторы и кулеры (или замененные);
- характеристики процессора, оперативной памяти и жесткого диска соответствуют оптимальным требованиям к программному обеспечению, используемому на вашем предприятии;
- стресс-тест пройден без замечаний.
Первый сорт отличается от высшего только пунктом: характеристики процессора, оперативной памяти и жесткого диска соответствуют минимальным требованиям к программному обеспечению, используемому на вашем предприятии. Второй сорт от первого отличается только пунктом: характеристики процессора, оперативной памяти и жесткого диска не соответствуют минимальным требованиям к программному обеспечению, используемому на вашем предприятии. К третьему сорту относятся системники с неудовлетворительным внешним видом, с шумными вентиляторами, например, которые нельзя поменять из-за их специфичности, но с исправным ядром, которое успешно прошло тестирование (приводы и жесткие диски могут быть неисправными). Все, что не вошло в предыдущие группы, будет относится к некондиции, которую можно пустить на разбор, то есть снять исправное оборудование.
Третий сорт можно использовать в качестве минисерверов: файерволы, маршрутизаторы, VPN-шлюзы, файлопомойки, будильники и т.д. Или использовать в качестве тестового оборудования. Второй сорт можно использовать вместо терминальных клиентов, либо для нетребовательных к ресурсам рабочих мест. Из системников высшего и первого сортов можно создать подменный фонд.
Подменный фонд может использоваться как временная замена рабочего системного блока с целью снизить или исключить простой сотрудников в случаях:
- выхода из строя;
- подозрения вирусного заражения;
- долговременного обновления программного обеспечения, например, переходе на другую операционную систему;
- плановому обслуживанию, например, чистки от пыли.
Некоторые предприятия позволяют себе создание учебных (тестовых) лабораторий, которые оснащает системниками из первого и высшего сорта. А вот вариант безвозмедной передачи системников сейчас используется редко, наверное, потому что никому такие системники не нужны. Возможно, читатели подскажут еще какие-то варианты использования.
Комментарии (6)
realscorp
29.07.2015 07:41Старые компьютеры десктопного класса, по моему опыту, чрезвычайно склонны к непредсказуемым аппаратным сбоям. И при внешнем осмотре и тестах их выявить обычно очень сложно. Причин может быть множество, основные, как я думаю — деградация характеристик электронных компонентов, особенно конденсаторов, ухудшение состояния электрических контактов и износ жестких дисков.
В общем случае, по моему опыту, замена старых системных блоков (даже при том, что их нормально обслуживали — чистили, меняли термопасту и т.п.) на новые сокращает количество инцидентов в несколько раз, если не на порядок.Maysoft Автор
29.07.2015 09:18Вы абсолютно правы — кривая вероятности выхода из строя железа начинает расти после 3 лет эксплуатации. Весь вопрос — что нам это дает? Сразу после 3 лет эксплуатации менять оборудование? Если вы готовы к выходу из строя железа сразу же в начале эксплуатации этого железа, то что измениться через 3 года? Только вероятность возрастет, но вы должны быть готовы к этому как в начале эксплуатации, так и по истечению 3 лет. Это я к тому, что сокращение количества инцидентов ничего вам не даст. И даже наоборот — снизит значимость системного администратора (ИТ-службы) в глазах коллектива): Если взять особо ответственные рабочие места, то там действительно имеет значение факт снижения количества выходов из строя. Туда ставьте новую технику, но не факт, что она будет работать лучше старой. Как вы думаете, чем сетевое оборудование (которое работает десятилетиями) отличается от пользовательского системника? Оно работает в тепличных условиях, как и сервера. Почему же сервера выходят из строя чаще сетевого оборудования (кстати по статистике сервера выходят из строя чаще десктопных системников, но это потому, что последних на 2 порядка больше, а не потому что системники надежнее)? Потому что там использовались старые проверенные временем технологии, компоненты, решения.
realscorp
29.07.2015 09:57Сразу после 3 лет эксплуатации менять оборудование?
Может, не 3, а 5 лет. Но да — менять.
Если вы готовы к выходу из строя железа сразу же в начале эксплуатации этого железа, то что измениться через 3 года?
Я не зря написал про «аппаратные сбои», а не про выход из строя. Можно было написать понятнее — «глюки». Зависания в случайные моменты времени, «вылетания» прикладного софта, тормоза. Компьютер по факту из строя не вышел, но инциденты начинают случаться не раз в полгода, а пару раз в неделю. Это отвлекает как ИТ-специалистов, во-первых, а во-вторых, усложняет работу пользователям.
И даже наоборот — снизит значимость системного администратора (ИТ-службы) в глазах коллектива
Спорно, на мой взгляд. Если до вас у пользователей «всё вылетало и тормозило», а после вас — они спокойно работают неделями, не испытывая неудовольствия от работы компьютера — то, напротив, вас будут ценить больше. А точки соприкосновения с коллективом всегда найдутся, даже при беспроблемной технике — обслуживание оргтехники, помощь в освоении софта…
. Как вы думаете, чем сетевое оборудование (которое работает десятилетиями) отличается от пользовательского системника?
Качеством компонентов и тщательностью проектирования. Банально используются хорошие, дорогие электролитические конденсаторы, например. А дешевое сетевое оборудование и не работает десятилетиями, как правило. Да даже 5 лет для свитча D-Link домашнего класса — уже достижение.
Почему же сервера выходят из строя чаще сетевого оборудования
А они действительно выходят чаще? Есть статистика?
Даже если и выходят, то, по-моему, из-за большего количества подвижных частей и механических контактов.Maysoft Автор
29.07.2015 13:19Извините не понял, что вы говорите про глюки. Такое оборудование я обычно отсеиваю, чтобы разобраться с ним позже. То есть из терминов статьи — некондиция. Самый наглядный пример — зависания Intel HD Graphics, сразу не понял в чем причина (драйвер, ОС или железо) потом уже разобрался (ставил дешевую видеокарту, чтобы интегрированная не работала) — глюки прекратились. А железо тогда было новое (на гарантии). То есть тут не важно сколько ему лет — сразу в некондицию, так как пользователи не должны из-за этого страдать.
Есть статистика?
Статистика собрана мною с предприятий, которые я обслуживаю, поэтому согласен признать её неверной, но возьмите количество серверов на вашем предприятии в знаменатель, а количество выходов из строя серверов за определенный период (год, 3 года) в числитель — получите какую-то цифру. А теперь сделайте такой же расчет с пользовательскими компьютерами. Я сначала тоже удивлялся, потом понял, что из-за разной размерности (на 1 сервер приходится от 10 до 100 десктопов), так что подвижные части тут ни при чем.
Danov
Maysoft Автор
Возможно вы правы, но не вам и не мне это решать. На конкретном предприятии, при конкретной сложившейся ситуации будет приниматься решение. Мы сейчас с вами можем только предполагать, что затраты на электроэнергию и теплоотведение перекроют стоимость нового устройства. Хочу заметить, что в статье не сказано об экономическом эффекте, то есть что это выгодно, а предлагается варианты решения.