CRYPTO MINING PRO
Как отремонтировать хэш-плату Antminer S19K Pro?
I. Платформа технического обслуживания/инструмент/требования к подготовке оборудования
1. Требования к платформе
Антистатический ремонтный стол (рабочий стол должен быть заземлен), антистатический браслет и заземление.
2. Требования к оборудованию
Термостатический паяльник (350–380 градусов Цельсия), штраф-кончик наконечник паяльника для пайки небольших резисторов и конденсаторов SMD; термофен, BGA переделочная станция для удаления и пайки чипов/BGA; мультиметр, паяльная сталь иглы, покрытые термоусадочной трубкой для удобства измерения (рекомендуется Fluke); осциллограф, кабель Ethernet (требования: для подключения к Интернету, стабильная сеть).
3. Требования к инструментам тестирования
Блок питания APW12, кабель адаптера питания (сделай сам: подключи положительные и отрицательные клеммы блока питания к хэш-плате с помощью толстых медных проводов, рекомендуется 4AWG, с длиной медного провода в пределах 60 см, ограничено PT1 и использованием для тестирования ремонта); испытательное приспособление для хэш-плат с использованием плат управления V2.1 или V2.3 (номер детали испытательного приспособления ZJ0001000004). На положительных и отрицательных клеммах испытательного прибора должны быть установлены разрядные резисторы, рекомендуется использовать цементные резисторы 20 Ом, 100 Вт или выше.
4. Требования к вспомогательным материалам/инструментам для ремонта
Паяльная паста, флюс, жидкость для очистки плат, смешанная с безводным спиртом; очиститель плат для очистки остатков флюса после ремонта; теплопроводящая силиконовая смазка для нанесения на поверхность чипа после ремонта; оловянные посадки трафарет (для чипов размером 6 мм*7 мм), поглощающая припой проволока; при замене новых чипов необходимо залудить выводы чипа перед их пайкой на хэш-плату, равномерно нанести теплопроводящий гель на поверхность чипа перед фиксацией большого радиатора.
5. общий ремонт запасным материалам требования
Резисторы 0402 (0R, 33R, 51R, 10K, 4.7K); 0402 конденсаторы (0,1 мкФ, 1 мкФ)
SMD резистор, 33 Ом, 1%, 1/20 Вт, R0201 (0603)
Резистор, 10 кОм, +/-1%, 1/16 Вт, 0402
Резистор, 0 Ом, 5%, 1/16 Вт, 0402
SMD керамический конденсатор, 100 НФ, 6,3 В, 10%, X5R, C0201 (0603)
II. Требования к ремонту
1. При замене чипов обратите внимание на технику. После замены любых компонентов PCB не должна быть заметно деформирована. Проверьте, что нет отсутствующих компонентов, разомкнутых цепей или коротких замыканий в замененных деталях и их окружении.
2. Ремонтный персонал должен обладать определенным уровнем знаний в области электроники и иметь более одного года опыта ремонта, а также владеть методами пайки корпусов BGA/QFN/LGA.
3. После ремонта хэш-плата должна быть тест более двух раз и быть в порядке, прежде чем она может быть пройдена.
4. Проверьте, что инструменты и испытательное приспособление работают правильно, подтвердите параметры программного обеспечения для тестирования ремонтной станции, версии испытательного приспособления и т. д.
5. После ремонта и замены чипов тестирование должно сначала пройти проверку PT1, а затем перейти к функциональному тестированию. Функциональные тесты должны гарантировать, что радиатор BSM припаян правильно, перед тестированием PT3. При использовании шасси для отвода тепла необходимо одновременно вставить 2 хэш-платы для формирования воздушного канала, а одностороннее тестирование на производство конец также должно гарантировать формирование воздушного канала (важно).
6. При измерении сигналов используйте 4 вентилятора для охлаждения, поддерживая вентиляторы на полной скорости.
7. При включении хэш-платы сначала необходимо подключить отрицательный медный провод источника питания, затем положительный медный провод и, наконец, сигнальный ленточный кабель. При разборке порядок должен быть обратным: сначала отсоедините сигнальный ленточный кабель, затем положительный медный провод и, наконец, отрицательный медный провод. Несоблюдение этого порядка может легко привести к повреждению таких компонентов, как U1 и U2 (отсутствующие чипы). Перед тестированием паттерна отремонтированную хеш-плату необходимо остудить; в противном случае это может привести к сбою теста (PNG).
8. При замене новых чипов необходимо нанести печатные штырьки и паяльную пасту, чтобы убедиться, что чип предварительно облужен перед пайкой на PCB для ремонта.
9. Все тестеры на ремонтной стороне используют Test_Mode и тестируются в режиме сканирования. После прохождения теста производственная сторона начинает с первой станции тестового кабеля и продолжает обычную сборку и старение (сборка на том же уровне).
10. Для модели BHB56902 чип использует технологию BSM, что означает, что поверхность чипа покрыта медью, а радиатор напрямую припаян к чипу с помощью олова. Во время ремонта сначала необходимо снять радиатор с чипа. Отрегулируйте температуру термофена до 400 градусов по Цельсию, расположите сопло примерно на 0,5 см выше радиатора и нагревайте в течение 15 секунд, чтобы снять радиатор. Затем, используя ту же температуру и метод, обдуйте радиатор на противоположной стороне чипа. Используя ту же температуру и время, вы можете снять радиатор с противоположной стороны PCB. Наконец, припаяйте чип, используя обычный метод.
11. Для ремонта PT1 и замены чипа или компонентов вокруг чипа важно очистить поверхность чипа от любого остаточного флюса. В противном случае на этапе BSM это может привести к недостаточному припою и ненормальной пайке.
III. Изготовление и меры предосторожности испытательного приспособления
Испытательное приспособление должно способствовать охлаждению хэш-платы и облегчать измерение сигналов.
1. Номер детали: ZJ0001000004 Испытательное приспособление.
2. Для первого использования испытательного приспособления серии 19 используется SD-карта для прошивки программы для обновлений ПЛИС на плате управления испытательного приспособления. После декомпрессии, скопируйте ее на SD-карту и вставьте карту в слот джиг; включите питание примерно на 1 минуту и подождите, пока индикатор платы управления не мигнет дважды, трижды, чтобы завершить обновление; (отсутствие обновления может привести к постоянному сообщению о конкретном дефекте чипа во время тестирования).
Рисунок 3-1
3. Для изготовления SD-карты без радиатора: используйте программа ПТ1 для ремонта, требующего сканирования. Как показано в пояснении к снимку экрана, удалите файл config.ini по умолчанию, и тестирование должно проводиться посредством сканирования. Во время измерения техническим специалистам необходимо обеспечить охлаждение PCBA, чтобы предотвратить перегрев платы во время тестирования и измерений.
Рисунок 3-2
IV. Обзор принципа
1. Рабочая структура хэш-платы BHB56902:
Хэш-плата состоит из 77 чипов BM1366BS, разделенных на 11 групп (доменов), каждая группа состоит из 7 IC. Чипы BM1366, используемые в хэш-плате BHB56902, работают при напряжении домена приблизительно 1,15 В. 10-я и 11-я группы (всего 2 группы) питаются от выходного 19В из цепи повышения U178 к MP2019, который обеспечивает питание LDO через MP2019 U166, U163; что приводит к выходным напряжениям LDO 1,2 В и 0,8 В для этих двух доменов (рисунок 4-5), тогда как питание для LDO остальных доменов поступает от входного напряжения предыдущего домена, что позволяет им выводить 1,2 В и 0,8 В (рисунок 4-6).
Рисунок 4-1
2. Температурная цепь: она состоит из двух датчиков температуры на стороне BOT, один на входе воздуха и один на выходе воздуха, питаемых от 3,3 В. Они подключены к разъему J450 через шину I2C SCL, SDA. Если есть температурная аномалия, сначала определите, находится ли она на вход или выход воздуха, и устраните неисправность соответствующей цепи. Схема показана на рисунке 4-3.
3. Сравнение хэш-платы BHB56902 и модели 42612: хэш-плата BHB56902 добавляет 10 сдвигателей уровня для выполнения операций сложения сигналов, используемых от второго домена до последнего, как показано на схеме с синей рамкой. 0–9 сдвигатели уровня питаются от напряжения предыдущего домена (рисунок 4–4).
4. Охлаждение каждого чипа 1366: каждый чип 1366 имеет свой собственный радиатор, который необходимо хорошо припаять с обеих сторон. Плохой контакт может повлиять на охлаждение, что приведет к частоте развертки PT NG.
Рисунок 4-2
Принципиальная схема датчика температуры:
Рисунок 4-3
Схематическая схема уровень_шифтер IC (скриншот 1):
Рисунок 4-4
MP2019 предоставляет принципиальную схему источника питания LDO 1,2 В и 0,8 В (скриншот 1 группы):
Рисунок 4-5
Схематическая схема LDO 0,8 В и 1,2 В (скриншот 1 группы):
Рисунок 4-6
Повышающий преобразователь питается от источника питания напряжением от 15 В до 19 В, как показано на рисунках 4-7 и 4-8.
Рисунок 4-7
Рисунок 4-8
5. Маршрутизация сигнала для чипа на хэш-плате BHB56902:
Поток сигнала CLK (XIN): Генерируется кварцевым генератором Y1 25 МГц, передается от чипа 01 к чипу 77.
Поток сигнала RST: Поступает с контакта 3 порта ввода-вывода, затем передается от чипа 01 к чипу 77.
Поток сигнала CI: Поступает с контакта 7 порта ввода-вывода, затем передается от чипа 01 к чипу 77.
Поток сигнала RX (RI, RX): От чипа 77 к чипу 01.
Поток сигнала BO (BI, BO): От чипа 01 к чипу 77.
Рисунок 4-9
6. Общая архитектура:
Вся машина в основном состоит из 3 хэш-плат, 1 платы управления, блока питания APW121215 и 4 вентиляторов охлаждения (26000 об/мин + 27000 об/мин), как показано на рисунке 4-10.
Рисунок 4-10
V. Распространенные неисправности хэш-платы и шаги по их устранению
1. Симптом: Тест одной платы обнаруживает 0 чипов (станция PT1/PT3)
Шаг 1: Сначала исследуйте выход источника питания.
Шаг 2: Проверьте выход домена напряжения. Если есть источник питания на 15 В, напряжения домена обычно присутствуют; в первую очередь измерьте выход клемм питания хэш-платы.
Шаг 3: Проверьте выход схемы повышения напряжения; контрольные точки C56, 57 должны показывать 19-20 В (как показано на рисунке 4-8).
Шаг 4: Проверьте выход LDO 1,2 В или PLL 0,8 В каждой группы.
Шаг 5: Проверьте выходы сигнала чипа (CLK/CI/RI/BO/RST). Обратитесь к описанным диапазонам значений напряжения для направления сигнала. Если во время измерения обнаружено значительное отклонение значений напряжения, сравните его со значениями, измеренными в соседних группах, чтобы принять решение. (См. 5-2)
Рисунок 5-2
2. Симптом: Неполное обнаружение микросхемы на одиночная плата (станция PT1/PT3)
1) Когда на LCD-дисплее отображается ASIC NG: (0), сначала измерьте общее напряжение домена и проверьте, являются ли нормальными 20 В повышающей цепи. Затем используйте зонд короткого замыкания, чтобы замкнуть контрольную точку RX между первой и второй чип и контрольной точкой 1V2, и запустите программу поиска микросхем. Наблюдайте за журналом последовательного порта; если он по-прежнему находит 0 микросхем, может присутствовать одна из следующих проблем:
a-1) Используйте мультиметр, чтобы измерить, являются ли нормальными диод или импеданс 1V2 и 0,8 В LDO на стороне. Измерьте напряжение при включении, чтобы увидеть, составляет ли оно 1,2 В или 0,8 В. Если нет, то это может быть связано с проблемой схемы LDO 1,2 В или 0,8 В в этом домене; плохой пайкой основного чипа в этом домене, коротким замыканием, вызванным фильтрующими конденсаторами SMD 0,8 В или 1,2 В, или проблемами с IC схемы LDO, такими как холодные паяные соединения, ложная пайка, повреждение материала, сломаться чипа, сломаться LDO и т. д.
a-2) Проверьте, нет ли каких-либо аномалий в схеме U5, таких как холодные паяные соединения на резисторах.
a-3) Проверьте, нет ли коротких замыканий, вызванных перемычками припоя между радиатором BSM и окружающей областью чипа.
a-4) Проверьте, нет ли на первом чипе нераспаянных контактов (бывали случаи ремонта, когда со стороны казалось, что пины припаяны; но при снятии чипа обнаружилось, что пины вообще не припаяны).
2) Если на шаге а) вы нашли 1 чип, это означает, что первый чип и предыдущая схема работают правильно. Продолжайте аналогичным образом для устранения неполадок последующих чипов. Например, закоротите контрольную точку 1V2 между 23-м и 24-м чипами и контрольную точку RX. Если журнал находит 23 чипа, то с первыми 23 чипами проблем нет; если он все еще находит 0 чипов, сначала проверьте, нормально ли 1V2. Если 1V2 в норме, проблема в чипа после 23-го. Продолжайте устранение неполадок, используя метод двоичного поиска, пока не будет идентифицирован неисправный чип. Предположим, что N-й чип неисправен, тогда при закорачивании 1V2 и RX между N-1 и N-м чипами можно найти N-1 чипов, но при закорачивании 1V2 и RX между N и N+1 чипами можно найти не все чипы. 3) Если на ЖК-дисплее отображается ASIC NG: (сообщая о конкретном чипе), рассмотрите следующие два сценария:
d-1) Первый сценарий; (обычно сообщаемое значение чипа не меняется при каждом тесте). В таких случаях продолжайте ремонт в соответствии со стандартным методом измерения напряжений сигнала. (Также возможно, что есть проблемы с резисторами около чипа, аномалии процесса пайки BSM и т. д.)
Рисунок 5-3
3. Симптом: шаблон NG для одной платы, т. е. неполный возврат данных nonce (станция PT3)
Шаблон NG возникает из-за существенных различий характеристик между одним чипом и другими. Были обнаружены случаи, когда чипы с недостаточным припоем на поверхности BSM или неисправные корпуса чипов просто требовали замены. На основании информации журнала правила замены следующие:
1) Проверьте качество пайки радиатора BSM.
2) Если внешняя часть чипа не повреждена, замените чип с самой низкой скоростью отклика в каждом домене.
3) Поменяйте местами чипы с высокой скоростью ответа на чипы с низкой скоростью ответа, чтобы увидеть, связана ли проблема с чипом. Если это так, замените чип. Если нет, проверьте, не ниже ли напряжение домена, чем обычно, измерьте, являются ли значения сопротивления выводов контактной площадки чипа стандартными, и если нет, проверьте, не слишком ли высокие значения сопротивления соседних небольших резисторов. Если они высокие, их замена должна решить проблему.
PS: Важно отметить, что нумерация домена и ASIC начинается с 0.
4. Симптом: B_A X PCS (X чипы недостаточный ответ)
Поменяйте эти чипы на чипы из других доменов, у которых более высокие показатели отклика, и посмотрите, будет ли разница. Если это неэффективно, замены этих чипов должно быть достаточно.
5. Симптом: Тестирование чипа прошло успешно, но последовательный порт функционального теста PT3 не останавливается (непрерывная работа)
Метод ремонта: Во время тестирования PT3 просмотрите журнал печати последовательного порта. Когда последовательный порт начинает работать непрерывно, используйте зонд короткого замыкания, чтобы замкнуть RX&1.2V, начиная с первого чипа. Если последовательный порт останавливается после замыкания, это означает, что первый чип в порядке. Продолжайте этот метод, чтобы найти чип, который при замыкании продолжает работать. Как правило, это вызвано неисправным чипом, который следует заменить.
Требования к среде тестирования PT3: Температура для среды тестирования PT3 должна быть в пределах от 20 °C до 30 °C. Если температура окружающей среды превышает 35 °C, программное обеспечение прекратит тестирование. Охлаждение необходимо во время измерения, и следующую охлаждающую платформу можно использовать для охлаждения измерений PT1, запуск DEBUG-прошивки.
Рисунок 5-4
6. Метод ремонта ошибки адреса чипа (PT3): просто замените чип, который сообщает об ошибке.
7. Одинарная плата в порядке, хэшрейт всей машины падает
(1) Если RX чипа возвращает ошибочные ответы, замените соответствующий неисправный чип.
(2) Если источник питания LDO домена нестабильен, значение сопротивления последовательно включенных резисторов может быть ненормальным.
(3) Выполните низкочастотные отладочные измерения на сигналах RI, BI, CLK и т. д. основного чипа. Если сигнал ненормальный после прохождения через определенный чип, сосредоточьтесь на исследовании этой позиции. Обычно это указывает на проблемы с пайкой или неисправный чип.
VI. Проблемы с платой управления, приводящие к следующим проблемам
1. Вся машина не работает
1) Проверьте, нормальное ли напряжение на различных выходных точках. При коротком замыкании 3,3 В сначала отсоедините U8. Если короткое замыкание сохраняется, снимите ЦП и повторите измерение. При других ненормальных напряжениях обычно заменяют соответствующую IC преобразователя напряжения.
2) Если напряжение нормальное, проверьте состояние пайки DDR/CPU (используйте рентгеновский контроль на производственной стороне).
3) Попробуйте обновить программу флэш-памяти с помощью SD-карты.
Чтобы нормально запустить машину после прошивки платы управления с помощью SD-карты, необходимо выполнить следующие шаги:
a) После успешной перепрошивки, зеленый светодиодный индикатор должен гореть; затем выключите питание и перезапустите его.
b) После повторного включения питания подождите 30 с (процесс включения OTP).
c) OTP (One Time Programmable) относится к типу памяти в MCU, то есть ее можно запрограммировать один раз: после того, как программа будет записана в IC, ее нельзя будет изменить или стереть снова.
Меры предосторожности:
(1) Если питание внезапно отключается во время процесса OTP платы управления 7007 или прошло менее 30 с, это может привести к сбою функции OTP, что не позволит плате управления запуститься (не подключится к сети). В этом случае необходимо заменить U1 (Основная управляющая IC FBGA на плате управления). Замененный U1 нельзя снова использовать в серии 19.
(2) U1 плат управления, на которых включена функция OTP, не может использоваться в машинах других серий.
Рисунок 6-1 (плата управления 7Z007)
Рисунок 6-2 (плата управления amlogic)
2. Вся машина не может найти IP
Невозможность найти IP, скорее всего, вызвана ненормальной работой. Обратитесь к пункту 1 для устранения неполадок.
Проверьте сетевой порт, сетевой трансформатор T1, а также внешний вид и состояние пайки ЦП.
3. Вся машина не может быть обновлена
Проверьте сетевой порт, сетевой трансформатор T1, а также внешний вид и состояние пайки ЦП.
4. Вся машина не может прочитать хэш-плату или пропускает соединения
A. Проверьте состояние соединений ленточного кабеля.
B. Осмотрите плату управления соответствующее элементы цепи.
C. Проверьте качество пайки волной для штырьков штекера ряда и сопротивление вокруг интерфейса штекера.
Рисунок 6-3
VII. Симптомы неисправности всей машины
1. Первоначальное тестирование всей машины
См. документацию по процессу тестирования; проблемы обычно возникают из-за проблем в процессе сборки или проблем в процессе платы управления.
Обычные симптомы включают невозможность определить IP, обнаружение ненормального количества вентиляторов и аномалии обнаружения цепочка. Если во время тестирования есть какие-либо отклонения, ремонт должен быть выполнен на основе интерфейса мониторинга и подсказок журнала тестирования. Методы ремонта для начального тестирования и тестов на старение согласованы.
2. Тест на старение: ремонт должен быть основан на интерфейсе мониторинга во время теста на старение.
1) Ненормальное отображение вентилятора: проверьте, нормально ли работает вентилятор, надежно ли соединение с платой управления и есть ли какие-либо отклонения в цепи вентилятора платы управления.
2) Скучать цепочка: если распознаются только 2 из 3 хэш-плат, вероятно, проблема в соединении между хэш-платой и платой управления. Проверьте ленточный кабель на предмет проблем с обрывом цепи. Если соединение в порядке, выполните тестирование PT1/PT3 на одиночная плата, чтобы проверить, проходит ли оно. Если это так, то, скорее всего, проблема в плате управления. Если тест не пройден (NG), приступайте к ремонту в соответствии с методами PT1/PT3.
3) Температурная аномалия: Сначала определите, вызвана ли проблема высокой температурой окружающей среды. Система мониторинга должна гарантировать, что температура PCB не превышает 75 °C, а температура чипа не превышает 95 °C. Превышение этих температур вызовет срабатывание сигнализации и помешает нормальной работе. Затем проверьте, не является ли скорость вращения вентилятора ненормальной, поскольку низкая скорость также может вызывать температурные аномалии. Если конкретная хэш-плата показывает ненормальную температуру, выясните, нет ли проблем с датчиками температуры (BHB56902 имеет только два датчика), ссылаясь на методы ремонта одной платы.
4) Неполное обнаружение чипа во всей машине: разберите и повторите тестирование с помощью PT1 и отремонтируйте в соответствии с методами PT1.
5) Нет скорости хэширования после работы в течение некоторого времени, соединение с пулом прервано: проверьте сеть.
6) Нормальные условия во время испытания на старение для хороших машин.
Ⅷ. Другие примечания
Схема процесса ремонта
Рисунок 8-1 Блок-схема ремонта
Плановый осмотр включает в себя несколько шагов по диагностике и ремонту хеш-плат:
Визуальный осмотр: начните с визуального осмотра хэш-платы, чтобы проверить деформацию PCB, следы подгорания или видимые повреждения компонентов. Устраните все обнаруженные проблемы, прежде чем продолжить.
Тестирование импеданса: если визуальный осмотр не выявил проблем, приступайте к тестированию импеданса каждого домена напряжения, чтобы обнаружить любые короткие замыкания или обрывы цепей. Все обнаруженные проблемы следует устранить, прежде чем двигаться дальше.
Тестирование напряжения: проверьте, составляет ли напряжение каждого домена около 1,15 В.
После прохождения плановых проверок (особенно тестов на короткое замыкание для предотвращения повреждения при включении питания) используйте испытательное приспособление для обнаружение чип и диагностики на основе результатов.
Согласно результатам отображения тестового приспособления, начните вблизи неисправного чипа, чтобы измерить контрольные точки чипа (CO/NRST/RX/XIN/BI) и напряжения, такие как VDD0V8 и VDD1V2.
Следуйте указаниям сигналов, отметив, что сигнал RX передается в обратном направлении (от чипа 77 к 1), в то время как сигналы, такие как CLK, CO, BO, RST, передаются в прямом направлении (от 1 к 77); чтобы определить любые аномальные точки неисправности.
Если чип идентифицирован как неисправный, может потребоваться повторная пайка оплавлением. Нанесите флюс (предпочтительно безотмывочный флюс) вокруг чипа, нагрейте каждую точку пайки до расплавления, позволяя булавки чипа оплавиться и припаяться к площадке. Если проблема сохраняется после повторной пайки, замените чип.
После ремонта хэш-плата должна дважды пройти проверку тестовое приспособление, чтобы считаться хорошей. Сначала, заменив компоненты и дав плате остыть, проверьте с тестовое приспособление. Дайте ей снова остыть, затем выполните второй тест после полного охлаждения платы.
После успешного ремонта хэш-платы ведите подробные записи ремонта/анализа (включая дату, SN, версию PCB, положение, причину неисправности и ответственность) для обратной связи с производством, послепродажным обслуживанием и НИОКР.
Наконец, соберите заново в полную машину для обычных испытаний на старение. Отремонтированные качественные изделия должны быть повторно введены в производственную линию, начиная с первой станции (по крайней мере, визуальный осмотр и PT1/PT3 испытательные станции), чтобы обеспечить непрерывность качества.