Depanare server Servermeile Technet
Depanarea, adică rezolvarea problemelor din zona serverului, se poate dovedi obositoare și complexă fără cunoștințele adecvate. Din acest motiv, în acest articol ne vom ocupa de cele mai frecvente provocări și vom explica modul în care puteți reporni rapid serverul și să ruleze în cazul unui presupus defect. Dacă nu aveți timp sau dacă problema este prea persistentă, vom fi bucuroși să vă sprijinim personal ca partener de sistem competent la telefon sau la fața locului.
probleme nedeterminate/necunoscute
Dacă un server nu face ceea ce ar trebui să facă, primul lucru de făcut este să aflăm unde poate fi găsită presupusa eroare. Experiența noastră în producția de servere arată că rareori este vorba de defecte de server „reale”, adică componente hardware defecte ale serverului. Mult mai des vedem erori de configurare sau pur și simplu „alte stări nedocumentate” în producția și asistența mai sigură de pe site-urile clienților noștri, care nu sunt, totuși, un defect hardware. Acesta din urmă poate apărea din cauza firmware-ului depășit, de exemplu, dar are și alte cauze.
Acțiuni pregătitoare
Înainte de a începe, ar trebui să aveți manualul pentru serverul dvs. pregătit - veți avea nevoie de el. Instrumentele profesionale sunt utile pentru multe examene și esențiale pentru unele. Pentru a diagnostica și remedia presupusa eroare, nu este absolut necesar să deschideți carcasa serverului - dar dacă ar fi necesar să purtați o brățară de împământare pentru a nu deteriora componentele electronice sensibile. Trebuie să știți că și serverele moderne sunt oprite. să fie alimentat cu energie pentru a acționa cel puțin BMC și pentru a face serverul accesibil prin IPMI. Prin urmare, este necesar să deconectați complet serverul în cauză de la alimentare și de la rețea înainte de a deschide carcasa serverului.
Procedați într-un mod structurat și observați-vă progresul - dacă faceți o greșeală simplă, nu este nevoie de multă muncă. Cu toate acestea, dacă cazul se dovedește a fi complex, notele tale vor fi de mare ajutor. Sunteți blocat la un moment dat și aveți nevoie de sfaturi profesionale pentru server? Suntem bucuroși să vă sprijinim și să vă sfătuim.
Wizzard de depanare Intel
Pentru un diagnostic de bază și rapid, puteți utiliza, de asemenea, Wizzard de depanare a serverului furnizat de Intel. În plus față de ghid, este esențial să consultați manualul pentru placa principală a serverului dvs., deoarece nu toate detaliile plăcilor principale ale serverului Intel au fost acoperite în vrăjitor.
Serverul nu poate fi pornit/nu pot fi văzute LED-uri aprinse
Verificați mai întâi sursa de alimentare de bază - este deloc cablul de alimentare sau suficientă energie disponibilă (serverul este conectat la un UPS posibil defect)? Dacă este o unitate de alimentare redundantă, trebuie verificate cele două unități de alimentare. Trebuie remarcat faptul că, în cazul surselor de alimentare redundante, placa de distribuție a energiei poate avea și un defect.
În mod ideal, aveți un dispozitiv de testare pentru sursele de alimentare ale serverului cu care puteți verifica acum valorile tensiunii. Doar atunci verificați dacă unitatea de alimentare a fost conectată corect la placa principală a serverului. Notă: Asigurați-vă că scoateți cablul de alimentare înainte de a scoate sau introduce un pachet de alimentare redundant !
Serverul poate fi pornit, dar nu pornește sau imaginea monitorului rămâne neagră/poate fi văzut cel puțin un LED luminat
De îndată ce placa principală a serverului este alimentată cu energie, controlerul de gestionare a benzii de bază (BMC) pornește mai întâi, care poate fi recunoscut de obicei de LED-urile albastre. Acesta și un singur LED verde indică dacă placa principală a serverului este întotdeauna alimentată cu tensiune.
Dacă totul este în regulă până în acest moment, există multe cauze posibile ale erorilor - dar instrumentele profesionale de diagnostic ale unui server vă ajută să recunoașteți eroarea. Fiecare placă de server are cel puțin patru LED-uri portocalii și patru LED-uri verzi, care pot fi utilizate pentru a determina starea procesului de boot și o gamă întreagă de posibile erori. Următoarea imagine prezintă o serie de LED-uri de diagnostic ale Intel S2600WTT, deoarece este, de exemplu, încorporat în R2308WTTYS (platforma Intel Grantley pentru procesoarele E5-2600v3).

Utilizați manualul plăcii principale pentru a vă ajuta să descifrați starea sau codurile de eroare. Pe baza experienței, vă recomandăm să efectuați diagnosticul fără a introduce carduri suplimentare. Suntem conștienți de constelațiile în care bootarea poate fi blocată de un card PCI-E (de exemplu, un controler RAID). Dacă serverul dvs. nu mai pornește corect după o actualizare de firmware, mai întâi eliminați toate cardurile suplimentare și apoi încercați din nou.
Exemplu: primul proces de pornire după o actualizare cu succes a firmware-ului
Actualizarea firmware-ului unui server este complexă. În plus față de BIOS-ul real, o serie de alte componente sunt adesea actualizate: BMC, FBU și SDR, precum și ME. Procesul este complet complet doar în timpul bootului după o actualizare reușită. În anumite circumstanțe, se poate întâmpla ca un card PCI-E să blocheze acest proces. În acest caz, eliminați toate cardurile PCI-E, efectuați din nou actualizarea și instalați din nou cardurile corespunzătoare numai atunci când serverul a reușit să pornească cu succes o dată după actualizare și procesul de actualizare este finalizat.
Pe lângă examinarea LED-urilor de diagnostic, merită să accesați BMC. Dacă acest lucru a fost configurat anterior pentru gestionarea de la distanță, puteți utiliza IPMI pentru a verifica vizual o serie de mesaje de stare sau pentru a trece prin intrarea jurnalului de sistem al intrării. Din experiența noastră, toate sursele obișnuite de eroare pot fi diagnosticate în acest fel.

Greșeli comune
Stocare în masă
Deficiențele hardware reale ale componentelor de bază apar foarte rar cu componentele noastre de server extrem de fiabile. În plus, ne bazăm pe Intel (placă server, CPU, placă de rețea server, controler RAID) pentru a asigura compatibilitatea optimă.
De obicei, hard disk-urile care - în funcție de încărcare - se defectează din ce în ce mai des începând cu al treilea an. Prin urmare, stocarea în masă ar trebui - indiferent dacă este vorba de un RAID sau la nivel de sistem de fișiere - cel puțin să fie proiectată cu redundanță. O defecțiune a hard disk-ului poate fi ușor recunoscută prin intermediul consolei Web RAID Intel 2, dar și printr-un LED de pe carcasa serverului.
memorie cu acces aleator
Începând cu al treilea an de funcționare - din nou în funcție de sarcină - o bară RAM poate eșua. De aceea, în general, vă recomandăm să folosiți RAM REG ECC pentru termenul obișnuit de 3 până la 5 ani de la o configurație de 64 GB în sus și să nu supra-dimensionați memoria. Serverul poate face față unei defecțiuni a unei bare RAM REG ECC în timpul funcționării; serverul trebuie oprit doar pentru o înlocuire ulterioară. Un eșec este cel puțin vizualizat prin LOG, în funcție de placa principală a serverului și prin LED-uri.
Alte greșeli
Exemplu: drive-uri
Există, de asemenea, o serie de erori rare, care nu sunt atât de ușor de diagnosticat - de exemplu, o unitate DVD care „bombardează” interfața SATA cu semnale datorită electronicii defecte chiar și fără un DVD sau CD introdus.
„Erori” frecvente de configurare
Exemplu: BIOS-ul RAID nu este afișat
Accesați BIOS-ul plăcii principale a serverului și dezactivați „Quiet Boot” în meniul principal. De asemenea, setați modul de încărcare la „Legacy” în meniul „(Advanced) Boot Options”. După salvarea setărilor și repornire, BIOS-ul RAID este acum afișat din nou în timpul pornirii. Nu uitați să setați modul de încărcare înapoi la UEFI în funcție de configurația RAID și de alegerea sistemului dvs. de operare.
Exemplu: Windows Server nu poate fi instalat
Accesați BIOS-ul și verificați dacă unitatea hard disk sau volumul RAID este corect introdus în boot manager. Instalați cele mai recente drivere pentru controlerul RAID dacă nu este afișat niciun volum RAID.
Informații suplimentare/surse