مدیریت خطاهای سرورها بهخصوص خطاهای سری 1700 سرور hp میتواند پیچیده و گیجکننده باشد و اغلب باعث نگرانی مدیران سیستم شود. مواجهه با هشدارهای سختافزاری و ارورهای ذخیرهسازی بدون راهنمای مشخص، ریسک از دست رفتن دادهها را بالا میبرد. اما نگران نباشید این راهنما به شما کمک میکند تا مراحل تشخیص و رفع خطاها را سادهتر مدیریت کنید. پس با ما همراه باشید تا در این مورد بیشتر صحبت کنیم.
جدول خلاصه سریع: مهمترین خطاهای سری 1700 سرور HP
| کد خطا | سطح خطر | اقدام فوری | راهکار اولیه پیشنهادی |
|---|---|---|---|
| 1703/1715 | بالا | بررسی تست حافظه کنترلر و آپدیت فریمور | تست حافظه کنترلر + بررسی و آپدیت Firmware |
| 1716-1720 | بالا | بررسی سلامت دیسکها، بکاپگیری فوری و رفع خطاهای S.M.A.R.T | بکاپ فوری + بررسی S.M.A.R.T و سلامت دیسکها |
| 1727-1779 | متوسط | اصلاح پیکربندی درایوهای منطقی و بررسی کابل کشی | بازبینی Logical Drive Config + بررسی کابلها |
| 1719/1777/1783 | بحرانی | بررسی کنترلر و انکلوژر، آپدیت فریمور، در صورت نیاز تعویض سختافزار | بررسی Controller/Enclosure + آپدیت Firmware + تعویض در صورت نیاز |
| 1784-1788 | بالا | شناسایی درایو خراب، جایگزینی و بازسازی آرایه | تشخیص Drive Fail + جایگزینی + Rebuild/بازسازی RAID |
⏲ مدت زمان تخمینی مطالعه : 13 دقیقه
فهرست موضوعات
چرا خطاهای سری 1700 سرور hp بحرانیترین هشدارهای سیستم هستند؟
خطاهای سری 1700 سرور hp به مشکلات حیاتی در بخش ذخیرهسازی و RAID اشاره دارند که مستقیما امنیت و دسترسی به دادهها را تهدید میکنند. این هشدارها اغلب در مرحله بوت نمایش داده میشوند و در صورت بیتوجهی میتوانند باعث از دست رفتن اطلاعات یا توقف کامل سرویس شوند. به همین دلیل بررسی سریع وضعیت هاردها، RAID و تنظیمات ذخیرهسازی در مواجه با خطاهای سری 1700 سرور HP ضروری است.
نقش کنترلر Smart Array در پایداری دادههای سرور
کنترلر Smart Array در سرورهای HP مدیریت آرایههای RAID را بر عهده دارد و برای حفظ یکپارچگی دادهها مهم است. این قطعه سختافزاری با توزیع هوشمند اطلاعات روی چند دیسک از خرابی ناگهانی و از دست رفتن دیتا جلوگیری میکند. عملکرد صحیح Smart Array تضمین کننده این است که حتی اگر یک هارد خراب شود، سرویسدهی سرور بدون اختلال ادامه پیدا کند.
تفاوت کدهای سری 1700 با سایر خطاها (مثل سری 100 تا 500)
کدهای خطاهای سری 1700 سرور hp به مشکلات ساختاری در سیستم ذخیرهسازی مربوط میشوند، اما خطاهای سری 100 سرور hp تا خطاهای سری 500 سرور hp بیشتر به تنظیمات سختافزاری عمومی یا خطاهای اولیه بوت مرتبط هستند. به بیان ساده خطاهای 1700 اغلب هشدارهای عمیقتر و تخصصیتری نسبت به سایر کدها محسوب میشوند. برای آشنایی دقیقتر با انواع ارورها، میتوانید به مجموعه مقالات خطاهای سرور HP و راه حلهای آنها مراجعه کنید و تفاوت هر سری از کدها را بهصورت جزئی بررسی نمایید.
دسترسی به سایر کدهای خطا
| دستهبندی خطا | توضیحات فنی | لینک مستقیم و تخصصی |
|---|---|---|
| سری 100 | تحلیل خطاهای حیاتی مادربرد، پردازنده و مشکلات فرآیند POST | لیست خطاهای سری 100 سرور HP |
| سری 200 | رفع ارورهای مربوط به منبع تغذیه (Power)، کنترلر هوشمند و بوت سیستم | راهنمای ارورهای سری 200 سرور HP |
| سری 300 | مدیریت دمای قطعات، سنسورهای حرارتی و خطاهای مربوط به فنها | تحلیل خطاهای سری 300 سرور HP |
| سری 400 | بررسی مشکلات مربوط به ذخیرهسازی، حافظه و دستگاههای ورودی/خروجی | راهنمای خطاهای سری 400 سرور HP |
| سری 500 | عیبیابی خطاهای نرمافزاری، خطاهای بوت و مشکلات سیستم عامل | راهنمای خطاهای سری 500 سرور HP |
اگر تشخیص عیبیابی نشاندهنده نیاز به تعویض قطعات سرور است، برای اطلاع از جدیدترین تکنولوژیها و ارتقاء زیرساخت، صفحه خرید سرور hp را بررسی فرمایید.
بررسی خطاهای حافظه و خودآزمایی کنترلر (کدهای 1703 تا 1715)
کدهای 1703 تا 1715 در سرورهای اچ پی به خطاهای مرتبط با حافظه و تست خودکار کنترلر آرایه اشاره دارند. این ارورها نشان میدهند که در فرآیند self-test کنترلر یا کش آن، مشکل حافظه شناسایی شده و ممکن است دسترسی به فضای ذخیرهسازی محدود یا غیرفعال شود. در این شرایط اولین اقدام ضروری بررسی وضعیت فریمور و سلامت کنترلر برای رفع خطاهای سری 1700 محسوب میشود.
ارور 1703 و 1715: تشخیص خطای تست خودکار حافظه کنترلر
در خطای 1703 پیام Memory Self-Test Error نمایش داده میشود و دسترسی به تمام فضای ذخیرهسازی غیرفعال میگردد. در ارور 1715 نیز هنگام تست خودکار کش کنترلر، خطاهای حافظه گزارش میشود که به قدیمی بودن فریمور یا خرابی کنترلر مربوط است. در هر دو حالت بهروزرسانی فریمور اولین راهکار پیشنهادی برای رفع مشکل تست حافظه کنترلر سرور HPE است.
وقتی کش کنترلر (Cache Module) نیاز به بررسی یا تعویض دارد
اگر بعد از آپدیت فریمور همچنان خطای حافظه در کنترلر آرایه مشاهده شود، احتمال خرابی ماژول کش یا خود کنترلر وجود دارد. تعویض ماژول کش یا کنترلر راهکار نهایی برای رفع این مشکل است. بررسی دقیق کش کنترلر سرور HP در این شرایط میتواند از ادامه اختلال در دسترسی به فضای ذخیرهسازی جلوگیری کند.
عیبیابی هاردها و هشدارهای سلامت رسانه (کدهای 1716 تا 1720)
کدهای 1716 تا 1720 در سرورهای HPE به مشکلات مرتبط با سلامت دیسکها و وضعیت رسانه اشاره دارند. این خطاها شامل شناسایی خطاهای غیرقابلبازیابی، افزایش دمای درایوها و پیشبینی خرابی هارد توسط سیستم S.M.A.R.T هستند. بررسی سریع این هشدارها و اقدام به پشتیبانگیری میتواند از بروز اختلال جدی در آرایه و از دست رفتن دادهها جلوگیری کند.
ارور 1716: شناسایی خطاهای غیرقابلبازیابی در دیسکها
در خطای 1716 اعلام میشود که طی عملیات Rebuild یا اسکن ARMخطاهای رسانهای غیر قابل بازیابی روی برخی درایوها شناسایی شده است. این خطاها هنگام خواندن بلاک بهصورت Read Error غیر قابل بازیابی به سیستمعامل بازگردانده میشوند. توصیه میشود از دادهها نسخه پشتیبان تهیه کنید و با انجام عملیات نوشتن ترتیبی روی بلاکهای آسیب دیده نسبت به رفع خطا اقدام کنید.
کد 1717: چطور مشکل دمای بیش از حد درایوها را حل کنیم؟
در ارور 1717 دیسکها وضعیت OVERHEATED را گزارش میکنند که نشان دهنده افزایش دمای آنهاست. برای رفع این مشکل باید:
- فنها بررسی شوند.
- از عبور صحیح جریان هوا روی درایوها اطمینان حاصل شود.
- همچنین در صورت باز بودن پنل دسترسی سرور، باید نسبت به نصب صحیح آن اقدام کنید تا شرایط خنک سازی به حالت استاندارد بازگردد.
ارور 1720: پیشبینی خرابی هارد توسط S.M.A.R.T (قبل از اینکه دیر شود!)
خطای 1720 بیان میکند که سیستم S.M.A.R.T خرابی قریبالوقوع یکی از هارددیسکها را تشخیص داده است. در این وضعیت اگر آرایه بدون تحمل خطا باشد، پیش از تعویض درایو باید از تمام دادهها نسخه پشتیبان تهیه شود. همچنین در صورت استفاده از RAID 0، بکاپگیری قبل از هرگونه جایگزینی هارد ضروری است.
رفع مشکلات پیکربندی و شناسایی درایوهای منطقی (کدهای 1727 تا 1779)
کدهای 1727 تا 1779 در سرورهای HP برای شناسایی و پیکربندی درایوهای منطقی و آرایههای RAID میباشند. این خطاها شامل اتصال درایوهای جدید یا خراب شده، پیکربندی کابل کشی افزونهای و محدودیتهای پشتیبانی RAID توسط کنترلر میشوند.
ارور 1727 و 1779: چالش شناسایی درایوهای منطقی جدید یا آسیبدیده
خطای 1727 نشان میدهد که درایوهای منطقی جدید یا قبلا خراب شده به آرایه اضافه شدهاند و گاهی پیکربندی خودکار موفق نیست. خطای 1779 نیز به خرابی قبلی درایوهای منطقی اشاره دارد. در هر دو حالت بررسی پیکربندی و بازیابی دادهها از نسخه بکاپ توصیه میشود. همچنین مشکلات مربوط به غیر فعال شدن درایو نیز باید بررسی شوند.
کد 1735: خطای کابلکشی Redundant؛ چطور اتصالات را اصلاح کنیم؟
در ارور 1735 نسخه فعلی فریمور Smart Array پشتیبانی لازم از کابل کشی افزونهای را ندارد و چند مسیر به یک درایو یا انکلوژر غیرفعال میشود. برای رفع مشکل باید کابلهای SAS افزونهای جدا شوند یا فریمور به نسخهای که از Dual-Domain پشتیبانی میکند ارتقا یابد تا دسترسی به تمام درایوها بازگردد.
ارور 1754: وقتی سطح RAID انتخاب شده توسط کنترلر پشتیبانی نمیشود
خطای 1754 نشان میدهد که سطح RAID پیکربندی شده توسط مدل کنترلر یا به دلیل غیرفعال بودن کلید لایسنس پشتیبانی نمیشود. برای رفع این خطا باید درایوها مجددا به کنترلر اصلی متصل شوند یا یک کلید لایسنس معتبر وارد شود تا آرایه به وضعیت عملیاتی بازگردد و قابلیت استفاده از سطح RAID دلخواه فراهم شود.
خطاهای بحرانی خرابی کنترلر و انکلوژر (کدهای 1719، 1777 و 1783)
کدهای 1719، 1777 و 1783 در سرورهای HP به مشکلات جدی کنترلر و انکلوژر ذخیرهسازی اشاره دارند که میتوانند دسترسی به آرایهها و دادهها را مختل کنند. این خطاها شامل خرابی کامل کنترلر، اختلال در فن، دما، منبع تغذیه و شناسایی نادرست سختافزار انکلوژر هستند. تشخیص سریع و اقدام صحیح برای رفع خطا از از دست رفتن داده و اختلال در سرویس دهی جلوگیری میکند.
ارور 1719 و 1783: وقتی کنترلر آرایه بهطور کامل از کار میافتد
خطای 1719 نشان میدهد که پیش از روشن شدن فعلی سرور، یک رویداد خرابی کنترلر رخ داده است و خطای 1783 نیز خرابی کامل کنترلر را گزارش میدهد. در هر دو حالت احتمال وجود فریمور قدیمی یا نقص سختافزاری وجود دارد و بدون بررسی و اقدام برای رفع مشکل، دسترسی به آرایهها مختل میشود. آپدیت فریمور و بررسی نصب صحیح کنترلر اولین اقدام حیاتی است.
کد 1777: شناسایی اختلال در محفظه ذخیرهسازی (Enclosure)
خطای 1777 به مشکلات مختلف انکلوژر اشاره دارد، از جمله فن معیوب، افزایش دما، عملکرد نادرست پاور افزونه، نوع ROM پشتیبانینشده، خطاهای لینک یا عدم شناسایی پردازنده انکلوژر. رفع این خطا شامل بررسی فن و جریان هوا، نصب صحیح پنل کناری، بررسی منابع تغذیه و در صورت نیاز ارتقا فریمور یا تعویض ماژول I/O است.
راهکار عملی برای ریست یا جایگزینی کنترلر آسیبدیده
برای کنترلرهایی که دچار خرابی کامل شدهاند، ابتدا آنها را از اسلات PCI جدا و دوباره نصب کنید. در ادامه فریمور را به آخرین نسخه بهروزرسانی کرده و عملکرد کنترلر را بررسی کنید. اگر مشکل پابرجا بود، تعویض کنترلر با یک رید کنترلر جدید سرور HP، آخرین مرحله برای بازگرداندن عملکرد کامل آرایهها و اطمینان از پایداری دادهها است.
مدیریت تعویض درایو و بازیابی آرایه (کدهای 1784 تا 1788)
کدهای 1784 تا 1788 در سرورهای HPE به مشکلات مربوط به خرابی، تعویض و بازسازی آرایههای درایو اشاره دارند. این خطاها شامل شناسایی درایو معیوب، نیاز به بازیابی خودکار دادهها و گزارش تعویض نادرست هارد هستند. رسیدگی سریع و صحیح به این هشدارها از اختلال در عملکرد سرور و از دست رفتن دادهها جلوگیری میکند.
ارور 1784: تشخیص قطعی خرابی درایو در اسلات مشخص
خطای 1784 نشان میدهد که یکی یا چند درایو در آرایه خراب شدهاند و باید تعویض شوند. برای اطمینان از خرابی کامل درایو باید پیش از تعویض، اتصال کابلها و قرارگیری صحیح درایوها را بررسی کنیم. با استفاده از ابزار HPE SSA درایو معیوب شناسایی و بعد از تعویض، سیستم به حالت عملیاتی بازمیگردد.
کد 1786: درایو خراب و نیاز به تعویض
خطای 1786 هنگامی رخ میدهد که یک درایو خراب یا تعویض شده هنوز بازسازی (Rebuild) نشده است. کاربر میتواند با فشار دادن F1 دادهها را بازسازی کند یا با F2 فرآیند بدون بازسازی را ادامه دهد. در صورت تعویض درایو، انتخاب F1 باعث بازگردانی خودکار دادهها روی درایو جدید خواهد شد.
ارور 1788: اشتباه در تعویض هارد و نحوه اصلاح آن
خطای 1788 به تعویض نادرست هاردها اشاره دارد و میتواند ناشی از نصب درایو در Bay نادرست یا استفاده از نوع یا ظرفیت نامناسب باشد. برای اصلاح، درایوها باید در محل صحیح قرار گیرند و کابلها بررسی شوند. کلیدهای F1 برای غیر فعال نگه داشتن آرایه یا F2 برای پیکربندی بازنشانی و حذف دادهها میباشند.
مراحل گامبهگام عیبیابی سری 1700 در محیط SSA
عیبیابی خطاهای سری 1700 سرور hp در محیط Smart Storage Administrator (SSA) با یک رویکرد مرحلهای، امکان شناسایی سریع مشکلات سختافزاری و نرمافزاری را فراهم میکند. ابتدا بررسی سلامت دیسکها و کنترلرها انجام میشود سپس لاگهای سیستم تحلیل شده و ارورهای احتمالی ثبت میشوند. این روند گام به گام به کاهش زمان تعمیر و جلوگیری از خطاهای تکراری کمک میکند.
استفاده از ابزار Smart Storage Administrator برای تحلیل دقیق خطاها
Smart Storage Administrator ابزار اصلی برای مانیتورینگ و تحلیل خطاهای سری 1700 سرور اچ پی است. با استفاده از این نرمافزار میتوان وضعیت دیسکها، باتری کنترلر و لاگهای خطا را بهصورت لحظهای مشاهده کرد. این امکان باعث میشود تکنسینها به سرعت مشکل را تشخیص داده و راهکار مناسب را بدون ریسک آسیب بیشتر اجرا کنند.
آپدیت فریمور کنترلر؛ راهکاری برای رفع ارورهای کاذب
آپدیت فریمور کنترلر یکی از روشهای مؤثر برای جلوگیری از ارورهای کاذب در ارورهای سری 1700 سرور hp است. نسخههای قدیمی فریمور ممکن است خطاهایی را گزارش کنند که واقعی نیستند و باعث هشدارهای غیرضروری شوند. سوال برخی از مدیران این است که چرا سرور بدون هیچ خطایی ریست میشود؟ در جواب میتوان گفت با بروزرسانی فریمور میتوانید ریست ناگهانی سرور را کاهش دهید و به کاهش خطاهای کاذب، پایداری سیستم و عملکرد بهینه سرور نیز کمک نمایید.
جمعبندی و نتیجهگیری
خطاهای سری 1700 سرور hp هشدارهایی بحرانی برای سلامت ذخیرهسازی و یکپارچگی دادهها هستند و نیازمند بررسی فوری کنترلر، هاردها و آرایههای RAID میباشند. رسیدگی سریع به خطاها و رعایت مراحل گامبهگام عیبیابی، از توقف سرویس و از دست رفتن دادهها جلوگیری میکند.
اگر سرور شما با این خطاها مواجه شده است و نمیدانید باید از کجا شروع کنید، با مهندسین ما در تجارت سرور پارسه تماس بگیرید.
سوالات متداول درباره خطاهای سرور HP سری 1700
✔ اگر با ارور 1720 مواجه شدیم، چقدر زمان برای تعویض هارد داریم؟
توصیه میشود هارد در همان روز یا حداکثر چند ساعت پس از دریافت ارور 1720 تعویض شود. همچنین، بلافاصله پس از تعویض، عملیات بکاپگیری از دادههای حیاتی انجام گیرد.
✔ آیا ارور 1703 همیشه به معنی سوختن کش کنترلر است؟
خیر، ارور 1703 لزوماً به معنی سوختن کش کنترلر نیست. این خطا بیشتر به مشکلات مربوط به حافظه کش (Cache) کنترلر یا قدیمی بودن فریمور (Firmware) اشاره دارد و نیاز به بررسی دقیقتر دارد.
✔ چگونه میتوان منبع خطای 1735 (کابل یا پورت) را تشخیص داد؟
تشخیص این خطا از طریق بررسی دقیق اتصال کابلهای SAS (بهویژه کابلهای افزونه) و همچنین مسیرهای ارتباطی کنترلر در ابزار Smart Storage Administrator (SSA) انجام میشود.
✔ آیا حل خطای 1786 بدون از دست دادن داده امکانپذیر است؟
بله، در بسیاری از موارد میتوان خطای 1786 را بدون از دست دادن داده حل کرد. این کار معمولاً با استفاده از گزینه بازسازی خودکار (Rebuild) روی درایو جدید انجام میشود.
✔ پس از تعویض هارد، چرا خطای 1788 نمایش داده میشود؟
نمایش خطای 1788 پس از تعویض هارد میتواند دلایل مختلفی داشته باشد، از جمله قرارگیری هارد در Bay (محفظه) اشتباه، ناسازگاری ظرفیت یا نوع هارد جدید با آرایه موجود. اطمینان از قرارگیری صحیح و سازگار بودن هارد جدید در Bay مربوطه، راه حل اصلی است.