بلاگ

چک لیست نگهداری سرور؛ پادکست؛ ویدئو


یادداشت ویراستار: این مطلب در مهر ۹۹ توسط کارشناسان سرور و شبکه فالنیک، بررسی و تایید شده است.

فروش سرور معمولا با خدماتی مانند پشتیبانی نیز همراه است اما بهتر است سرویس های دوره ای و چک لیست نگهداری سرور را انجام دهید. نگهداری و مانیتورینگ ساده می‌تواند از خرابی سرور و منتهی شدن به فاجعه جلوگیری کند. مثلا اگر RAID سرور خراب شده باشد و یا مدتی است که گرفتن بکاپ متوقف شده و یا ظرفیت هاردها کاملا پر شده منتظر خرابی و Fail شدن سرورتان باشید.

اگر از سرویس های مدیریتی استفاده می‌کنید نگران این چیزها نباشید اما اگر به صورت شخصی سرورتان را مدیریت می‌کنید باید به چک لیست نگهداری سرور کاملا پایبند باشید.

چک لیست نگهداری سرور

در چک لیست نگهداری سرور که در ادامه می‌خوانید ۱۴ نکته بیان شده که باعث می‌شود درک بهتری از آنچه برای نگهداری روتین سرور لازم است پیدا کنید. نگهداری مداوم باعث به حداقل رسیدن مشکلات سروری می‌شود. بسیاری از این مشکلات قابل پیش بینی و پیشگیری است.

podcast

پادکست با موضوع چک لیست نگهداری سرور

۱- اخبار تکنولوژی

انتشار IOS 13.7 برای دستگاه‌های اپل، دادن فرصت دوباره به توسعه دهندگانی که زمانی قوانین مربوط به اپل و پلتفرم اپ استور را زیرپا گذاشته بودن، تبدیل کاغذ به تبلت و راه اندازی خطوط تولیدی سامسونگ در پاکستان، تنها بخشی از خبرهای تکنولوژی این پادکست است.

۲- پرونده ویژه:

  • داشتن استراتژی بکاپگیری
  • بررسی مصرف هارد و منابع سرور و شبکه
  • آپدیت برنامه ها و نرم افزارها و سیستم عامل
  • جنرال سرویس سخت افزارهای سرور

۳- مناسبت‌های ماه:

در این شماره از پادکست، به سراغ یکی دیگر از مناسبت های شهریور ماه، روز جهانی برنامه‌نویسان رفتیم و درباره تاریخچه برنامه نویسی و حوزه های مختلف آن  صحبت کردیم. در ادامه بشنوید.

در این پادکست به همراه بخش تخصصی، اخبار تکنولوژی و مناسبت‌های ماه را هم می‌توانید پیگیری کنید؛ این نسخه پادکست ۳۱ مگابایت حجم و ۳۴ دقیقه زمان دارد. زمان‌بندی این پادکست در جدول زیر آمده است:

محدوده زمانیموضوع بحث پادکست
دقیقه ۰۲:۱۶ تا ۰۷:۳۰خبرهای ۳۰ روز گذشته دنیای تکنولوژی
دقیقه ۰۸:۵۳ تا ۲۳:۵۴چک لیست نگهداری سرور
دقیقه ۲۴:۵۰ تا ۳۰:۵۷تقویم روز: روز جهانی برنامه‌نویسان

دانلود

بخش پرونده ویژه ۲۵ مگابایت حجم و ۱۸ دقیقه زمان دارد.

دانلود

۱. داشتن استراتژی بکاپگیری

داشتن استراتژی خوب در بکاپگیری نکته مهمی است که باید به آن توجه کرد. بهتر است بکاپ داشته باشید و به آنها احتیاج نداشته باشید نه اینکه به بکاپ نیاز داشته باشید اما بکاپی نداشته باشید. هر روز یا هر هفته زمانی را برای بکاپگیری اختصاص دهید.

بررسی کنید آیا بکاپگیری به درستی کار می‌کند یا نه. قبل از اعمال هر تغییری در سیستم مطمئن شوید که بکاپ هایتان به درستی کار می‌کند حتی چند تست ریکاوری هم انجام دهید. از بکاپگیری مهمتر محل نگهداری بکاپ هاست که باید استانداردهای مربوط به آن را رعایت کنید.

خواندن مطلب “بهترین روش های بک آپ گیری از سرور و شبکه” را توصیه می‌کنیم.

اصولا Raid در سرورها پیاده سازی و اجرا می‌شود که طی آن چندین هارد به صورت یک هارد دیده می‌شوند. برخی انواع RAID ها برای افزایش کارایی و برخی برای افزونگی هستند. اگر از ابزار مدیریتی Raid استفاده کنید می‌توانید به سادگی از احتمال خرابی هارد درایو مطلع شوید در نتیجه فرصت کافی برای جایگزینی و ریبیلد کردن رید را دارید و در نهایت زمان Downtime کم می‌شود.

ممکن است سالانه تنها یک درصد خرابی رید رخ دهد. اگرچه که به ظاهر عدد کوچکی است اما خرابی کامل سرور و دان بودن چندین ساعته سیستم را باعث می‌شود.

۲. بررسی مصرف هارد

به صورت دوره ای میزان مصرف هارد درایو های سرور را بررسی کنید. سرورها لاگ های زیاد، ایمیلهای قدیمی و پک های نرم افزاری منقضی دارند. از سیستم خود به عنوان سیستم آرشیو استفاده نکنید و لاگ ها و ایمیل ها و نسخه های نرم افزاری که دیگر استفاده نمی‌کنید را پاک کنید. دیتای کمتر، ریکاوری را هم سریعتر می‌کند.

اگر نگهداری لاگهای قدیمی برایتان مهم است آنها را روی استوریج اکسترنال ذخیره و آرشیو کنید. ایمیل های قدیمی را یا پاک کنید یا آرشیو. در برخی برنامه ها پس از آپدیت، فایل های قدیمی پاک نمی‌شود و باید از برنامه های Package Manager که دارای پروتکل های Cleanup هستند استفاده کنید. استفاده از برنامه های مدیریت فایلهای قدیمی نرم افزاری هم کمک کننده است.

هارد درایوها نه تنها برای ذخیره سازی استفاده می‌شوند بلکه از آنها به صورت Swap File هم استفاده می‌کنیم که همانند حافظه فیزیکی کار می‌کند یعنی در صورت پر شدن رم از این قسمت از هارد استفاده می‌شود. اگر مصرف هارد به بیش از ۹۰ درصد برسد، با Swap File تداخل پیدا می‌کند و کارایی به شدت کاهش می‌یابد.

همچنین در صورت استفاده بیش از ۹۰ درصد از ظرفیت هارد باید یا مصرف را کم کنید یا فضای ذخیره سازی را افزایش دهید. اگر مصرف پارتیشن به ۱۰۰ درصد برسد سرور دیگر پاسخ نمی‌دهد، جداول دیتابیس خراب می‌شود و دیتا از دست خواهد رفت.

۳. بررسی مصرف منابع سرور

علاوه بر بررسی مصرف هارد باید میزان مصرف دیگر منابع سرور را بررسی کنید. مصرف حافظه و پردازنده نشانگر این است که سرور تا چه حد سنگین کار می‌کند. اگر مصرف سی پی یو و رم مرتبا به صددرصد می‌رسد، نشانگر Overtax شدن سرور است یعنی بار روی آن بیش از حد مجاز است. باید بار را از سخت افزارتان بردارید پس یا سرور را آپگرید کنید یا سرور جدیدی اضافه کنید. خواندن مطلب “۶ دلیل برای جایگزینی سرور قدیمی با سرور جدید؛ پادکست” را از دست ندهید.

۴. آپدیت کنترل پنل

اگر از کنترل پنل سروری یا هاستینگ استفاده می‌کنید باید آن را آپدیت کنید. نرم افزار کنترل پنل مثل cPanle سی پنل و WHM، باید به صورت دستی  آپدیت شود. وقتی سی پنل را آپدیت می‌کنید فقط کنترل پنل آپدیت می‌شود و باید برنامه هایی که سی پنل مدیریت می‌کند مانند Apache و PHP را هم آپدیت کنید.

پیشنهاد مطالعه

۵. آپدیت برنامه ها و نرم افزارها

رعایت این نکته به خصوص برای برنامه های مبتنی بر وب مهم است مثل برنامه محبوب وردپرس.

طبیعی است که بسته به نوع پیکربندی سرورتان از نرم افزارهای مختلفی استفاده کنید. برخی سیستم ها دارای Package Manager هستند و به صورت خودکار نرم افزار را آپدیت می‌کنند اما آنهایی که این کار را نمی‌کنند باید بررسی شوند و زمانبندی بررسی آپدیت های جدید را برای آنها در نظر گرفت.

توجه داشته باشید که برخی سیستم عامل ها به نسخه های قدیمی برنامه  نیاز دارند مثلا پایتون ۲ برای CentOS7. در چنین مواردی باید مراقب باشید که چنین برنامه هایی را در شبکه استفاده نکنید.

۶. بررسی ابزارهای مدیریت از راه دور

ابزارهای مدیریت ریموت شامل ریموت کنسول، ریموت ریبوت و Rescue Mode است که سه ابزار اصلی برای مدیریت از راه دور سرور است. وجود آنها هنگامی که قصد اجرای سرور مجازی مبتنی بر کلود را دارید و یا سرورتان را از راه دور مدیریت می‌کنید، ضروری است. به صورت دوره ای درست کار کردن آنها را بررسی کنید.

ریبوت کردن می‌تواند بسیاری مشکلات را حل کند، ریموت کنسول امکان لاگین کردن به سرور بدون حضور فیزیکی را فراهم می‌کند. Rescue Mode راهکار Redhat است و اغلب سیستم عامل های سروری دارای حالت مدیریتی یا Safe هستند که با آن به صورت ریموت تعمیرات را انجام می‌دهند.

گفتگوی تک تاک: نکات مهم در نگهداری سرورها

در این بررسی به موارد زیر می‌پردازیم:

  • استفاده از UPS مناسب و بررسی دوره‌ای باتری آن
  • نگهداری سرور در مکان و شرایط مطلوب
  • بررسی منظم باتری سرور
  • استفاده از کولینگ مناسب

۷. بررسی مصرف شبکه

مانند بررسی مصرف رم و CPU باید مصرف و ظرفیت شبکه را بررسی کنید. اگر سرور به سمت حداکثر ظرفیت سخت افزار شبکه پیش می‌رود، باید آن را آپدیت کنید. استفاده از ابزارهای مانیتورینگ شبکه هم توصیه می‌شود. این ابزارها ترافیک شبکه را برای استفاده غیرمعمول و دارای مشکل بررسی می‌کنند.

مانیتورینگ الگوهای ترافیک می‌تواند ترافیک وب را بهینه کند مثلا ممکن است منابعی که مکررا استفاده می‌شوند را به سرور سریعتری منتقل کنید. بررسی رفتار غیرعادی برای تشخیص رخنه ها و اتک ها مفید است و مدیریت آنها را راحتتر می‌کند.

۸. آپدیت سیستم عامل

آپدیت سیستم عامل پروسه مهمی است چون پچ ها و آپدیت ها می‌تواند مشکلات امنیتی را رفع کند و کارایی را افزایش دهد. هکرها اغلب به پچ های سیستم عاملی نگاه می‌کنند و به ضعیف ها حمله می‌کنند آن هم قبل از اینکه بتوانید پچ جدید را نصب کنید. پس زمان های خاصی را برای آپدیت سیستم عامل در نظر بگیرید.

۹. تمیز کردن سخت افزارهای سرور

باید به صورت دوره ای سخت افزار سرور را تمیز کنید. این کار از خرابی سخت افزار پیشگیری می‌کند و گردوغبار را از سخت افزار و فن ها دور می‌کند.

گردوغبار در بالا رفتن دما تاثیر دارد در واقع گرما دشمن کارایی سرور است. در این زمینه توسعه شبکه آداکسرویس جنرال سرویس را به شما ارایه می‌دهد. برای استفاده از آن روی لینک “خدمات جنرال سرویس در فالنیک” بزنید.

۱۰. بررسی خطاهای سخت افزاری

سیستم عامل های مدرن سروری دارای لاگ های خطاهای سخت افزاری هستند. ارور سخت افزاری می‌تواند خطای SMART و خرابی هارد (مانند خطای خواندن) و خطای درایور و خطای حافظه باشد. مطلب “SMART در هارددیسک چیست؛ خطای اسمارت و رفع آن” را حتما بخوانید.

بررسی لاگ های خطا باعث پیدا کردن مشکل و رفع آن می‌شود که قبل از خرابی سیستم قابل انجام است.

پیشنهاد مطالعه

۱۱. بررسی لاگ های سروری

لاگ های نگهداری سرور، دسترسی و خطا را بررسی می‌کند. این لاگ ها ممکن است زیاد و گسترده باشند اما با ابزارها و رویه ها می‌توان آنها را به آسانی مدیریت کرد.

بررسی مرتب لاگ ها شما را با عملکرد سرورتان مانوس می‌کند. لاگ می‌تواند مشکل سخت افزاری را به شما نشان دهد و در نتیجه قبل از خرابی آن را رفع می‌کنید.

لاگ های دسترسی میزان استفاده غیرمجاز یا دسترسی غیرمجاز کاربران را نشان می‌دهد.

۱۲. بررسی امنیت پسورد

مرتبا باید امنیت پسورد را بررسی کنید. اگر از سیستم مدیریتی پسورد استفاده نمی‌کنید همین حالا این کار را انجام دهید. باید سیستمی برای اتوماتیک کردن تغییر پسورد داشته باشید اگر ندارید باید از کاربران بخواهید تغییر پسورد را دستی انجام دهند.

۱۳. ارزیابی اکانت کاربران

به صورت دوره ای لیست اکانت کاربران را بررسی کنید. همچنین Permission های اکانت را بررسی کنید تا از درستی اختصاص آن به هر کاربر مطمئن شوید. هنگام این بررسی ممکن است لازم باشد دیتا و اطلاعات کاربر و اکانت را هم بررسی کنید. همچنین باید امکان پاک کردن اطلاعات کاربر قبلی به صورت دستی وجود داشته باشد.

۱۴. بررسی امنیت کلی سرور

سیاست های امنیتی سرورتان را ارزیابی کنید تا مطمئن شوید در حال اجرا هستند. از ابزار امنیت شبکه برای تست شبکه از بیرون استفاده کنید. این کار باعث می‌شود جاهایی که از چشم شما دور مانده را تشخیص دهید و قبل از وقوع رخنه، آنها را بیابید. این بررسی ها را ماهانه و یا فصلی انجام دهید.

خدمات تعمیرات سرور، مشاوره و اجرای شبکه در فالنیک
توسعه شبکه آداکبا دارا بودن بزرگ‌ترین لابراتوار تعمیر سرور و تجهیزات شبکه و کارشناسان متخصص، آماده خدمت‌رسانی برای تعمیر انواع سرورهای ایستاده و رک مونت است. تمامی ابزار موردنیاز برای تعمیر و تست تجهیزات شبکه در مرکز سرور توسعه شبکه آداکدر اختیار مهندسین توسعه شبکه آداکقرار دارد.

درخواست تعمیر سرور

نویسنده : مریم فقیهی



منبع

مطالب مرتبط

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *