آپتایم از آن مفهومهای چالش برانگیز است که هم میتواند فریبدهنده باشد و هم میتواند تکلیفمان را با زیرساختهای وبسایت روشن کند. حالا این که کدام یک از اینها اتفاق بیفتد بستگی به دانش و شناختمان از این مفهوم و کارکردش دارد. در این مقاله قصد داریم مفهوم آپتایم (uptime) را عمقیتر بررسی کنیم. یعنی بدانیم آپتایم چیست و چه تفاوتی با مفاهیم مشابه دارد. سپس بیاموزیم که نحوهٔ اندازهگیری آپتایم سرور به چه صورت است؛ نگاهی به اثرات فریبکارانهٔ آن بیندازیم و دربارهٔ ابهامات، شفافسازی کنیم.
آپتایم چیست؟
آپتایم معیاری است که به در دسترس بودن سرور اشاره دارد. با این حال این تعریف کاملی نیست و ممکن است با مفهوم Availibility اشتباه گرفته شود. معنی Uptime دقیقاً مدت زمانی است که یک سرور کار میکند و در دسترس است. مقدار آپتایم با درصد نشان داده میشود و درصد بالای آن نشان میدهد که سختافزارها به خوبی کار میکنند و احتمال خرابی آنها پایین است. مثلاً آپتایم ۹۹ درصد یعنی سرورها ۹۹ درست زمان فعالیت خود در دسترس هستند.
Availability چیست؟
از آنجایی که پارامتر Availability هم به فارسی در دسترس بودن ترجمه می شود، گاهی باعث سردرگمی میشود. اما Availability تفاوت بزرگی با آپتایم دارد. در دسترس بودن علاوه بر زمان بالا بودن سرورها جنبههای دیگری را نیز درنظر میگیرد. درصد Availability نشان میدهد که با درنظر گرفتن زمان قطعی سرور، یک سیستم در مجموع چقدر کاربردهای موردنظر کاربران را برآورده میکند. یا به بیان دیگر، یک سیستم چند درصد از اوقات میتواند در موقعیتهای نیاز کاربران عملکرد را به آنها ارائه کند.
تفاوت Uptime و Availability
در حالی که مفهوم آپتایم صرفاً به نسبت در دسترس بودن یک دستگاه سختافزاری (مثل سرور) اشاره دارد، Availability کمی دورتر میرود و در کادر بزرگتری به ماجرا نگاه میکند.
مثلاً اگر آپتایم ضمانت میکند که ۹۹ درصد اوقات یک سال سرورها در دسترس باشند؛ Availability بررسی میکند که حالا با این درصد آپتایم، وضعیت ارائه سرویس به مشتری چگونه است. یعنی مجموعاً توانایی کلاینت، کاربر نهایی و مشتریان برای دسترسی کامل به فرمها، دادههای مشتری، و سایر مطالب در سرورها چه میزان است. درواقع Availability درصدی از زمان که تمام سیستم یا محصول برای کاربر قابل استفاده است را بررسی میکند و میشود گفت که محوریت آن روی تجربهٔ کاربر است نه صرفاً عملکرد سختافزارها. Availability هم مثل آپتایم بر اساس درصد تعیین میشود.
آپتایم مهمتر است یا در دسترس بودن؟
در توافقنامهٔ (SLA) آپتایم بهعنوان زمان تضمینشدۀ بالا بودن سختافزار نسبت به عملکرد گذشتهٔ آن تعیین میشود. یعنی آنچه که در آینده رخ میدهد بهطور قطع تضمین نمیشود. در حالی که Availability خروجی نهایی برای کاربران را در نظر میگیرد. مدت زمان خرابی و تعمیر سرورها در آپتایم نشان داده نمیشوند؛ اما در این مفهوم، زمان کار سیستم و هرگونه خرابی برنامهریزیشده یا برنامهریزینشدهای که بر دسترسی به سیستم تأثیر میگذارد، در نظر گرفته میشود.
اثر هندوانهای و دردسرهای Uptime و SLA!
در استانداردهای بینالمللی، میان شرکتهای خدماتدهنده و مشتریان قراردادی به نام SLA تعریف میشود. سند Service Agreement Level استانداردهای خدماتی که کسب و کار موظف است به مشتری عرضه کند را تعریف میکند.
مثلاً درمورد آپتایم سرور، شرکت تامین کننده در سند SLA تضمین میکند که آپتایم سطح SLA 99.99٪ معادل ۵۲ دقیقه و ۳۶ ثانیه در سال، جای عدم دسترسی دارد.
همه چیز دربارهٔ SLA خوب است تا زمانی که اثر هندوانهای روی آن اتفاق نیفتد. اثر هندوانه در SLA کسبوکارها، پدیدهای است که همه چیز را از بیرون سبز نشان میدهد، اما واقعیت از درون به رنگ خون است. به بیان دیگر، آنچه در سند SLA آمده است، یا کاربرد ندارد یا منسوخ شده است؛ یا اینکه آنچه در سند تعریف شده از سمت کسبوکار خوب بهنظر میرسد اما از نظر مشتری مناسب نیست.
برای مثال اگر شرکت هاستینگی آپتایم ۹۰ درصد را با افتخار بیان میکند، اما مشتریان از ۳۰ روز اختلال در دسترسی ناراضی هستند، اثرهندوانهای رخ داده است.
نحوۀ محاسبه آپتایم سرور چگونه است؟
در یک فرمول ساده میتوان گفت آپتایم سالانه عبارت است از :
تعداد ساعات کارکرد سرویس در سال ÷ ۸۷۶۰ ساعت × ۱۰۰ = درصد آپتایم سالانه
عدد ۸۷۶۰ تعداد کل ساعات یک سال (۲۴ ساعت یک روز * ۳۶۵ روز در سال) را نشان میدهد.
مثال اندازه گیری آپتایم:
اجازه بدهید روش محاسبهٔ ماهیانه را نیز با یک مثال توضیح دهیم. فرض کنید یک سایت را در طول ۲۴ساعت (که به ۸۶۴۰۰ ثانیه ترجمه می شود) مانیتور کردهاید و در این بازه زمانی وب سایت به مدت ۱۰ دقیقه (۶۰۰ ثانیه) از کار افتاده است. برای تعیین درصد زمان کار و خرابی، محاسبه زیر انجام می شود:
- کل زمان از کار افتادن سایت شما: ۶۰۰ ثانیه
- کل زمان مانیتورینگ سایت شما: ۸۶۴۰۰ ثانیه
- درصد داونتایم= ۶۰۰ ثانیه / ۸۶۴۰۰ ثانیه = ۰.۰۰۶۹ = ۰.۶۹٪
- درصد آپتایم = ۱۰۰٪ – ۰.۶۹٪ = ۹۹.۳۱٪\
ماجرای آپتایم ۹۹.۹۹۹ چیست؟
اگر اهل مطالعه به زبان انگلیسی دربارهٔ وب و سرور هستید، احتمالاً اصطلاح Nine Five را شنیدهاید. منظور از این ۵تا نُه درواقع ۹۹.۹۹۹ درصدهای دقیقتر آپتایم است که هریک جزئیات نهفتهای در خود دارند.
با دیدی سطحی ممکن است آپتایم ۹۹.۹ و ۹۹.۹۹ چندان تفاوتی با یکدیگر نداشته باشند، اما اگر کمی عمیقتر شویم میبینیم که اعداد بعد از اعشار تا چه حد حیاتی هستند. یک سرور معمولی با آپتایم ۹۹٪ در واقع ۸۸ ساعت در سال از کار میافتد. اگر این ساعات پیک فروش وبسایتهای فروشگاهی یا رخدادهای مهم وبسایتهای بزرگ باشند، خسارات میتوانند جبرانناپذیر باشند.
میانگین هزینه هر ساعت از کار افتادن سایت کسبوکارها با نرخ جهانی ۱۶۳۶۷۴ دلار است! قابل تخمین است که این عدد با نرخ داخلی کوچکتر است؛ اما با این حال دقایق داونتایم خسارت به دنبال دارند.
با توجه به جدول بالا میبینید که چه حجمی از خسارت با اضافه شدن هریک از این نُهها از روی دوش کسبوکار برداشته میشود.
چه عواملی در پدیدار شدن Five Nine تاثیرگذارند؟
در واقع دو فاکتور اصلی در عملکرد آپتایم تأثیرگذار هستند: نیروی انسانی و توازن بار.
اگر شرکت هاستینگ بتواند از تعداد بیشتری سرور در سرویسهای میزبانی استفاده کند، توازن بار را بهخوبی رعایت کرده است. یعنی بهجای این که تمام دادهها روی یک سرور نگهداری شوند و خرابی آن سرور بتواند منجر به خسارت شود، سرورهای بک آپ بتوانند در صورت بروز خرابی بهصورت جایگزین کار کنند.
فاکتور بعدی تخصص و تجربۀ تیم بازیابی در نگهداری از سرورها است. اگر پرسنل فنی هاستینگ توانمندی بالایی برای مدیریت بحرانها و جایگزینی نداشته باشند، خرابی سرورها میتواند فاجعهبار باشد.
آیا آپتایمِ ۱۰۰ درصد، ممکن است؟
پیشتر بهصورت خلاصه اشاره کردیم که آپتایم، قراردادی براساس عملکرد گذشتهٔ سختافزارها است و هرگز نمیتواند ضامن آینده باشد یا آن را پیشبینی کند. خب اگر خرابی و از دسترس خارج شدن سرور قابل پیشبینی باشد که علاج واقعه پیش از وقوع انجام میشود.
بنابراین میتوان گفت که آپتایم ۱۰۰ درصدی میتواند آماری موقت باشد که با بروز اولین واقعه – حتی برای یک بار در مجموع سالهای فعالیت – نزول کند. مثال سادهاش گوگل است که در سال ۲۰۱۴ با وجود آپتایم ۱۰۰٪ که جزو ادعاهای قطعیاش بود، بین ۲۵ دقیقه تا ۵۵ دقیقه در سراسر جهان قطع شد. این قطعی روی ۱۰ درصد مخاطبان گوگل تأثیرگذار بود و بله از قبل پیشبینی نشده بود! در حالی که عملکرد قبلی گوگل آپتایم ۱۰۰٪ را نشان میداد.
معرفی ۳ ابزار رایگان برای مانیتورینگ آپتایم
ابزارهای مانیتورینگ به شما امکان میدهد فعالیتهای سرور و آپتایم را بررسی کنید.
گرچه ابزارهای زیادی برای این کار وجود دارند، اما یا پرداخت اشتراک آنها بهصورت دلاری برای وبسایتهای ایرانی بسیار هزینهبر است، یا این که برای دسترسی از ایران محدودیتهایی دارند. سه ابزاری که در ادامه معرفی میشوند از این ۲ فیلتر عبور کردهاند:
۱. ابزار Monitis مختصر، مفید و رایگان
این ابزار مانیتورینگ دو پلن پولی و رایگان دارد که اگر استفادهٔ شما از ابزار مانیتورینگ به آپتایم و لود سایت و نظارتهای سطح اول بر منابع سرور و شبکه مربوط میشود؛ نسخه رایگان برایتان کافی است.
سادگی کاربرد در پنل تک صفحهای Monitis برای مبتدیها هم کاملاً گویا و واضح است و کار کردن با آن پیچیدگی خاصی ندارد. این ابزار در هر دقیقه ۵۰ تست روی سایت شما انجام میدهد که میتوان گفت فرکانس مناسبی است؛ بنابراین اگر مشکل خاصی وجود ندارد همین ابزار را به کار بگیرید.
۲. مانیتورینگ همه جانبه با Prometheus
Prometheus هم ابزاری رایگان و متنباز برای مانیتورینگ است که عملکرد مناسبی برای وبسایتهای معمولی ارائه میدهد.
پرومتئوس دادهها را به روشهای مختلفی جمعآوری میکند و آنها را بر اساس زمانبندی و با متریکهای چندبعدی بهصورت تصویری و نموداری نیز نمایش میدهد. کارکردن با این ابزار بهسادگی قبلی نیست و ممکن است در ابتدا احساس کنید با حجم زیادی از دادهها مواجه هستید. خبر خوب این که شما به تمام چیزی که در اختیارتان قرار میدهد نیاز ندارید و فقط کافی است مسیر آپتایم را دنبال کنید.
یکی از مشکلاتی که کاربران تا کنون با این ابزار داشتهاند فضای محدود ذخیرهسازی داده در درازمدت است که میتواند با راهکارهای ادغامی که به شما عرضه میکند، جبران شود.
۳. ابزار مانیتورینگ New Relic
New Relic ابزار نسبتاً جدید، اما کاملی برای مانیتورینگ است که تمرکزش روی دادههای سمت سرور است و میتواند با دستی پر از داده در خدمتگزاری حاضر شود. جالب است بدانید که این ابزار با بسیاری از ابزارهای دیگر مانیتورینگ سازگاری دارد و میتواند ادغام شود. از ویژگیهای جذاب دیگر این ابزار بایستی به امکان تنظیم هشدار اشاره کرد. شما میتوانید حاشیهٔ خطر سایت خود را برای New Relic تعریف کنید تا در صورت نزدیکشدن به آن به شما پیام بدهد یا نوتیفیکیشن ارسال کند.
پلن اصلی New Relic پولی است؛ ولی شما میتوانید ماهانه تا سقف ۱۰۰ گیگ بهصورت رایگان از این ابزار استفاده کنید. پس با یک برنامهریزی هوشمندانه بهسادگی میتوانید از New Relic بهصورت رایگان استفاده کنید.
چه مواردی باعث کاهش آپتایم میشود؟
بهطور کلی ۴ عامل اصلی بیش از هرچیز در نرخ آپتایم و داون تایم هاست نقش دارند:
۱. مشکلات اینترنت و شبکه
مشکل در مورد قطعی شبکه این است که میتواند ناشی از هر چیزی باشد، از خرابی روتر (Rooter) گرفته تا قطع کابل و مشکلات ارائهدهندۀ خدمات اینترنت.
مشکلات اینترنتی به دلایل بسیار متنوعی رخ میدهند، از خرابی روتر گرفته تا قطعی کابل و مشکلات ارائهدهندهٔ خدمات اینترنت همه چیز میتواند تاثیرگذار باشد. بنابراین تنها توصیهٔ ما دربارهٔ این نوع مشکلات انتخاب بهترین سرویسدهندهٔ اینترنت است و تمام.
۲. خطای انسانی
ما تجربهٔ خوبی از شنیدن این عبارت نداریم؛ اما خطای انسانی حتی در پیشرفتهترین کشورها در زمینه فناوری، نقش پررنگی در آپتایم و داونتایم دارد. اگر افراد در تیم توسعه یا در تیم فنی و زیرساخت هاستینگ نتوانند به موقع عیبیابی انجام داده و راهکار بیابند ،اختلال در سرویس شدت میگیرد.
برای بسیاری از کسبوکارها با منابع انسانی محدود به خصوص در تیمهای IT رفع مشکلات مربوط به امنیت یا زیرساخت میتواند بسیار دشوار باشد. اگر بودجهٔ کافی برای استخدام کارشناسان و متخصصان را ندارید، بهتر است از سرویسدهندههای میزبانی با بالاترین سطح پشتیبانی کمک بگیرید. به این ترتیب میتوانید بهصورت رایگان خدمات مربوط به امنیت و مدیریت سرور و کمک در مدیریت اصولی سایت را دریافت کنید.
۳. اختلال سختافزاری
سرورها بهطور پیشفرض جوری طراحی میشوند که بتوانند ۲۴/۷ کار کنند. اما از آنجایی که سختافزارهایی قابل فرسایش هستند، پس از مدتی میتوانند بهدلیل عدم رسیدگی یا صرفاً عمر طولانی دچار مشکل شده و بهصورت ناگهانی خاموش شوند.
گذشته از این دلایل، حوادث پیشبینینشده نیز میتوانند در اختلال سرور نقش داشته باشند. ترکیبی از این عوامل میتواند به قدری آسیب جدی به سرور وارد کند که تمام زیرساخت را از کار بیندازد.
اینجاست که یک سیستم پشتیبان به دادتان میرسد. اگر شرکت هاستینگ از پیش سرورهای پشتیبان داده را در نظر گرفته باشد، حتی در صورت خرابی کامل سرور میتواند خسارات ناشی از این اتفاقات را تا حد قابل قبولی برایتان جبران کند.
راهحلهای مبتنی برابر در این سیستم پشتیبان، بسیار کاربردی ظاهر میشوند. علاوه بر این جلسات منظم تعمیر و نگهداری تجهیزات و برررسی دائمی برای تشخیص مشکلات احتمالی میتواند تا حد مطلوبی از این وقایع پیشگیری کند.
۴. اختلال نرمافزاری
اگر سرورها روی نرمافزارهایی اجرا شوند که بهطور منظم مانیتور و به روزرسانی نمیشوند؛ نرمافزار مستعد خرابی و مسدود شدن خواهد بود. اینجاست که عامل نرمافزار هم باز به نیروی انسانی متخصص ارتباط پیدا میکند. چرا که افراد متخصص میدانند چطور نرمافزار سرور را مدیریت کنند تا همیشه با بهترین و قابل پیشبینیترین عملکرد کار کند. همچنین متخصصان میتوانند نرمافزارهای سرور را همواره امن و بهروز و بهینه نگهدارند.
۵. سرویس دهندهٔ شخص ثالث
مالکیت سرور فرآیندی پیچیده است. بسیاری از کسب و کارهایی که با سرور سر و کار دارند، از یک سرویسدهندهٔ ابری کمک میگیرند تا دسترسی آنلاین همیشگی به سرورها داشته باشند. حال اگر این سرویسدهندگان ابری به اختلال بربخورند، کسب و کار واسطه و کسب و کار شما بهعنوان مشتری نیز دچار مشکل میشود. بنابراین بهتر است پیش از خرید میزبانی وب بررسی کنید و ببینید خدمات ثانویه از سمت کدام یک از شرکتهای فناوری ابری به شما ارائه میشود و عملکرد آنها تاکنون چطور بوده است. خوشبختانه، اکثر ارائهدهندگان سرور ابری به ابزارها و موارد اضافی مجهز هستند تا مطمئن شوند که تجربۀ سرور میزبان شما یکپارچه و قابل اعتماد باقی میماند.
Uptime سرورهای لیموهاست چطور است؟
ما در لیموهاست تا کنون توانستهایم، عنوان تنها ارائهدهندهٔ آپتایم ۱۰۰ درصد در کشور را حفظ کنیم. زیرساختهای سختافزاری لیموهاست شامل سرورهای Ampere و هاردهای نسل جدید Nvme بالاترین عملکرد را نسبت به رقبای خود دارند. تیم امنیت شبکه و مدیریت زیرساخت از میان مجربترین متخصصان این حوزه انتخاب شده و بهصورت ۲۴ساعته در حال رصد تمام رخدادها هستند.
بنابراین هرگونه اختلال در سرویس یا از قبل پیشبینی میشود و در صورت بروز در کمترین زمان ممکن با راهکارهای جایگزین خنثی میشود. تمامی مشترکان لیموهاست با خرید هاست و اجاره سرور ـ از هر نوعی که باشد ـ به این سطح از کیفیت و سرعت دسترسی خواهند داشت.
جمعبندی
با تمام آنچه در پاسخ به سوال «آپتایم (Uptime) چیست؟» توضیح دادیم، بایستی اضافه کنیم که این مفهوم صرفاً برای شناخت عملکرد سختافزار مورد استفاده است. برای تخمین دسترسی کلی بد نیست دربارهٔ مفهوم Availibility نیز اطلاعات بیشتری کسب کنید. ابزارهای مانیتورینگی که در این مقاله معرفی کردیم، صرفاً برای مانیتور رایگان آپتایم کاربرد دارد. بنابراین اگر ابزار مانیتورینگ پولی را خریداری کردهاید، میتوانید فاکتور آپتایم را نیز در همان ابزارها پیگیری کنید. یادتان باشد اگر مشترک لیموهاست هستید، میتوانید با پشتیبانی تماس حاصل کنید و سوالات خود را مستقیماً از متخصصان وب ما بپرسید. در غیر این صورت از بخش کامنتهای زیر همین پست از ما بپرسید و پاسخ بگیرید.
دیدگاه ها
اولین نفری باشید که دیدگاه خود را ثبت می کنید