CreateYourVPN Academy
دوره: همه‌چیز چگونه کار می‌کند

مانیتورینگ سرور و شبکه مش

CreateYourVPN چطور مراقب سلامت سرورهاست: خودبررسی، یک شبکه مش از بررسی‌های متقابل میان سرورها، و پنهان‌سازی خودکار سرورهای غیرقابل‌دسترس از کاربران.

یک سرور می‌تواند در بدترین لحظه ممکن ناامیدتان کند: سرویسی از کار می‌افتد، ارائه‌دهنده ماشین را راه‌اندازی مجدد می‌کند — یا بدتر از همه، سرور در کشور یک کاربر مسدود می‌شود و با اینکه فنی روشن است، دیگر در دسترس نیست. کاربرانتان هرگز نباید متوجه هیچ‌کدام از این‌ها شوند. این درس درباره این است که CreateYourVPN چطور مراقب سرورهای شماست و وقتی یکی از آن‌ها دچار مشکل شود چه اتفاقی می‌افتد.

دو لایه بررسی

سیستم به هر سرور از دو زاویه نگاه می‌کند.

۱. سرور خودش را بررسی می‌کند

هر چند دقیقه یک‌بار، هر سرور گزارش می‌دهد: آیا شنونده ترافیک روی پورت ۴۴۳ زنده است، و آیا سرویس VPN در حال اجراست؟ متریک‌های درس ۳ همراه با همان گزارش می‌رسند. اگر گزارش بگوید «حالم خوب نیست»، سرور وضعیت «سرور در دسترس نیست» می‌گیرد. اگر گزارش‌ها کاملاً قطع شوند، وضعیت به «داده‌ای از سرور دریافت نشد» تبدیل می‌شود — ممکن است ماشین خاموش شده یا شبکه‌اش را از دست داده باشد.

۲. سرورها به «در همدیگر می‌زنند»

خودبررسی نمی‌تواند موذیانه‌ترین مورد را بگیرد: سروری که باور دارد سالم است، اما از بیرون قابل‌دسترسی نیست — مثلاً آی‌پی‌اش مسدود شده. به همین دلیل همه سرورهای شما در یک شبکه مش از بررسی‌های متقابل به هم می‌پیوندند: هر سرور به‌طور منظم سعی می‌کند به هر همسایه دسترسی پیدا کند — درست همان‌طور که برنامه یک کاربر این کار را می‌کند.

از آنجا، یک «رأی‌گیری» وارد عمل می‌شود:

  • یک زدن ناموفق تنها چیزی معنا ندارد — شبکه ممکن است فقط لحظه‌ای پرش کرده باشد. فقط رشته‌های مداوم از شکست‌ها به حساب می‌آیند.
  • سروری فقط زمانی «از سرورهای شما در دسترس نیست» علامت می‌خورد که چند سرور مستقل پیوسته در دسترسی به آن شکست بخورند — نظر یک سرور تنها حکم نیست.
  • محافظتی هم در برابر «شاهد غیرقابل‌اعتماد» وجود دارد: اگر سروری ناگهان ادعا کند که نیمی از همسایه‌هایش را نمی‌بیند، مشکل به احتمال زیاد از خودش است — و رأی‌های آن نادیده گرفته می‌شوند.

این دقیقاً همان طرحی است که مسدودی‌ها را می‌گیرد: اگر سروری در کشوری مسدود شود که سرورهای دیگرتان هم در آن هستند، همسایه‌های آن کشور به‌زودی دسترسی به آن را از دست می‌دهند، حد نصاب شکل می‌گیرد، و سیستم سرور را غیرقابل‌دسترس علامت می‌زند. در همین حال، سرورهای کشورهایی بدون مسدودی همچنان آن را می‌بینند — و این اختلاف نظر، تصویر را واضح می‌کند.

برای یک سرور مشکل‌دار چه اتفاقی می‌افتد

وضعیت‌ها مستقیماً به توازن بار تغذیه می‌شوند: سرورهایی با وضعیت‌های «سرور در دسترس نیست» و «از سرورهای شما در دسترس نیست» از چرخش بیرون کشیده می‌شوند — هیچ اتصال جدیدی به سمت آن‌ها فرستاده نمی‌شود، و در اشتراک‌های کاربران جای آن‌ها را سرورهای سالم از همان مسیرها می‌گیرند.

در همان حال، سیستم محتاط است — بر اساس اصل «آسیبی نرسان» ساخته شده:

  • یک مسیر هرگز خالی رها نمی‌شود. اگر همه سرورهای یک مسیر «بد» شوند، سیستم بهترین گزینه موجود را به کاربران خدمت می‌دهد به‌جای یک فهرست خالی — وگرنه برنامه‌ها تصمیم می‌گیرند سرورها ناپدید شده‌اند و آن‌ها را پاک می‌کنند.
  • سکوت حکم نیست. وضعیت «داده‌ای از سرور دریافت نشد» به‌تنهایی سرور را از چرخش خارج نمی‌کند: بدون داده تازه، سیستم حرکت ناگهانی‌ای انجام نمی‌دهد.

همه‌چیز خودش را ترمیم می‌کند

هیچ‌کدام از وضعیت‌ها برای همیشه «می‌چسبد» — وضعیت از داده‌های تازه دوباره استنتاج می‌شود:

  • سرور دوباره گزارش سالم می‌فرستد ← «سرور در دسترس نیست» برداشته می‌شود؛
  • همسایه‌ها دوباره به آن دسترسی پیدا می‌کنند ← رشته شکست بازنشانی می‌شود، و نشان «از سرورهای شما در دسترس نیست» ناپدید می‌شود؛
  • گزارش‌ها از سر گرفته می‌شوند ← «داده‌ای از سرور دریافت نشد» ناپدید می‌شود.

سرور را تعمیر کنید (یا صبر کنید تا مسدودی‌اش برداشته شود) — و خودش دوباره وارد سرویس می‌شود. هیچ «دوباره روشنش کن» دستی لازم نیست.

کجای پنل این را ببینیم

کارت هر کاربر را باز کنید ← فهرست سرورهای او: کنار هر سرور یک نقطه وضعیت هست، و وقتی چیزی خراب است — یک عنوان با دلیل: «سرور در دسترس نیست»، «از سرورهای شما در دسترس نیست» (شامل اینکه چند سرور شما نمی‌توانند آن را ببینند)، یا «داده‌ای از سرور دریافت نشد». نشانه‌های غیرمستقیم هم روی کارت‌های سرور دیده می‌شوند: نشان «قدیمی» روی متریک‌ها و «بدون داده — عامل پاسخ نمی‌دهد».

بررسی‌های مش بسیار مقتصدند: تماس‌های آزمایشی کوچکی با سقف حجم روزانه سخت‌گیرانه‌اند — هیچ تأثیری روی ترافیک یا کارایی سرورهای شما ندارند.

نکات کلیدی

  • دو لایه کنترل: یک سرور خودش را بررسی می‌کند، و همسایه‌های مش آن از بیرون بررسی‌اش می‌کنند.
  • مسدودی‌ها با «رأی‌گیری» چند سرور شناسایی می‌شوند — بدون هراس از یک لغزش موردی.
  • سرورهای مشکل‌دار از چرخش خارج می‌شوند؛ کاربران بی‌سروصدا به سرورهای سالم منتقل می‌شوند.
  • همه‌چیز خودش ترمیم می‌شود: به‌محض اینکه سروری دوباره زنده شود، به‌طور خودکار بازمی‌پیوندد.

بعدی

زیرساخت می‌داند چطور خودش را تعمیر کند، اما یک چیز هست که ارزش دارد جداگانه محافظت شود — پایگاه کاربران شما.

On this page