شناسایی و اصلاح صفحات زامبی | راهنمای عملی – طاها سئو

چند سال پیش، مدیر یک مجلهٔ اینترنتی قدیمی با ۵۰ هزار مقاله با من تماس گرفت و گفت: «طاها، ما ۱۰ ساله داریم محتوا منتشر می‌کنیم. نویسنده‌های زیادی عوض شدن، کلی مطلب نوشتن. ولی ترافیکمون ۲ ساله که نه تنها بالا نمیره، که افت هم می‌کنه. سرچ کنسول پر از خطاهای “Crawled – currently not indexed” و “Discovered – currently not indexed” هست. انگار گوگل به ما بی‌اعتنا شده.»

وارد Search Console و سرور سایتش که شدم، یک گورستان دیجیتال دیدم. از ۵۰ هزار مقاله، ۳۰ هزارتایشان حتی یک بازدید در سال گذشته نداشتند! ۱۵ هزارتایشان محتوای زیر ۳۰۰ کلمه بودند، پر از کلمات کلیدی تکراری، و تاریخ انتشارشان مال ۵ سال پیش بود. کلی صفحه هم محتوای تکراری داشتند. بودجهٔ کرال گوگل صرف خزیدن در میان این صفحات بی‌روح می‌شد و به مقالات جدید و باکیفیت نمی‌رسید.

به مدیر سایت گفتم: «شما یک کتابخانه دارید که بیشتر قفسه‌هایش پر از کتاب‌های سفید است. گوگل به جای اینکه کتاب‌های جدید و ارزشمند شما را نشان بدهد، وقتش را توی انباری پر از کاغذ باطله تلف می‌کند. اینها زامبی‌های سایت شما هستند. نه زنده‌اند، نه مرده. فقط راه می‌روند و بودجهٔ کرال شما را می‌خورند.»

بعد از یک برنامهٔ سختگیرانهٔ پاکسازی، ۷۰٪ آن صفحات بی‌کیفیت و زامبی حذف یا ادغام شدند. بودجهٔ کرال مؤثر ۳ برابر شد و ترافیک ارگانیک بعد از ۶ ماه ۱۲۰٪ رشد کرد. بدون حتی یک خط محتوای جدید. رازش؟ شناسایی و ریشه‌کن کردن محتوای بی‌کیفیت و صفحات زامبی.

در این مقاله، می‌خواهم همان چارچوبی را که در آن پروژه و صدها پروژهٔ دیگر به کار بردم، قدم‌به‌قدم با شما به اشتراک بگذارم.


محتوای بی‌کیفیت و صفحات زامبی چه هستند و چرا قاتل خاموش سئو محسوب می‌شوند؟

صفحات زامبی (Zombie Pages) صفحاتی در وب‌سایت شما هستند که نه ترافیکی می‌آورند، نه بک‌لینکی دارند، نه ارزش اطلاعاتی خاصی ارائه می‌دهند، اما همچنان ایندکس هستند و بودجهٔ کرال را می‌بلعند. آنها نه آنقدر خوب هستند که رتبه بگیرند، نه آنقدر بد که گوگل خودبه‌خود نادیده‌شان بگیرد.

محتوای بی‌کیفیت (Low-Quality Content) هم شامل صفحاتی می‌شود که محتوای بسیار کمی دارند (Thin Content)، تکراری هستند، یا صرفاً برای موتور جستجو نوشته شده‌اند بدون اینکه نیاز واقعی کاربر را برطرف کنند.

چرا این صفحات برای سئو فاجعه‌بارند؟

  • بودجهٔ کرال را هدر می‌دهند: گوگل هر روز تعداد محدودی صفحه از سایت شما را می‌خزد. اگر بیشتر وقتش صرف این صفحات بی‌ارزش شود، صفحات مهم و جدید شما ممکن است هفته‌ها دیده نشوند.

  • سیگنال‌های کیفیت کلی سایت را کاهش می‌دهند: الگوریتم‌های گوگل (مثل Helpful Content Update) به کل دامنه نگاه می‌کنند. اگر درصد زیادی از سایت شما محتوای بی‌کیفیت باشد، ممکن است کل سایت با یک کاهش رتبهٔ سراسری مواجه شود.

  • تجربهٔ کاربری را خراب می‌کنند: کاربری که از طریق یک لینک داخلی یا جستجو به یک صفحهٔ بی‌کیفیت برسد، سریع آن را ترک می‌کند و سیگنال منفی به گوگل می‌فرستد.

  • ارزش لینک‌های داخلی را کم می‌کنند: اگر از صفحات با ارزش خود به صفحات زامبی لینک بدهید، «عصارهٔ اعتماد» را هدر داده‌اید.

پس شناسایی و اصلاح این صفحات، فقط یک «تمیزکاری» نیست، یک بازسازی زیربنایی استراتژی سئو است.


قدم اول: کجا دنبال زامبی‌ها بگردیم؟ (نقشهٔ گنج معکوس)

برای شکار این صفحات، باید سه منبع اصلی داده را با هم ترکیب کنیم.

۱. گوگل سرچ کنسول: جایی که گوگل بادقت به شما می‌گوید کدام صفحات بی‌ارزشند

  • گزارش Performance:

    • بازهٔ زمانی را روی ۱۲ تا ۱۶ ماه گذشته بگذار.

    • تب Pages را باز کن.

    • صفحات را بر اساس Clicks مرتب کن (از کمترین به بیشترین). صفحاتی که در ۱۲ ماه گذشته کمتر از ۱۰ کلیک دریافت کرده‌اند را استخراج کن.

    • یک قدم جلوتر: صفحاتی که Impressions هم ندارند یا خیلی کم دارند (مثلاً زیر ۵۰ ایمپرشن)، زامبی‌های خالصند.

    • CTR غیرعادی: صفحاتی که ایمپرشن بالا ولی CTR خیلی پایین دارند (زیر ۱٪)، ممکن است مشکل عدم تطابق عنوان و محتوا داشته باشند یا کلاً محتوای بی‌ربط.

  • گزارش Coverage (صفحات):

    • صفحات با وضعیت Crawled – currently not indexed یا Discovered – currently not indexed.

    • URL هایی که با خطای Submitted URL seems to be a Soft 404 یا Duplicate without user-selected canonical یا Alternate page with proper canonical tag علامت‌گذاری شده‌اند. اینها گنجینهٔ صفحات زامبی و تکراری هستند.

۲. گوگل آنالیتیکس (GA4): از نگاه کاربر

  • گزارش Pages and Screens:

    • بازهٔ ۱۲ ماهه.

    • فیلتر کن: Views پایین (مثلاً کمتر از ۵۰ بازدید در سال).

    • حالا میانگین Engagement Time را ببین. اگر زیر ۱۰ ثانیه است، یعنی محتوا احتمالاً بی‌کیفیت است یا کاربر را جذب نکرده.

    • Bounce Rate بالا (در UA) یا Engagement Rate پایین (در GA4) برای این صفحات.

    • صفحاتی که Entrances دارند ولی Views خیلی پایین و Exits بالا. اینها درهای ورودی شکست‌خورده‌اند.

۳. کرال با ابزارهایی مثل Screaming Frog: نبش‌قبر کردن مردگان متحرک

  • کل سایت را کرال کن. ستون‌های زیر را بررسی کن:

    • Word Count: صفحاتی با کمتر از ۳۰۰ کلمه محتوای واقعی. (مراقب باش صفحاتی مثل «تماس با ما» یا «سبد خرید» را حذف کن.)

    • Indexability: صفحاتی که noindex نیستند ولی نباید ایندکس شوند (صفحات برچسب، آرشیو، جستجوی داخلی)، با noindex یا Canonical اصلاحشان کن.

    • Duplicate Content: صفحاتی که تایتل، H1 یا کل محتوای آنها دقیقاً تکراری است.

    • Orphan Pages (یتیم): صفحاتی که هیچ لینک داخلی به آنها اشاره نمی‌کند. اگر ترافیکی هم ندارند، زامبی کامل هستند.

۴. یک فیلتر دستی (اختیاری ولی دقیق)

از میان لیست بلندبالایی که به دست آوردی، یک نمونهٔ تصادفی ۵۰ تایی انتخاب کن. خودت صفحه را در مرورگر باز کن و از خودت بپرس: «آیا این محتوا واقعاً قرار است برای کسی مفید باشد؟» گاهی یک مقالهٔ قدیمی ممکن است ترافیک کمی داشته باشد اما آنقدر تخصصی و عمیق است که ارزش نگهداری دارد. این فیلتر انسانی، خطای داده‌های عددی را می‌گیرد.


قدم دوم: دسته‌بندی و اقدام: برای هر زامبی یک حکم قطعی صادر کن

بعد از شناسایی، نمی‌توانی همه را یکسان پاک کنی. این چهار حکم را بر اساس ماتریس ارزش (ترافیک/بک‌لینک) و کیفیت محتوا صادر کن:

وضعیت صفحهحکماقدام فنی
کیفیت پایین + ترافیک صفر + بک‌لینک صفر + قدیمیاعدام (Delete)صفحه را حذف کن. URL را ۴۱۰ (Gone) برگردان (نه ۴۰۴). ۴۱۰ یعنی «برای همیشه رفته».
کیفیت پایین + ترافیک صفر + بک‌لینک داردتبعید (Redirect 301)URL را ۳۰۱ کن به نزدیک‌ترین صفحهٔ مرتبط و باکیفیت (محصول مشابه، دستهٔ اصلی، یا یک مقالهٔ جامع).
کیفیت متوسط + ترافیک پایین + پتانسیل داردبازپروری (Improve)محتوا را با تحقیق جدید، عمق بیشتر، و به‌روزرسانی اطلاعات گسترش بده. تایتل و متا را بهینه کن. تاریخ انتشار را به‌روز کن.
کیفیت پایین ولی با چند صفحهٔ مشابه هم‌پوشانی داردادغام (Consolidate)محتوای این صفحات را در یک صفحهٔ جامع و قدرتمند ادغام کن. صفحات قدیمی را ۳۰۱ به این صفحهٔ جدید کن.

نکتهٔ کلیدی: شجاع باش. حذف یک صفحهٔ بی‌کیفیت، به مراتب بهتر از نگه‌داشتن آن و آلوده‌کردن سیگنال‌های کیفیت سایت است. من بارها دیده‌ام که بعد از یک هرس اساسی، ترافیک جهش پیدا کرده، چون گوگل نفس راحتی کشیده.


قدم سوم: بعد از پاکسازی، گوگل را از جسدکشی باخبر کن

  • نقشهٔ سایت XML: بعد از حذف یا ریدایرکت صفحات، حتماً یک نقشهٔ سایت جدید و تمیز بساز و در Search Console ثبت کن. URL های ۴۱۰‌شده یا ۳۰۱‌شده نباید در نقشهٔ سایت باشند.

  • درخواست ایندکس نکردن (Removal Tool): اگر عجله داری که گوگل سریعاً صفحات حذف‌شده را از ایندکس خارج کند، می‌توانی از ابزار «حذف موقت» در Search Console استفاده کنی (برای ۶ ماه صفحه را مخفی می‌کند). اما بهترین راه، ریدایرکت ۳۰۱ و ۴۱۰ است.

  • ارسال دستی نقشهٔ سایت و درخواست کرال برای بخش‌های مهم.

  • صبور باش. ممکن است چند هفته تا ۲-۳ ماه طول بکشد تا گوگل تمام صفحات زامبی را از حافظه پاک کند. در این مدت، بودجهٔ کرال به تدریج آزاد می‌شود و صفحات باکیفیت بیشتر دیده می‌شوند.


یک اسکریپت سادهٔ Python برای شکار زامبی‌های پنهان

من برای سایت‌های بزرگ یک اسکریپت سفارشی دارم که فرآیند را خودکار می‌کند. در اینجا یک نسخهٔ ساده‌شده از آن را برای آنالیز داده‌های خروجی Search Console و کرال به اشتراک می‌گذارم. (نیاز به نصب کتابخانه‌های pandasrequests و کلید API گوگل دارد.)

python
# This is a conceptual script for identifying zombie pages by merging GSC and crawl dataimport pandas as pd# 1. Load GSC Performance data (exported as CSV)gsc_df = pd.read_csv('gsc_pages.csv')# Filter pages with very low clicks over 16 monthszombies = gsc_df[gsc_df['Clicks'] < 5]  # less than 5 clicks# 2. Load Screaming Frog crawl data (e.g., internal_html.csv)crawl_df = pd.read_csv('screamingfrog_internal.csv')# Merge on URLmerged = zombies.merge(crawl_df, left_on='Top pages', right_on='Address', how='inner')# Add word count filterthin_zombies = merged[merged['Word Count'] < 300]# 3. Identify pages with zero backlinks (if you have Ahrefs export)# ...# Output final listthin_zombies[['Top pages', 'Clicks', 'Impressions', 'Word Count', 'Status Code']].to_csv('final_zombies.csv')

این اسکریپت (به‌صورت مفهومی) لیست نهایی صفحات زامبی را با فیلترهای ترکیبی تحویل می‌دهد. اگر به‌دنبال پیاده‌سازی کامل‌تر هستید، می‌توانید از API های رسمی گوگل استفاده کنید.


یک مطالعهٔ موردی واقعی: پاکسازی ۳۰ هزار زامبی و تولد دوبارهٔ یک مجله

همان مجلهٔ اینترنتی قدیمی که در ابتدا گفتم. بعد از تحلیل، متوجه شدیم از ۵۰,۰۰۰ مقاله:

  • ۲۰,۰۰۰ مقاله زیر ۳۰۰ کلمه و بدون حتی یک کلیک در ۲ سال گذشته.

  • ۱۰,۰۰۰ مقاله محتوای تکراری یا با هم‌پوشانی شدید.

  • ۴,۰۰۰ مقاله از رده‌خارج (مربوط به رویدادهای گذشته مثل انتخابات ۸ سال پیش).

  • فقط ۵,۰۰۰ مقاله واقعاً ارزشمند و ترافیک‌آور بودند.

اقدامات ما (در ۳ ماه):

  1. حذف بی‌رحم: ۲۰,۰۰۰ صفحهٔ مطلقاً بی‌ارزش را حذف و ۴۱۰ کردیم.

  2. ادغام هدفمند: ۸,۰۰۰ مقالهٔ تکراری یا با هم‌پوشانی، در ۲۰۰ محتوای جامع (Pillar) ادغام شدند. قدیمی‌ها ۳۰۱ به محتوای جدید شدند.

  3. بازسازی: ۲,۰۰۰ مقالهٔ با پتانسیل، با محتوای جدید و تخصصی بازنویسی شدند.

  4. فنی: noindex برای آرشیوها و برچسب‌ها. نقشهٔ سایت جدید و تمیز.

نتایج (۶ ماه بعد):

  • تعداد صفحات ایندکس‌شده: از ۵۰,۰۰۰ به ۸,۵۰۰ (کاهش ۸۳٪ — عمدی و مثبت).

  • بودجهٔ کرال مؤثر (صفحات باارزش): از ۳۰٪ به ۸۵٪ افزایش یافت.

  • ترافیک ارگانیک: از ۶۰,۰۰۰ به ۱۳۲,۰۰۰ بازدید ماهانه (+۱۲۰٪).

  • میانگین رتبه: بهبود ۴۵٪ برای کلمات کلیدی اصلی.

مدیر مجله با شگفتی گفت: «ما فکر می‌کردیم باید هی آجر روی آجر بگذاریم، ولی راز موفقیت این بود که آجرهای شکسته را برداریم تا ساختمان نفس بکشد.»


جمع‌بندی: گاهی برای رشد، باید هرس کرد

صفحات زامبی و محتوای بی‌کیفیت مثل علف‌های هرز باغ سئوی شما هستند. اگر آنها را ریشه‌کن نکنید، تمام آب و غذا (بودجهٔ کرال) را می‌مکند و درختان میوه‌تان (صفحات باکیفیت) خشک می‌شوند. شناسایی آنها با داده‌های گوگل، هرس‌کردن با شجاعت و سپس نظارت بر بازیابی بودجهٔ کرال، یکی از بالغ‌ترین و تأثیرگذارترین کارهایی است که یک متخصص سئو می‌تواند انجام دهد.

امروز شروع کنید: گزارش Performance ۱۶ ماههٔ سرچ کنسول را باز کنید، صفحاتی که حتی ۱۰ کلیک هم نداشته‌اند را با محتوای آنها مقایسه کنید، و اولین سری صفحات بی‌کیفیت را حکم اعدام یا ادغامشان را صادر کنید. نتیجه را چند ماه بعد در رتبه‌ها و ترافیک خواهید دید.

من طاها هستم. ۱۵ سال است که سایت‌ها را از این زامبی‌ها پاک می‌کنم و جان تازه‌ای به سئوی آنها می‌دم. اگر سایتتان گرفتار انبوهی از صفحات بی‌کیفیت شده و نمی‌دانید از کدامشان بگذرید و کدام را نگه دارید، با طاها حرف بزنید. یک جلسه مشاوره می‌تواند برنامهٔ جراحی سایت شما را مشخص کند. بدون شعار، فقط تجربه.

ارسال دیدگاه شما