چند سال پیش، مدیر یک مجلهٔ اینترنتی قدیمی با ۵۰ هزار مقاله با من تماس گرفت و گفت: «طاها، ما ۱۰ ساله داریم محتوا منتشر میکنیم. نویسندههای زیادی عوض شدن، کلی مطلب نوشتن. ولی ترافیکمون ۲ ساله که نه تنها بالا نمیره، که افت هم میکنه. سرچ کنسول پر از خطاهای “Crawled – currently not indexed” و “Discovered – currently not indexed” هست. انگار گوگل به ما بیاعتنا شده.»
وارد Search Console و سرور سایتش که شدم، یک گورستان دیجیتال دیدم. از ۵۰ هزار مقاله، ۳۰ هزارتایشان حتی یک بازدید در سال گذشته نداشتند! ۱۵ هزارتایشان محتوای زیر ۳۰۰ کلمه بودند، پر از کلمات کلیدی تکراری، و تاریخ انتشارشان مال ۵ سال پیش بود. کلی صفحه هم محتوای تکراری داشتند. بودجهٔ کرال گوگل صرف خزیدن در میان این صفحات بیروح میشد و به مقالات جدید و باکیفیت نمیرسید.
به مدیر سایت گفتم: «شما یک کتابخانه دارید که بیشتر قفسههایش پر از کتابهای سفید است. گوگل به جای اینکه کتابهای جدید و ارزشمند شما را نشان بدهد، وقتش را توی انباری پر از کاغذ باطله تلف میکند. اینها زامبیهای سایت شما هستند. نه زندهاند، نه مرده. فقط راه میروند و بودجهٔ کرال شما را میخورند.»
بعد از یک برنامهٔ سختگیرانهٔ پاکسازی، ۷۰٪ آن صفحات بیکیفیت و زامبی حذف یا ادغام شدند. بودجهٔ کرال مؤثر ۳ برابر شد و ترافیک ارگانیک بعد از ۶ ماه ۱۲۰٪ رشد کرد. بدون حتی یک خط محتوای جدید. رازش؟ شناسایی و ریشهکن کردن محتوای بیکیفیت و صفحات زامبی.
در این مقاله، میخواهم همان چارچوبی را که در آن پروژه و صدها پروژهٔ دیگر به کار بردم، قدمبهقدم با شما به اشتراک بگذارم.
محتوای بیکیفیت و صفحات زامبی چه هستند و چرا قاتل خاموش سئو محسوب میشوند؟
صفحات زامبی (Zombie Pages) صفحاتی در وبسایت شما هستند که نه ترافیکی میآورند، نه بکلینکی دارند، نه ارزش اطلاعاتی خاصی ارائه میدهند، اما همچنان ایندکس هستند و بودجهٔ کرال را میبلعند. آنها نه آنقدر خوب هستند که رتبه بگیرند، نه آنقدر بد که گوگل خودبهخود نادیدهشان بگیرد.
محتوای بیکیفیت (Low-Quality Content) هم شامل صفحاتی میشود که محتوای بسیار کمی دارند (Thin Content)، تکراری هستند، یا صرفاً برای موتور جستجو نوشته شدهاند بدون اینکه نیاز واقعی کاربر را برطرف کنند.
چرا این صفحات برای سئو فاجعهبارند؟
بودجهٔ کرال را هدر میدهند: گوگل هر روز تعداد محدودی صفحه از سایت شما را میخزد. اگر بیشتر وقتش صرف این صفحات بیارزش شود، صفحات مهم و جدید شما ممکن است هفتهها دیده نشوند.
سیگنالهای کیفیت کلی سایت را کاهش میدهند: الگوریتمهای گوگل (مثل Helpful Content Update) به کل دامنه نگاه میکنند. اگر درصد زیادی از سایت شما محتوای بیکیفیت باشد، ممکن است کل سایت با یک کاهش رتبهٔ سراسری مواجه شود.
تجربهٔ کاربری را خراب میکنند: کاربری که از طریق یک لینک داخلی یا جستجو به یک صفحهٔ بیکیفیت برسد، سریع آن را ترک میکند و سیگنال منفی به گوگل میفرستد.
ارزش لینکهای داخلی را کم میکنند: اگر از صفحات با ارزش خود به صفحات زامبی لینک بدهید، «عصارهٔ اعتماد» را هدر دادهاید.
پس شناسایی و اصلاح این صفحات، فقط یک «تمیزکاری» نیست، یک بازسازی زیربنایی استراتژی سئو است.
قدم اول: کجا دنبال زامبیها بگردیم؟ (نقشهٔ گنج معکوس)
برای شکار این صفحات، باید سه منبع اصلی داده را با هم ترکیب کنیم.
۱. گوگل سرچ کنسول: جایی که گوگل بادقت به شما میگوید کدام صفحات بیارزشند
گزارش Performance:
بازهٔ زمانی را روی ۱۲ تا ۱۶ ماه گذشته بگذار.
تب Pages را باز کن.
صفحات را بر اساس Clicks مرتب کن (از کمترین به بیشترین). صفحاتی که در ۱۲ ماه گذشته کمتر از ۱۰ کلیک دریافت کردهاند را استخراج کن.
یک قدم جلوتر: صفحاتی که Impressions هم ندارند یا خیلی کم دارند (مثلاً زیر ۵۰ ایمپرشن)، زامبیهای خالصند.
CTR غیرعادی: صفحاتی که ایمپرشن بالا ولی CTR خیلی پایین دارند (زیر ۱٪)، ممکن است مشکل عدم تطابق عنوان و محتوا داشته باشند یا کلاً محتوای بیربط.
گزارش Coverage (صفحات):
صفحات با وضعیت Crawled – currently not indexed یا Discovered – currently not indexed.
URL هایی که با خطای Submitted URL seems to be a Soft 404 یا Duplicate without user-selected canonical یا Alternate page with proper canonical tag علامتگذاری شدهاند. اینها گنجینهٔ صفحات زامبی و تکراری هستند.
۲. گوگل آنالیتیکس (GA4): از نگاه کاربر
گزارش Pages and Screens:
بازهٔ ۱۲ ماهه.
فیلتر کن: Views پایین (مثلاً کمتر از ۵۰ بازدید در سال).
حالا میانگین Engagement Time را ببین. اگر زیر ۱۰ ثانیه است، یعنی محتوا احتمالاً بیکیفیت است یا کاربر را جذب نکرده.
Bounce Rate بالا (در UA) یا Engagement Rate پایین (در GA4) برای این صفحات.
صفحاتی که Entrances دارند ولی Views خیلی پایین و Exits بالا. اینها درهای ورودی شکستخوردهاند.
۳. کرال با ابزارهایی مثل Screaming Frog: نبشقبر کردن مردگان متحرک
کل سایت را کرال کن. ستونهای زیر را بررسی کن:
Word Count: صفحاتی با کمتر از ۳۰۰ کلمه محتوای واقعی. (مراقب باش صفحاتی مثل «تماس با ما» یا «سبد خرید» را حذف کن.)
Indexability: صفحاتی که
noindexنیستند ولی نباید ایندکس شوند (صفحات برچسب، آرشیو، جستجوی داخلی)، باnoindexیا Canonical اصلاحشان کن.Duplicate Content: صفحاتی که تایتل، H1 یا کل محتوای آنها دقیقاً تکراری است.
Orphan Pages (یتیم): صفحاتی که هیچ لینک داخلی به آنها اشاره نمیکند. اگر ترافیکی هم ندارند، زامبی کامل هستند.
۴. یک فیلتر دستی (اختیاری ولی دقیق)
از میان لیست بلندبالایی که به دست آوردی، یک نمونهٔ تصادفی ۵۰ تایی انتخاب کن. خودت صفحه را در مرورگر باز کن و از خودت بپرس: «آیا این محتوا واقعاً قرار است برای کسی مفید باشد؟» گاهی یک مقالهٔ قدیمی ممکن است ترافیک کمی داشته باشد اما آنقدر تخصصی و عمیق است که ارزش نگهداری دارد. این فیلتر انسانی، خطای دادههای عددی را میگیرد.
قدم دوم: دستهبندی و اقدام: برای هر زامبی یک حکم قطعی صادر کن
بعد از شناسایی، نمیتوانی همه را یکسان پاک کنی. این چهار حکم را بر اساس ماتریس ارزش (ترافیک/بکلینک) و کیفیت محتوا صادر کن:
| وضعیت صفحه | حکم | اقدام فنی |
|---|---|---|
| کیفیت پایین + ترافیک صفر + بکلینک صفر + قدیمی | اعدام (Delete) | صفحه را حذف کن. URL را ۴۱۰ (Gone) برگردان (نه ۴۰۴). ۴۱۰ یعنی «برای همیشه رفته». |
| کیفیت پایین + ترافیک صفر + بکلینک دارد | تبعید (Redirect 301) | URL را ۳۰۱ کن به نزدیکترین صفحهٔ مرتبط و باکیفیت (محصول مشابه، دستهٔ اصلی، یا یک مقالهٔ جامع). |
| کیفیت متوسط + ترافیک پایین + پتانسیل دارد | بازپروری (Improve) | محتوا را با تحقیق جدید، عمق بیشتر، و بهروزرسانی اطلاعات گسترش بده. تایتل و متا را بهینه کن. تاریخ انتشار را بهروز کن. |
| کیفیت پایین ولی با چند صفحهٔ مشابه همپوشانی دارد | ادغام (Consolidate) | محتوای این صفحات را در یک صفحهٔ جامع و قدرتمند ادغام کن. صفحات قدیمی را ۳۰۱ به این صفحهٔ جدید کن. |
نکتهٔ کلیدی: شجاع باش. حذف یک صفحهٔ بیکیفیت، به مراتب بهتر از نگهداشتن آن و آلودهکردن سیگنالهای کیفیت سایت است. من بارها دیدهام که بعد از یک هرس اساسی، ترافیک جهش پیدا کرده، چون گوگل نفس راحتی کشیده.
قدم سوم: بعد از پاکسازی، گوگل را از جسدکشی باخبر کن
نقشهٔ سایت XML: بعد از حذف یا ریدایرکت صفحات، حتماً یک نقشهٔ سایت جدید و تمیز بساز و در Search Console ثبت کن. URL های ۴۱۰شده یا ۳۰۱شده نباید در نقشهٔ سایت باشند.
درخواست ایندکس نکردن (Removal Tool): اگر عجله داری که گوگل سریعاً صفحات حذفشده را از ایندکس خارج کند، میتوانی از ابزار «حذف موقت» در Search Console استفاده کنی (برای ۶ ماه صفحه را مخفی میکند). اما بهترین راه، ریدایرکت ۳۰۱ و ۴۱۰ است.
ارسال دستی نقشهٔ سایت و درخواست کرال برای بخشهای مهم.
صبور باش. ممکن است چند هفته تا ۲-۳ ماه طول بکشد تا گوگل تمام صفحات زامبی را از حافظه پاک کند. در این مدت، بودجهٔ کرال به تدریج آزاد میشود و صفحات باکیفیت بیشتر دیده میشوند.
یک اسکریپت سادهٔ Python برای شکار زامبیهای پنهان
من برای سایتهای بزرگ یک اسکریپت سفارشی دارم که فرآیند را خودکار میکند. در اینجا یک نسخهٔ سادهشده از آن را برای آنالیز دادههای خروجی Search Console و کرال به اشتراک میگذارم. (نیاز به نصب کتابخانههای pandas, requests و کلید API گوگل دارد.)
# This is a conceptual script for identifying zombie pages by merging GSC and crawl dataimport pandas as pd# 1. Load GSC Performance data (exported as CSV)gsc_df = pd.read_csv('gsc_pages.csv')# Filter pages with very low clicks over 16 monthszombies = gsc_df[gsc_df['Clicks'] < 5] # less than 5 clicks# 2. Load Screaming Frog crawl data (e.g., internal_html.csv)crawl_df = pd.read_csv('screamingfrog_internal.csv')# Merge on URLmerged = zombies.merge(crawl_df, left_on='Top pages', right_on='Address', how='inner')# Add word count filterthin_zombies = merged[merged['Word Count'] < 300]# 3. Identify pages with zero backlinks (if you have Ahrefs export)# ...# Output final listthin_zombies[['Top pages', 'Clicks', 'Impressions', 'Word Count', 'Status Code']].to_csv('final_zombies.csv')این اسکریپت (بهصورت مفهومی) لیست نهایی صفحات زامبی را با فیلترهای ترکیبی تحویل میدهد. اگر بهدنبال پیادهسازی کاملتر هستید، میتوانید از API های رسمی گوگل استفاده کنید.
یک مطالعهٔ موردی واقعی: پاکسازی ۳۰ هزار زامبی و تولد دوبارهٔ یک مجله
همان مجلهٔ اینترنتی قدیمی که در ابتدا گفتم. بعد از تحلیل، متوجه شدیم از ۵۰,۰۰۰ مقاله:
۲۰,۰۰۰ مقاله زیر ۳۰۰ کلمه و بدون حتی یک کلیک در ۲ سال گذشته.
۱۰,۰۰۰ مقاله محتوای تکراری یا با همپوشانی شدید.
۴,۰۰۰ مقاله از ردهخارج (مربوط به رویدادهای گذشته مثل انتخابات ۸ سال پیش).
فقط ۵,۰۰۰ مقاله واقعاً ارزشمند و ترافیکآور بودند.
اقدامات ما (در ۳ ماه):
حذف بیرحم: ۲۰,۰۰۰ صفحهٔ مطلقاً بیارزش را حذف و ۴۱۰ کردیم.
ادغام هدفمند: ۸,۰۰۰ مقالهٔ تکراری یا با همپوشانی، در ۲۰۰ محتوای جامع (Pillar) ادغام شدند. قدیمیها ۳۰۱ به محتوای جدید شدند.
بازسازی: ۲,۰۰۰ مقالهٔ با پتانسیل، با محتوای جدید و تخصصی بازنویسی شدند.
فنی:
noindexبرای آرشیوها و برچسبها. نقشهٔ سایت جدید و تمیز.
نتایج (۶ ماه بعد):
تعداد صفحات ایندکسشده: از ۵۰,۰۰۰ به ۸,۵۰۰ (کاهش ۸۳٪ — عمدی و مثبت).
بودجهٔ کرال مؤثر (صفحات باارزش): از ۳۰٪ به ۸۵٪ افزایش یافت.
ترافیک ارگانیک: از ۶۰,۰۰۰ به ۱۳۲,۰۰۰ بازدید ماهانه (+۱۲۰٪).
میانگین رتبه: بهبود ۴۵٪ برای کلمات کلیدی اصلی.
مدیر مجله با شگفتی گفت: «ما فکر میکردیم باید هی آجر روی آجر بگذاریم، ولی راز موفقیت این بود که آجرهای شکسته را برداریم تا ساختمان نفس بکشد.»
جمعبندی: گاهی برای رشد، باید هرس کرد
صفحات زامبی و محتوای بیکیفیت مثل علفهای هرز باغ سئوی شما هستند. اگر آنها را ریشهکن نکنید، تمام آب و غذا (بودجهٔ کرال) را میمکند و درختان میوهتان (صفحات باکیفیت) خشک میشوند. شناسایی آنها با دادههای گوگل، هرسکردن با شجاعت و سپس نظارت بر بازیابی بودجهٔ کرال، یکی از بالغترین و تأثیرگذارترین کارهایی است که یک متخصص سئو میتواند انجام دهد.
امروز شروع کنید: گزارش Performance ۱۶ ماههٔ سرچ کنسول را باز کنید، صفحاتی که حتی ۱۰ کلیک هم نداشتهاند را با محتوای آنها مقایسه کنید، و اولین سری صفحات بیکیفیت را حکم اعدام یا ادغامشان را صادر کنید. نتیجه را چند ماه بعد در رتبهها و ترافیک خواهید دید.
من طاها هستم. ۱۵ سال است که سایتها را از این زامبیها پاک میکنم و جان تازهای به سئوی آنها میدم. اگر سایتتان گرفتار انبوهی از صفحات بیکیفیت شده و نمیدانید از کدامشان بگذرید و کدام را نگه دارید، با طاها حرف بزنید. یک جلسه مشاوره میتواند برنامهٔ جراحی سایت شما را مشخص کند. بدون شعار، فقط تجربه.