آنچه در این مطلب خواهید خواند

محتوای تکراری یا Duplicate content

محتوای تکراری یا Duplicate content
آنچه در این مطلب خواهید خواند

ما در کشوری زندگی می کنیم که قانون کپی رایت فقط بر روی کاغذ اجرا می شود، اما وقتی بحث درباره سئو است، گوگل شما را ارزیابی می کند. گوگل، غول موتورهای جستجوگر، بارها اعلام کرده طرفدار جدی قانون کپی رایت است و با وبسایت هایی که محتوای شما را کپی می کنند و نشر می دهند، شدیدا برخورد می کند. به هر گونه محتوای کپی شده و تکراری در فضای وب، محتوای تکراری یا Duplicate content می گویند.

تعداد کلمات: 1328 زمان مطالعه: 10 دقیقه  هم چنین می توانید فایل PDF مقاله را دانلود کنید

محتوای تکراری چیست؟

محتوای تکراری، متن، عکس یا فیلمی است که مشابه با محتوای یک وبسایت دیگر یا صفحه ای دیگر از وبسایت خود شماست! مسوول شناسایی محتوای تکراری در سایت شما، الگوریتم پاندا گوگل است.

محتوای تکراری چه تاثیری بر سئو می گذارد؟

به طور کلی، گوگل تصمیم ندارد صفحه هایی با محتوای تکراری را در رتبه بندی نتایج جستجو خود نمایش دهد. در واقع، گوگل می گوید:

“گوگل به سختی در تلاش است تا صفحاتی با محتوای متمایز (اختصاصی) را ایندکس کند و نمایش دهد.”

پس اگر شما نیز در وبسایت خود صفحاتی با محتوای غیر اختصاصی و کپی شده دارید، نتایج شما در جستجو نیز آسیب خواهد دید.

سایت هایی که محتوای تکراری یا کپی شده نشر می دهند، با سه مشکل اساسی روبرو خواهند شد:

  • ترافیک ارگانیک کمتر

مسلما وقتی گوگل حضور شما را در صفحات نتایج جستجو کمرنگ کند، ورودی شما از موتورهای جستجو نیز کم تر خواهد شد.

  • جریمه (در موارد بسیار کم)

گوگل به این نکته نیز اشاره کرده که محتوای تکراری می تواند منجر به جریمه سایت یا به طور کلی خارج شدن یک سایت از ایندکس گوگل شود. هر چند این فرآیند بسیار نادر است و تنها زمانی اتفاق می افتد که سایت تمام و کمال و عمدا در حال کپی کردن محتوای خود از وبسایت های دیگر است و به هشدارها نیز اهمیتی نمی دهد.
پس اگر مقداری “محتوای تکراری” در سایت خود دارید نباید نگران جریمه گوگل باشید، اما هم چنان نمی توانید خیلی به سئو امیدوارد باشید.

  • کاهش تعداد صفحات ایندکس شده

این مورد برای سایت هایی با تعداد صفحات بالا می تواند بسیار با اهمیت باشد، مانند سایت های فروشگاهی. برخی اوقات گوگل فقط به کاهش رتبه های سایت بسنده نمی کند، بلکه از ایندکس کردن آن امتناع می کند. پس اگر تعداد صفحات ایندکس شده شما از صفحات سایت خودتان کمتر است، احتمالا صفحات خود را با محتوای تکراری پر کرده اید.

البته ایندکس نشدن صفحات می تواند بدلایل دیگری نیز باشد، در مقاله رفع ارورهای سرچ کنسول گوگل دلایل ایندکس نشدن صفحات بهمراه رفع ارورهای آن را بررسی کردیم.

بهترین راه حل برای رهایی از محتوای تکراری چیست؟

مراقب محتوای تکراری در آدرسهای مختلف سایت باشید.

برای مثال فرض کنیم شما یک سایت فروشگاهی پوشاک دارید و یکی از محصولات شما تی شرت است. به جای اینکه برای هر سایز و رنگ مختلف یک آدرس بسازید بایستی در یک صفحه این محصول را با تمام ویژگی هایش بگنجانید، بطوریکه خریدار بتواند سایز و رنگ را در همان صفحه انتخاب کند و نیازی به ایجاد چندین آدرس با محتوای تکراری نباشد.

تعداد صفحات ایندکس شده سایت را بررسی کنید

ساده ترین روش برای یافتن محتوای تکراری این است که نگاهی به تعداد صفحات سایت خود که در گوگل ایندکس شده بیاندازید. برای این منظور آدرس سایت خود را در گوگل به این صورت جستجو کنید: site:example.com

یا نگاهی به بخش coverage در سرچ کنسول گوگل بیاندازید. این عدد بدست آمده هرچه باشد باید با مقدار صفحاتی که در سایت خود ساختید برابری کند.
برای مثال راش وب 100 صفحه ایندکس شده در گوگل دارد که با تعداد صفحاتی که ایجاد کرده ایم همخوانی دارد. اگر این عدد بالا بود برای مثال 1000 صفحه از سایت ما ایندکس شده بود مشخص می شد که ایرادی وجود دارد و به احتما زیاد نیز این صفحات محتوای تکراری دارند.

مطمئن شوید که به درستی از ریدایرکت ها استفاده می کنید

برخی اوقات شما تعداد زیادی از یک صفحه با محتوای تکراری نساخته اید، بلکه تعداد زیادی از همان صفحه با آدرس های مختلف دارید.
اگرچه کمیاب است، اما این اتفاق هم دیده شده که گاهی اوقات وبمستران عزیز فراموش می کنند که نسخه با “www” را به نسخه بدون “www” ریدایرکت کنند. (یا برعکس)
هم چنان، در مواردی نیز فراموش می شود که بعد از تهیه SSL و تغییر آدرس سایت از Http به Https ، آدرسهای Http را ریدایرکت کنند.
به طور خلاصه: تمام نسخه های سایت شما باید به یک مکان ختم شوند.

از ریدایرکت 301 استفاده کنید
ریدایرکت 301 ساده ترین راه برای حل مشکلات محتوای تکراری در سایت است. (به جای پاک کردن صفحات قدیمی با محتوای تکراری)

پس اگر صفحاتی با محتوای تکراری دارید، همگی را به صفحه ای که هدف شما بوده و کامل تر است ریدایرکت 301 کنید. دفعه بعدی که ربات های خزنده گوگل به سایت شما سر میزنند این ریدایرکت ها را می بینند و فقط صفحه اصلی را در ایندکس خود جای می دهند.

مراقب محتوای مشابه باشید

محتوای تکراری (Duplicate content)، فقط به معنی کپی کردن کلمه به کلمه محتوای سایت از منبع دیگری نیست، بلکه آنطور که گوگل تعریف می کند، محتوای تکراری یعنی:

“محتوای تکراری به طور کلی به معنی محتوای کلملا تکراری و یا به طور قابل توجهی مشابه است.”

پس مراقب باشید تا صفحاتی با هدف جداگانه ولی محتوایی مشابه نداشته باشید، کاری سخت و طاقت فرسات که برای هر صفحه از سایت، محتوایی اختصاصی بنویسید، اما اگر درباره رساندن سایت به صفحه اول نتایج گوگل مطمئن هستید، باید این سختی را به جان بخرید.
اگر وقت کافی برای تولید محتوای اختصاصی ندارید، می توانید سفارش تولید محتوا سایت خود را به راش وب بدهید. نویسندگان مجرب ما متنی اختصاصی و جذاب برای شما خواهند نوشت.

استفاده از تگ canonical برای محتوای تکراری

تگ rel=canonical به موتورهای جستجو می گوید:

“بله، ما تعدادی صفحات با محتوای تکراری داریم، اما این صفحه، صفحه اصلی هدف ماست و شما می توانید باقی صفحات را نادیده بگیرید.”

گوگل نیز می گوید که استفاده از تگ کنونیکال از بلاک کردن دسترسی ربات های خزنده با فایل robots.txt و یا تگ noindex بهتر است.
پس اگر صفحاتی با محتوای تکراری در سایت خود یافتید می توانید از یکی از روش های زیر اقدام نمایید:

  • آن ها را پاک کنید. هم از سایت هم از ابزار remove url گوگل سرچ کنسول
  • ریدایرکت کنید
  • از تگ canonical استفاده کنید.

تشخیص محتوای کپی شده

تعداد زیادی ابزار سئو وجود دارد که برای تشخیص محتواهای تکراری در سایت توسعه یافته اند. برای مثال سایت siteliner صفحات شما را برای یافتن محتواهای تکراری یا مشابه می گردد.

صفحات تکراری را به هم پیوند بزنید

همانطور که پیش تر گفتم، اگر صفحات زیادی با محتوای تکراری دارید، ممکن است بخواهید همه آنها را به یک صفحه اصلی و هدف ریدایرکت کنید یا از تگ canonical
استفاده کنید.

اما اگر صفحاتی شبیه به یکدیگر داشتیم چی؟

خب در این حالت می توانید برگردید و برای هر کدام با رعایت اصول سئو محتوایی اختصاصی تولید کنید، یا همه آن ها را در یک فحه با هم پیوند دهید و صفحه ای قدرتمند بسازید.

برای مثال بیایید فرض کنیم ما در راش وب سه صفحه با عناوین سئو داخلی، سئو ویدئو 2019 و سئو تکنیکال داریم و از لحاظ فنی این صفحات با هم متفاوت هستند ولی محتوایی مشابه با یکدیگر دارند. در این حالت بهتر است صفحه ای کامل و اختصاصی با عنوان سئو 2019 داشته باشیم و همگی این محتواها را آنجا نشر دهیم.

از آنجایی که شما محتواهای تکراری را از سایت حذف کرده اید احتمال اینکه این صفحه نتیجه بهتری در نتایج جستجو بدست آورد نیز بیشتر خواهد شد.

تگ noindex در wordpress

اگر از وردپرس برای طراحی سایت خود استفاده می کنید، حتما متوجه شده اید به صورت اتوماتیک برچسب و دسته بندی ایجاد می کند.
این صفحات ایجاد شده تعداد زیادی از صفحات با محتوای تکراری را تشکیل می دهند. از آنجایی که این صفحات برای کاربران مفید هستند پیشنهاد می کنم از تگ noindex استفاده کنید.