Robots.txt

Robots.txt

فایل robots.txt یک فایل متنی است که در ریشه وب‌سایت قرار می‌گیرد و به موتورهای جستجو راهنمایی می‌کند که کدام بخش‌های سایت را می‌توانند فهرست کنند و یا از فهرست‌دهی آنها جلوگیری کنند. این فایل به موتورهای جستجو اجازه یا ممنوعیت دسترسی به بخش‌های خاصی از وب‌سایت را می‌دهد.

robots.txt معمولاً برای محدود کردن دسترسی موتورهای جستجو به بخش‌های خاصی از وب‌سایت استفاده می‌شود. برای مثال، اگر قصد داشته باشید برخی از صفحات یا پوشه‌های خاصی از فهرست جستجوی گوگل یا سایر موتورهای جستجو خارج شوند، می‌توانید در فایل robots.txt دستوراتی بنویسید که موتورهای جستجو را از فهرست کردن آن بخش‌ها باز دارد.

مثالی از یک دستور در فایل robots.txt برای ممنوع کردن فهرست‌دهی یک پوشه به شکل زیر است:

User-agent: * Disallow: /folder/

در این مثال، User-agent: * به تمام موتورهای جستجو اعم از گوگل، بینگ، یا سایر موتورها اشاره دارد. Disallow: /folder/ موتورهای جستجو را از فهرست کردن محتویات پوشه «folder» در وب‌سایت منع می‌کند.

robots.txt یکی از ابزارهای مهم در مدیریت چگونگی فهرست‌دهی وب‌سایت توسط موتورهای جستجو است، اما باید به دقت و با آگاهی از تأثیرات آن استفاده شود. استفاده نادرست از فایل robots.txt می‌تواند منجر به این شود که بخش‌هایی از وب‌سایت که شما می‌خواهید در نتایج جستجو ظاهر شوند، از فهرست‌دهی خارج شوند یا برعکس، بخش‌هایی که قصد دارید مخفی بمانند، قابل دسترسی شوند.