• فناوری
  • سرگرمی


❶ساخت آنلاین و سریع و رایگان فایل robots.txt ساختن فایل روبات.TXT برای وبمستر 


آیا نقدینگی و پایه پولی تحت کنترل است؟
پاسخ به ادعای شاخدار شکافته شدن دیوار کعبه و ترمیم آن توسط وهابیون
ارور های خزنده گوگل
دانلود فیلم The Lodgers 2017 با لینک مستقیم
ویژگی های فیزیکی و شیمیایی انواع سنگهای رسوبی و دگرگونی
چرا باید از مدافع ویندوز استفاده کنم؟
دانلود آلبوم میانبور از سیف | میانبور سیف
مزایا طرح صیانت به صورت جمع و جور/بازی قدرت ها
جدول تناوبی مندلیف عناصر
بررسی جرم مولکولی پلاستیک ها تاثیر آن روی پلاستیک ها
کاربرد های پلاستیک و ویژگی ها و میزان تولید سالیانه
مقایسه نرخ تورم در ترکیه و ایران
آیا امواج رادیویی برای سلامتی مضر هستند؟
آیا استعداد ذهنی ایرانیان از متوسط جهانی بیشتر است؟
آتش بس درفضای سیاسی کشور
فواید فلفل قرمز برای سلامتی انسان + خواص غذایی و دارویی فلفل
4 اصل اساسی و مقدماتی عملیات بازار باز که در ایران وجود ندارد
ده دلیل کاهش رتبه سایت شما در گوگل
چرا هدایت نقدینگی به سمت تولید امکان ندارد
فواید نارنگی، خواص نارنگی و تاثیر آن بر خواب
دانلود تمام صوت تلاوت های محمد رضا پورزرگری MP3
چرا بجای وحدت بسمت جدایی رفته‌ایم؟
معنی فاک بوی و سافت بوی و باک فوری
مجلس و دولت در خصوص یک بودجه عجیب وغریب سانسور پاسخگو باشند!
آمار تجرد قطعی زنان و مردان چقدر است؟
شرایط گرفتن وام و تسهيلات ازدواج شرایط و ضوابط گرفتن وام ازدواج
مشخصات چوب سرخدار taxus baccata
بهترین هاست رایگان چه هاستی است؟
نادر طالب زاده و نظریه های تئوری توطئه در ایران
راهنمای ایجاد ثبت و تولید شناسه در ایرنیک NIC.ir
چگونه بفهمیم که در یک سخنرانی مغالطه وجود دارد یا نه ؟
دانلود سریال کلاه پهلوی با لینک مستقیم پایگاه دانلود فیلم و سریال
آیا فرار آمریکایی‌ها جلوی گرانی را میگیرد و تورم را پایین میاورد؟
حکم فقهی حد احتکار و اسراف
مقاله درباره معاد و روز رستاخیز (قسمت اول)
چرا سلطنت‌طلب‌ها از «نرگس محمدی» و اعطای «جایزۀ نوبل» به‌ایشان، این‌قدر مکدرند؟
مغالطه مقدمات ناسازگار (مقدمات متناقض) چیست؟
دانلود فیلم های هیجان انگیز
ولایت در ترازوی عدالت! چرا تلقی رایج از ولایت فقیه، مانع تحقق عدالت است؟
دامین و هاستینگ رایگان چیست
ساخت آنلاین فایل Robots.txt
Create Online File Robots.txt

صفحه اصلی راهنما | مرور راهنما | تماس با واحد پشتیبانی

مطالب مرتبط :





robots.txt
ساخت آنلاین فایل robots.txt


همه ی روبات ها:
مدت بروزرسانی:
آدرس سایت:
نقشه سایت:

شناسایی دستی روبات های معروف جهان

Google   googlebot MSN Search   msnbot
Yahoo   yahoo-slurp Ask/Teoma   teoma
Cuil   twiceler GigaBlast   gigabot
Scrub The Web   scrubby DMOZ Checker   robozilla
Nutch   nutch Alexa/Wayback   ia_archiver
Baidu   baiduspider Naver   naverbot, yeti

Specific Special Bots:

Google Image   googlebot-image Google Mobile   googlebot-mobile
Yahoo MM   yahoo-mmcrawler MSN PicSearch   psbot
SingingFish   asterias Yahoo Blogs   yahoo-blogs/v3.9

پوشه هایی که نمی خواهین ایندکس شود


برای ایندکس نکردن فایل هایی که در یک پوشه قرار دارند
به عبارت دیگر نرفتن سایت ها در نتیجه متور های جستو جو که در یک پوشه قرار دارند
برای مثال در پوشه ای فایل هایی هستند که شما نمی خواهین در نتیجه های متور جستو جو نمایش داده شوند.
مثلا صفحه پنل کاربران سایت که نمی خواهین در نتیجه های گوگل نمایش داده شوند









معرفی فایل robots.txt

امروزه، تعداد بازدید و ترافیک دریافتی هر وب سایت تا مقدار زیادی محتاج موتور های جستجو می باشد. بنابراین برای جذب مشتریان جدید و کسب درامد از طریق وب سایت خود، باید تنظیمات لازمی را جهت معرفی سایت به موتورهای جستجو انجام دهید. این تنظیمات در صورتیکه به درستی انجام نپذیرند نیز می توانند در برخی از مواقع، برای سایت شما مشکل ساز شده و حتی باعث متحمل شدن ضرر مالی برای شما گردند. بنابراین تسلط به راهکار های کنترلی و اعمال محدودیت های لازم در این زمینه یکی از عوامل ضروری برای نگهداری وب سایت می باشد.
به غیر از تنظیمات هر موتور جستجو که با معرفی وب سایت به آن و معمولا از طریق ابزارهای Webmaster همان موتور خاص انجام می پذیرد، پاره ای دیگر از تنظیمات کلی را نیز می تواند به صورت مرکزی در وب سایت خود اعمال نمود، تا با استفاده از آن، مواردی همچون ایندکس شدن وب سایت در یک موتور خاص، ایندکس شدن پوشه هایی خاص و ... را تنظیم نمود.
تمامی موارد فوق الذکر را می توان از طریق قرار دادن فایل متنی ساده ای به نام robots.txt در فضای وب سایت اعمال نمود. مدیران وب سایت با استفاده از این فایل توضیحات لازمی را برای روبات های موتورهای جستجو آماده می کنند که به این توضیخات Robots Exclusion Protocol گفته می شود.
برای مثال فرض کنید که روبات سایت گوگل قصد چک نمودن آدرس وب سایت شما را به آدرس (http://www.natilos.ir) دارد. در صورتیکه شما از قبل فایل robots.txt لازم را در فضای میزبانی خود قرار داده باشید، بنابراین روبات گوگل قبل از رفتن به URL اصلی وب سایت شما به URL فایل مذکور یعنی http://www.natilos.ir/robots.txt رجوع نموده و با عبارت زیر مواجه می گردد:
User-agent: *
Disallow: /



عبارت User-agent: * مشخص می کند که تنظیمات پیش رو در خط های بعدی باید بر روی تمامی روبات ها (از جمله روبات های گوگل، یاهو و بینگ) اعمال شوند. و عبارت Disallow: / اجازه دسترسی هیچ روباتی را به هیچ یک از پوشه ها یا فایلهای مربوطه نمی دهد. بنابراین زمانیکه روبات گوگل نیز با این عبارات مواجه می شود، دیگر آدرس دیگری از سایت را مشاهده و ایندکس نمی کند.

دو نکته قابل ملاحظه در زمان کار با فایل robots.txt وجود دارد:
* برخی از روبات ها، مخصوصا روبات های مخرب (Malware) می توانند فایل robots.txt شما را نادیده بگیرند. برخی از روبات های مخرب از اینکار استفاده کرده تا قادر باشند وب سرور را برای مشاهده ضعف های امنیتی اسکن نمایند و یا آدرس ایمیل های مفید را برای افراد اسپمر جمع آوری کنند.
* فایل robots.txt برای نمایش به عموم آزاد می باشد. بنابراین همه میتوانندتنظیمات اعمال شده توسط شما را در این فایل مشاهده نمایند.
بنابراین بهتر است از این فایل برای مخفی نمودن اطلاعات خود استفاده نکنید.

چگونگی ساخت فایل robots.txt

به سادگی می توانید فایلی با فرمت txt در داخل پوشه روت فضای وب سایت خود ساخته و کدهای مربوطه را داخل آن تایپ نمایید. در ساخت این فایل دقت نمایید که نام آن را تماما با حروف کوچک یعنی robots.txt بنویسید.
فایل robots یک فایل متنی بوده که شامل یک تا چند رکورد می باشد. نمونه کد زیر مثالی از محتویات فایل robots.txt می باشد:
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~joe/





در نمونه کد فوق، دایرکتوری های cgi-bin، tmp و همچنین ~joe از لیست فولدرهای قابل ایندکس شدن حذف گردیده و روبات موتور جستجو از پوشه های مذکور صرف نظر می کند.
دقت نمایید که برای خارج نمودن چند فولدر از لیست ایندکسینگ باید هریک را همانند مثال فوق در سطری جداگانه تعریف نمایید و امکان درج آن ها به صورت یکجا یعنی "Disallow: /cgi-bin/ /tmp/" وجود ندارد.
علامت ستاره "*" به معنای تمامی روبات های جستجو گر می باشد.
خارج کردن فولدرهای خاص از لیست ایندکسینگ وب سایت بسته به نوع سرور و وب سایت شما متفاوت می باشد و باید با درنظر گرفتن نکات مختلفی انجام پذیرد. در هر حال در دسترس خارج کردن تمامی پوشه ها از تمامی روبات ها چندان توصیه نمی شود، زیرا با این کار سایت شما دیگر توسط روبات ها ایندکس نشده و در نتایج موتورهای جستجو نیز نمایش داده نمی شود. در ادامه برخی از نمونه کدهای مورد استفاده در فایل robots.txt شرح داده می شود.

ممنوع نمودن تمامی روبات ها از کل وب سایت (یا سرور):
User-agent: *
Disallow: /



دسترسی تمامی روبات ها به تمامی پوشه های وب سایت:
User-agent: *
Disallow:



ممنوع کردن یک روبات خاص از دسترسی به سایت:
User-agent: BadBot
Disallow: /



اعطای دسترسی به یک روبات خاص:
User-agent: Google
Disallow:





  • فناوری
  • سرگرمی

لطفا نظر خود را درباره مطلبی که خوانده‌اید، بنویسید...
نام شریف شما :
آدرس ایمیل:
مطلب :
کپی از مطالب این سایت تنها با ذکر فاتحه رایگان است
مجله تفریحی، سرگرمی و اطلاع رسانی   Natilos.ir © 2024 - 2015
V 9.8