作业帮下载app拍照搜题2022_亚洲精品私拍国产福利在线_免费萌白酱视频一区二区_老师掀开裙子让我爽了一夜

全國(guó)服務(wù)熱線:400-080-4418

您現(xiàn)在的位置是:首頁 > 新聞資訊 > 網(wǎng)站建設(shè)常識(shí)

網(wǎng)站中的robots.txt文件的具體作用2011/8/2 13:46:20 瀏覽:63

上海網(wǎng)站建設(shè)給大家說一下網(wǎng)站中的robots.txt文件的作用,robots.txt文件放在網(wǎng)站根目錄下,是搜索引擎中訪問網(wǎng)站的時(shí)候要查看的第一個(gè)文件。當(dāng)一個(gè)搜索蜘蛛訪問一個(gè)站點(diǎn)時(shí),它會(huì)首先檢查該站點(diǎn)根目錄下是否存在robots.txt,如果存在,搜索機(jī)器人就會(huì)按照該文件中的內(nèi)容來確定訪問的范圍;如果該文件不存在,所有的搜索蜘蛛將能夠訪問網(wǎng)站上所有沒有被口令保護(hù)的頁面。每個(gè)網(wǎng)站都應(yīng)該有一個(gè)robots,它告訴搜索引擎我的網(wǎng)站里有哪些東西是不允許抓取的,有哪些頁面是歡迎爬行與抓取。

  robots的幾種作用:

  1.屏蔽所有的搜索引擎抓取信息,如果你的網(wǎng)站只是你的私密性的網(wǎng)站,不想太多的人知道的話,可以利用robots屏蔽掉所有的搜索引擎,例如你寫的私人博客。你就可以把搜索引擎全都屏蔽掉

  User-agent: *

  Disallow: /

  2.如果你只想某一個(gè)搜索引擎抓取你的信息,這個(gè)時(shí)候就可以用robots進(jìn)行設(shè)置,例如:我只想我的網(wǎng)站被百度這個(gè)收錄,而不想被別的搜索引擎收錄。就可以利用robots進(jìn)行設(shè)置

  User-agent: Baiduspider

  Allow:

  User-agent: *

  Disallow: /

  3.可以利用各種通配符對(duì)網(wǎng)站進(jìn)行相對(duì)應(yīng)的調(diào)配,例如我不想網(wǎng)站抓取我的所有圖片,這個(gè)時(shí)候就可以運(yùn)用$來進(jìn)行設(shè)置。一般我們常見的圖片的格式是BMPJPGGIFJPEG等格式。這個(gè)時(shí)候設(shè)置就是:

  User-agent: *

  Disallow: /.bmp$

  Disallow: /.jpg$

  Disallow: /.gif$

  Disallow: /.jpeg$

  4.還可以利用*來屏蔽掉相關(guān)的URL,有些網(wǎng)站不允許搜索引擎抓取動(dòng)態(tài)地址的時(shí)候可以利用這個(gè)*通配符來進(jìn)行匹配設(shè)置。一般情況下動(dòng)態(tài)URL的有一個(gè)特點(diǎn)就是有“?”這個(gè)時(shí)候我們就可以利用這個(gè)特性來進(jìn)行匹配的屏蔽:

  User-agent: *

  Disallow: /*?*

  5.如果網(wǎng)站改版了,整個(gè)文件夾都沒有了的時(shí)候,這個(gè)情況下就要考慮屏蔽掉整個(gè)文件夾。我們可以運(yùn)用robots來對(duì)這整個(gè)的文件夾進(jìn)行屏蔽,例如網(wǎng)站里的ab文件夾因改版全都給刪掉了,這個(gè)時(shí)候就可以這樣子設(shè)置:

  User-agent: *

  Disallow: /ab/

  6.如果網(wǎng)站里有一個(gè)文件夾不想被收錄,但是在這個(gè)文件夾里面有一個(gè)信息是允許被收錄。那可以運(yùn)用robotsallow進(jìn)行設(shè)置。例如我網(wǎng)站里ab文件夾不允許搜索引擎抓取,但是在ab文件夾里面又有一個(gè)信息cd是允許被抓取的,這個(gè)時(shí)候就可以運(yùn)用robots進(jìn)行設(shè)置:

  User-agent: *

  Disallow: /ab/

 7.可以在robots里定義出網(wǎng)站地圖的位置,有利于網(wǎng)站的收錄。

  sitemap:<網(wǎng)站地圖的位置>

  8.有的時(shí)候你會(huì)發(fā)現(xiàn)我的網(wǎng)站里設(shè)置了robots但是還發(fā)現(xiàn)其收錄了這個(gè)URL地址,這個(gè)的原因是因?yàn)檫@個(gè)搜索引擎的蜘蛛是通過URL爬行到網(wǎng)頁的一般 google抓取這樣子的URL的時(shí)候是不帶title與描述的,但是百度抓取這個(gè)URL會(huì)帶上title與描述,所以有很多有人會(huì)說我設(shè)置了 robots但是沒有效果。實(shí)際情況是抓取了這個(gè)鏈接而沒有收錄這個(gè)頁面內(nèi)容。

  網(wǎng)站的首頁權(quán)重是高的,權(quán)重是靠鏈接傳遞的,我們?cè)O(shè)置robots是為了更好的把權(quán)重傳遞給那些需要有很高權(quán)重的頁面,而有一些頁面則是不需要搜索引擎抓取和爬行的。

 

服務(wù)網(wǎng)絡(luò)

關(guān)于我們

網(wǎng)至普專注于網(wǎng)站建設(shè)/網(wǎng)站優(yōu)化,始終追求 “您的滿意,我的追求!”。懂您所需、做您所想!我們一直在思考如何為客戶創(chuàng)造更大的價(jià)值,讓客戶更省心!立足上海,服務(wù)全國(guó)。服務(wù):上海,北京,廣州,深圳,成都,杭州,南京,蘇州,無錫等地

查看更多 >>

聯(lián)系我們

Copyright 2008 © 上海網(wǎng)至普信息科技有限公司 All rights reserved. 滬ICP備11006570號(hào)-13 滬公網(wǎng)安備 31011402007386號(hào)


關(guān)于我們 | 聯(lián)系我們 | 網(wǎng)站建設(shè)

返回頂部