<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>小哀扯淡 - 杨林 &#187; robots</title>
	<atom:link href="http://www.seops.cn/T/robots/feed" rel="self" type="application/rss+xml" />
	<link>http://www.seops.cn</link>
	<description>杨林的碎碎念博客,包括了生活,黑莓,Twitter,WP,搜索引擎,社会观察,分享,程序模板,IT评论等</description>
	<lastBuildDate>Mon, 19 Sep 2011 03:02:37 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>网页中的robots.txt的作用.</title>
		<link>http://www.seops.cn/P/1.html</link>
		<comments>http://www.seops.cn/P/1.html#comments</comments>
		<pubDate>Wed, 12 Sep 2007 18:41:25 +0000</pubDate>
		<dc:creator>小哀</dc:creator>
				<category><![CDATA[网站建设]]></category>
		<category><![CDATA[robots]]></category>

		<guid isPermaLink="false"></guid>
		<description><![CDATA[一个网页中,robots.txt是主角,该文件已经成为业界标准好多年了.它让一个网站所有者控制搜索引擎访问他们的网站.你可以用robots.txt不同层次地控制访问,比如让搜索引擎只访问整个网站,单个目录,特定类型的网页,或者某一网页.有效地使用robots.txt能让你更好地控制对你的网站的搜索，但是如何达到这一目标不是很显而易见的.
文件robots.txt有什么用？
互联网真的很大。你只是不相信它是怎样地无穷无尽地大。你也许认为维护网站耗费好多精力，但是那只是&#8221;网海一粟&#8221;。 (对Douglas Adams致以诚挚的道歉)
象Google这样的搜索引擎会读取所有信息并对这些信息索引，索引是为了让一个搜索引擎对一些用户查询显示与之相匹配的网页。
为了做到这一点谷歌的一些电脑不断抓取网站，他们有一个谷歌所知道的所有网站的名单，他们阅读每个网站的所有网页。所有这些机器被称为Googlebot。一般来说，你是愿意让Googlebot访问你的网站，这样你的网页才可以被人们在谷歌搜到。
然而，对你的网站上的某几页，你可能不想让谷歌索引。举例来说，你可能有一个目录包含内部日志，或者你可能有些新闻文章只能在支付费用后才能访问。你可以通 过创建一个文本文件名为robots.txt的文件并把它放置在根目录下来告诉谷歌爬虫不要去抓取他们。文件robots.txt包含了一个搜索引擎不能访问的页面的清单。创建一个robots.txt是直截了当的，它允许你用一套精密分层控制搜索引擎对你网站的访问。
精细控制
除 了robots.txt文件让您为你的一大堆文件简洁明了给出指令外，你也可以利用robots META 标签来精确控制对你的单个网页的访问。为了做到这一点，你只需要对你的HTML网页添加特定的META标签来控制怎样对单个网页索引。归而总之， robots.txt和META标签让你更灵活地表达复杂的访问规定变得比较容易。
一个简单的例子
这里是一个简单的例子，它是一个robots.txt文件。
User-Agent: GooglebotDisallow: /logs/User -Agent行指明下面部分的一套指令只是为Googlebot。所有主要搜索引擎都阅读并听从你放在robots.txt的指令。只要你愿意，你可以为 不同的搜索引擎指定不同的规则。Disallow行告诉Googlebot不能进入你网站的档案日志子目录。你放在日志目录中的内容将不会显示在谷歌搜索 结果中。
禁止访问单个文件
如果你有一篇只有注册用户才能访问的文章，你一定想让它排除在谷歌的结果之外。为了做到这一点，你只需要在该文章对应的HTML文件中添加一个META标签。该文件的代码的最开始有点像：



这段代码会阻止谷歌索引此文件。标签META特别有用，如果你只被允许编辑单个文件，而不是全站的robots.txt。他们还允许你逐页地指定复杂的访问控制规定。

随机文章:


十个优化你的WordPress技巧.
从UED团队看待SEO的UE模式.
学SEO,至少有3条赚钱之路
音乐搜索,大家各有门道.
面试时一开口就被赶出来.

]]></description>
			<content:encoded><![CDATA[<p>一个网页中,robots.txt是主角,该文件已经成为业界标准好多年了.它让一个网站所有者控制搜索引擎访问他们的网站.你可以用robots.txt不同层次地控制访问,比如让搜索引擎只访问整个网站,单个目录,特定类型的网页,或者某一网页.有效地使用robots.txt能让你更好地控制对你的网站的搜索，但是如何达到这一目标不是很显而易见的.</p>
<p>文件robots.txt有什么用？</p>
<p>互联网真的很大。你只是不相信它是怎样地无穷无尽地大。你也许认为维护网站耗费好多精力，但是那只是&#8221;网海一粟&#8221;。 (对Douglas Adams致以诚挚的道歉)<br />
象Google这样的搜索引擎会读取所有信息并对这些信息索引，索引是为了让一个搜索引擎对一些用户查询显示与之相匹配的网页。</p>
<p>为了做到这一点谷歌的一些电脑不断抓取网站，他们有一个谷歌所知道的所有网站的名单，他们阅读每个网站的所有网页。所有这些机器被称为Googlebot。一般来说，你是愿意让Googlebot访问你的网站，这样你的网页才可以被人们在谷歌搜到。</p>
<p>然而，对你的网站上的某几页，你可能不想让谷歌索引。举例来说，你可能有一个目录包含内部日志，或者你可能有些新闻文章只能在支付费用后才能访问。你可以通 过创建一个文本文件名为robots.txt的文件并把它放置在根目录下来告诉谷歌爬虫不要去抓取他们。文件robots.txt包含了一个搜索引擎不能访问的页面的清单。创建一个robots.txt是直截了当的，它允许你用一套精密分层控制搜索引擎对你网站的访问。</p>
<p>精细控制<br />
除 了robots.txt文件让您为你的一大堆文件简洁明了给出指令外，你也可以利用robots META 标签来精确控制对你的单个网页的访问。为了做到这一点，你只需要对你的HTML网页添加特定的META标签来控制怎样对单个网页索引。归而总之， robots.txt和META标签让你更灵活地表达复杂的访问规定变得比较容易。</p>
<p>一个简单的例子<br />
这里是一个简单的例子，它是一个robots.txt文件。</p>
<p>User-Agent: GooglebotDisallow: /logs/User -Agent行指明下面部分的一套指令只是为Googlebot。所有主要搜索引擎都阅读并听从你放在robots.txt的指令。只要你愿意，你可以为 不同的搜索引擎指定不同的规则。Disallow行告诉Googlebot不能进入你网站的档案日志子目录。你放在日志目录中的内容将不会显示在谷歌搜索 结果中。</p>
<p>禁止访问单个文件</p>
<p>如果你有一篇只有注册用户才能访问的文章，你一定想让它排除在谷歌的结果之外。为了做到这一点，你只需要在该文章对应的HTML文件中添加一个META标签。该文件的代码的最开始有点像：</p>
<blockquote><p><html><br />
<head><br />
<meta name="googlebot" content="noindex"></p></blockquote>
<p>这段代码会阻止谷歌索引此文件。标签META特别有用，如果你只被允许编辑单个文件，而不是全站的robots.txt。他们还允许你逐页地指定复杂的访问控制规定。<br />
<h3>
<p>随机文章:</p>
</h3>
<ul class="related_post">
<ul><a href="http://www.seops.cn/P/291.html" title="推荐茅房拉屎脸朝外的原创文学博客!">推荐茅房拉屎脸朝外的原创文学博客!</a></ul>
<ul><a href="http://www.seops.cn/P/811.html" title="电信3G和WIFI加在一起">电信3G和WIFI加在一起</a></ul>
<ul><a href="http://www.seops.cn/P/115.html" title="话题营销,采集网站升华到复制用户.">话题营销,采集网站升华到复制用户.</a></ul>
<ul><a href="http://www.seops.cn/P/308.html" title="发Spam的垃圾黑帽SEO们.">发Spam的垃圾黑帽SEO们.</a></ul>
<ul><a href="http://www.seops.cn/P/983.html" title="杀毒软件和木马免杀的战争与和平">杀毒软件和木马免杀的战争与和平</a></ul>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.seops.cn/P/1.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

