09月 2007

 
 

又爱又恨的点石,2007点石北京SEM大会

2007,09,28 / 13:34 • 碎碎念 • #3

插件比较麻烦,本文长期手工更新时间置顶,直至大会开始.

爱点石,因为点石教会了我们很多,因为它给了我们一个很好的交流平台,为我们提供了很多的SEO软文以及贡献了很不错的SEO工具等等 .
恨点石,因为点石为什么不多给我们提供一点好东西,爆一点实料,为什么让我想提高水品而无门,让我们在门前徘徊.

SEO是一个很神圣的职业,我这样认为,没有用过群发,因为我觉得SEOer如果用了群发的话,你就算是玷污了你那神圣的职业.黑帽在现在的搜索行业已经不太盛行了,600W条算法里只能算是沧海一粟而已.所以,点石里的SEOer们,我们能不能不在搞群发了呢..我想来都是手动..汗,(悄悄告诉你,我是没钱买软件.)看好内部优化,但是在点石里我仍然没有学到什么确切的方法.我希望点石的巨头们可以好好的带带这些后辈.SEOer高手认识的太少,有认识的也好像那坐在贞节牌坊下的尼姑似,怎么踹屁都不放一个.

正如点石说的那样.点石互动从一成立就始终关注SEO,积极促进SEO行业交流,推动SEO行业的发展.确实,点石是发展了,但是电视里千千万万的热心会员仍然还在原地努力.

我们需要发展,我们需要认识更多的SEO同仁,我们需要学习最前线的SEO技术,而不是60年的夏利..

大会是不去了,来回的花费太大..希望自己发展好了后去点石大会上吹牛..谢谢..

不过我在这里祝愿点石2007北京SEM大会圆满召开.结束后发级个好文章和工具,谢谢!

欲了解详情,可访问大会官方网站:http://www.dunsh.org/beijing2007/


Google收录网站以及对网页的排序

2007,09,28 / 13:31 • 搜索引擎 • #0

我们遇到的最常见的问题之一是“Google是如何判定哪个结果出现在搜索结果的前茅?”,Matt Cutts给我们简单地揭示了如何抓取、收录和给网页评级。

抓取和收录
当你看到出现在Google的搜索结果的那个网页之前,Google在后台已经做了许多步骤。Google的第一步是抓取和收录互联网上的数十亿的网页,这个工作时由Google的机器人Googlebot来完成的,它浏览网络服务器抓取文件。 抓取的程序并不是漫无目的地在互联网上瞎逛,它访问服务器的特定的网页,然后扫描网页上的超文本链接,如果有新的文件也是这样抓取得;蜘蛛程序给每个得到的网页一个号码,这个号码指向它抓取的网页。

蜘蛛程序抓取了很多的网页,但这些网页还不是便于搜索的。如果没有一个索引,你要查询一个词,比如“国内战争”,Google的服务器每次都要读取每一个文件的所有内容。

因此,第二步就是建立索引。我们不是去扫描每一个文件的所有内容,我们巧妙地进行数据的“转换”,列出每一个文件所包含的特定的词,例如,“国内”这个词可能出现在文件3,8,22,56,68和92当中,而“战争”这个词出现在文件2,8,15,22,68和77中。

建立好索引之后,我们就可以开始对网页进行评级,决定网页的相关程度。假设有人在Google的搜索栏输入“国内战争”进行查询,为了提交搜索结果和对结果进行评分,我们要做两件事:

1. 找到包含用户查询的词的网页
2. 给符合的网页按照相关程度进行评级
Google开发出一个有趣的技巧来加速第一步:Google不是把整个索引存储在一台功能强大的计算机上,而是用千百个计算机来存储这些信息。因为任务被分解到许多的计算机,可以更快地找到所需的答案。 详细解释一下,假设一本书的目录有30页,如果一个人要在目录中查寻资料,每次查询都要花几秒钟;如果用30个人每人查询一页目录,显然要比一个人查询的速度快很多。同样的,Google将数据分别存储在许多计算机上,这样搜索的速度会大大加快。

我们是如何找到那些包含用户搜索的词的网页呢?回到“国内战争”的例子,“国内”这个词出现在文件3,8, 22, 56, 68 和92; “战争”出现在文件2, 8, 15, 22, 68和77,记下同时出现这两个词的文件。

国内 3 8 22 56 68 92
战争 2 8 15 22 68 77
国内 战争 8 22 68

这样我们可以清楚地发现“国内”、“战争”这两个词同时出现的在三个文件里 (8, 22, 和68)。 含有这几个字的列表叫做“位置列表”,搜索文件包含这两个字,这叫做交叉搜索位置列表。(较快的交叉搜索的方法是同时进行搜索,如果一个搜索列表,22到68,那另一个就可以开始搜索其他的)
对结果进行评级
现在我们已经有了一些包含用户搜索的关键词的网页,我们要对它们的相关程度进行评级。Google用许多参数进行评级。这当中PR算法是众所周知的。PageRank评估两个因素:有多少个网页链接到这个网页,这些链接网页的网站的质量如何。通过PageRank,五六个高质量的站点的链接,比如www.cnn.com和www.nytimes.com比其他较差的网站的链接要有价值的多。

但是除了PageRank,我们还用许多其它的参数来进行评级。例如,如果一个文件包含“国内”和“战争”这两个词排在一起,这个文件可能比一个讨论革命战争的文件(在文件的某个地方使用“国内”)的相关程度高。还比如假设一个网页的标题是“国内战争”,比另一个标题为“19世纪美国服装”的网页相关度高得多。同样的,如果“国内战争”在网页中出现多次的网页比只出现一个的网页相关的程度也要高。假设你是搜索引擎,选择一个词查询,比如:国内战争或回收,在Google上查询,从结果中挑选三到四页打印出来。从每一张打印的页面上找出你的搜索语句的每一个字然后用荧光笔标出来,然后把这几页贴在墙上,退后几步眯着眼看,当你不知道页面的内容,仅仅能看到那些有颜色的方块,你认为那一页是最相关的呢?是不是有着大的标题和多次重复出现的颜色代表了较高的相关程度?你喜欢这些字出现在顶端还是底部?这些字出现的频率如何?这也是搜索引擎如何判断网页的相关程度。

原则上,Google总是试图找出可靠的和相关的网页。如果两个网页按照查询的语句大致有相同的信息,Google通常选择比较信得过的网站的网页。当然,如果有一些因素表明这个网站的网页相关度更高,Google经常也选择PageRank较低的网站。

一旦Google完成了文件的列表和它们的评分,就给出得分最高的网页。Google同时从网页中摘录一小段包含查询的关键词的句子;给出网页的链接。

对于这样的搜索工作,需要极大的数据运算量,一般说来,对于某个搜索,要有超过500台的服务器协同工作以求得最佳匹配的结果,当然,结果会在半秒内返回用户。

wordpress的支付宝捐赠插件

2007,09,25 / 16:11 • Wordpress • #0

最新进展以及最新版下载地址:http://www.live51.net/projects/

下载:alipay donate wordpress plugin v1.0

v1.0版本新特性,加入简单的readme.txt,支持支付宝参数后台配置,激活插件后可以到Options->Alipay中设置支付宝相关参数。

注:该插件目前utf-8编码有问题:),欢迎大家多多试用。

附后台插图:

后台参数解释
partner: 合作商户号
subject: 捐赠主题
body: 捐赠备注
seller_email: 收款账号
_input_charset: 编码类型,若您的系统为其他编码则可以设置该值
security_code: 安全校验码,用来确保该交易链接是您系统创建的
notify_url: 接收支付宝通知地址,未来使用
return_url: 接收支付宝页面重定向通知地址,未来使用

partner,security_code您在登陆支付宝->商家工具 申请后即可获取。

转载:http://www.live51.net/2006/12/05/64.htm

十个优化你的WordPress技巧.

2007,09,25 / 16:06 • 搜索引擎 • #3

WordPress系统本身,默认安装的情况下使用默认模板,实际上对搜索引擎并不友好,并没有针对搜索引擎进行很好的设计,下面我介绍一些技巧和方法可以使得WordPress能否对搜索引擎更为友好。

1、文章URL链接结构的优化

Permalink里面要包含postname.一般的服务器都支持mod_rewrite功能,使用这个功能可以优化Permalink(永久链接),在Option-Permalink里的Common options里进行设置,我比较倾向于使用/%year%/%monthnum%/%postname%.html这种链接结构,一来链接目录只有两级,利于索引,二来这种链接结构和Blogspot和Movable Type的链接结构一致,比较利于系统平滑迁移或切换。postname使用英文,如果是写英文Blog的话,系统会自动将标题的post slug做为postname.

2、文章Post Slug的优化

文章标题中最好包含文章最关键的关键字,不要使用一些没有意义的标题,对于英文Blog来讲,最好启用一个名叫SEO Slugs的插件,该插件能够自动将post slug中的the、in等“没用”的单词删除,有利于SEO.

3、文章Title的优化

WordPress默认的Title是“博客名-文章名”,这对SEO很不好,我觉得应该使用“文章名-博客名”的形式,建议安装一个名叫All in One SEO Pack的插件,可以自动将Title进行优化,并增加Descriptions和Keywords的Meta.

4、robots.txt的优化

在博客根目录下放置一个robots.txt的文件,可以指定搜索引擎只收录指定的内容。 对于WordPress来说,有一些地址是不应该被搜索引擎索引的,比如后台程序、日志文件、FEED地址等,一个针对WordPress的robots.txt的例子如下:

User-agent: *
Disallow: /wp-
Disallow: /feed/
Disallow: /comments/feed
Disallow: /trackback/

5、Sitemap的优化

对于Google搜索引擎来讲,使用Sitemap可以让搜索引擎更为有效的进行索引,安装一个名叫Sitemap Generator的插件可以自动完成Google Sitemap的生成,然后将这个地址提交到Google Webmaster即可。

6、防止垃圾留言评论

垃圾留言评论会影响Blog在搜索引擎中的表现,因此需要安装一个自动过滤垃圾留言评论的的插件,推荐使用Akismet

7、相关文章

通过tag的标记来实现相关文章,不过我建议使用WordPress 2.3里面的tag系统来实现,那样效率会更高一些。

8、搜索引擎来源的优化

安装一个名叫Landing sites的插件,可以让那些从搜索引擎搜索过来的用户体验更好,通过这个插件能够选择显示给用户搜索关键字相关的文章。

9、不要轻易做变动

不要总是草率的变动自己的域名、博客名、链接结构、链接地址等,早期应该做全局的规划,中途进行大的变动是非常不明智的。

10、更新你的博客

记着经常更新,并且写出高质量的内容,这才是SEO中最关键的地方,写出高质量的文章,将会更容易实现SEO的目标。

下面是一些其他中文的WordPress SEO优化技巧文章:

SEO for WordPress 完全指南

10步实现WordPress搜索引擎优化

下面是一些英文的WordPress SEO优化技巧文章:

Ultimate WordPress SEO Tips

Wordpress SEO: First Steps

Search Engine Optimization (SEO) Tips for Wordpress 2.0

8 simple SEO tips for blogs

Optimize Wordpress for Search Engines