WordPress优化:Description和Keywords

不少童鞋都喜欢安装诸如All in one seo 这样的优化插件,其实,这样的WordPress插件无非就是优化 Title,Meta的DescriptionKeywords。当然了,有不少免费主题在初期开发的时候,都没有优化Description和Keywords,比如我爱WordPress目前使用的免费版的 WordPress极客主题:Geeky。

1、Title 优化

Title 的优化很简单,只要使用下面的代码替换header.php文件中默认的Title调用代码就可以啦:

1 <?php $the_title = wp_title(' - ', false); if ($the_title != 
2 '') : ?>
3     <title><?php echo wp_title('',false); ?>
4     <?php bloginfo('name'); ?></title>
5 <?php else : ?>
6      <title><?php bloginfo('name'); ?></title>
  <?php endif; ?>
2、Description和Keywords优化

使用下面的代码替换header.php文件中默认的Description和Keywords调用代码

 1 <?
 2 if (is_home()){
 3      $description = "输入你首页的描述文字";
 4      $keywords = "输入你首页的关键词";
 5 }
 6 elseif (is_category())
 7 {
 8     $description = category_description();
 9     $keywords = single_cat_title('', false);
10 }
11 elseif (is_tag())
12 {
13     $description = tag_description();
14     $keywords = single_tag_title('', false);
15 }
16  elseif (is_single())
17 {
18      if ($post->post_excerpt) {
19          $description     = $post->post_excerpt;
20      } else {
21          $description = substr(strip_tags($post-
22 >post_content),0,220);
23      }
24     $keywords = "";
25     $tags = wp_get_post_tags($post->ID);
26     foreach ($tags as $tag ) {
27         $keywords = $keywords . $tag->name . ", ";
28     }
29 }
30 ?>
31 <meta name="keywords" content="<?=$keywords?>" />
   <meta name="description" content="<?=$description?>" />

用上述的方法,Keywords就是文章的tags,Description是发表日志时的摘要,如果没有添加摘要,就是该文章截取220个字符作为摘要。

WordPress删除数据中标题重复文章的方法

一种是删除重复的方法是:使用一款插件,名字叫做Delete Duplicate Posts,大家可以去官网上下载

二种删除重复的方法是:登录数据库,使用sql语句删除,具体的语句为如下代码:

create table my_tmp as select min(ID) as col1 from WP_posts group by post_title;
delete from wp_posts where ID not in (select col1 from my_tmp);
drop table my_tmp;

但是由于插件容易是WordPress的速度变慢我还是舍弃了他,另外直接操作数据库,还需要登陆数据库比较麻烦,所以我综合以上代码写了一个php文件,代码如下

require(‘./wp-load.php’);
$strsql=”create table my_tmp as select min(ID) as col1 from cd_posts group by post_title”;
$strsql1=”delete from cd_posts where ID not in (select col1 from my_tmp)”;
$strsql2=”drop table my_tmp”;
$result=mysql_query($strsql);
$result=mysql_query($strsql1);
$result=mysql_query($strsql2);
?>
保存以上代码以为delete.php,放在根目录,例如,对于我的网站来说然后访问此文件

http://www.52wordpress.net/delete.php,只要每隔一段时间运行一下他,很轻松,速度也很快,重复的文章就被搞定了。

 

WordPress清理wp_postmeta全攻略

wp_postmeta 表 是存储文章附带信息的,除了一些特定时候里面的数据是没有用的我之前也写过数据清理文章简单的给出了两条语句并且有其他数据表的清理,详情参见wordpress数据库清理。

下面在给出几条语句让你的wp_postmeta干净到非常。

DELETE FROM wp_postmeta WHERE meta_key = ‘_edit_lock’;
DELETE FROM wp_postmeta WHERE meta_key = ‘_edit_last’;

这是之前给出的两条语句测试安全删除无危险。

DELETE FROM wp_postmeta WHERE meta_key = ‘_wp_old_slug’;
DELETE FROM wp_postmeta WHERE meta_key = ‘_revision-control’;
DELETE FROM wp_postmeta WHERE meta_value = ‘{{unknown}}’;

这是新尝试的三条语句,前两条危险性不大。最后一条不太清楚目前作用,但是删除后无任何异常。这五条语句执行完毕能够删除掉95%以上的数据,算的上是极限优化了,最后考虑到这个数据表并不是很重要,有洁净癖的人可以尝试清空这个表,当然我测试清空表会让一些原本的数据丢失。

 

.htaccess是什么?

Unix、Linux系统或者是任何版本的Apache Web服务器都是支持.htaccess的,但是有的主机服务商可能不允许你自定义自己的.htaccess文件。国内的大多数虚拟主机就没有这个功能。

启用.htaccess,需要修改httpd.conf,启用 AllowOverride,并可以用AllowOverride限制特定命令的使用。如果需要使用.htaccess以外的其他文件名,可以用 AccessFileName指令来改变。例如,需要使用.config ,则可以在服务器配置文件中按以下方法配置:AccessFileName .config 。

笼统地说,.htaccess可以帮我们实现包括:文件夹密码保 护、用户自动重定向、自定义错误页面、改变你的文件扩展名、封禁特定IP地址的用户、只允许特定IP地址的用户、禁止目录列表,以及使用其他文件作为 index文件等一些功能。

下面具体介绍一下.htaccess文件功能的设置

如何创建一个.htaccess文档

.htaccess是一个古怪的文件名(从Win的角度来说,它 没有文件名,只有一个由8个字母组成的扩展名,不过实际上它是linux下的命名,而很多linux下的东西,我们向来都会认为很古怪的),在Win系统 中是不可以直接通过“新建”文件来创建的,不过我们可以利用cmd中的copy来实现,比如copy sample.txt .htaccess。也可以先创建一个htaccess.txt,然后Ftp到服务器,通过FTP来修改文件名。

怎样自定义错误页

.htaccess的一个应用是自定义错误页面,这将使你可以拥 有自己的、个性化的错误页面(例如找不到文件时),而不是你的服务商提供的错误页或没有任何页面。这会让你的网站在出错的时候看上去更专业。你还可以利用 脚本程序在发生错误的时候通知你(例如当找不到页面的时候自动Email给你)。你所知道的任何页面错误代码(比如404找不到页面),都可以通过 在.htaccess文件里加入下面的文字将其变成自定义页面:

ErrorDocument errornumber /file.html

举例来说,如果我的根目录下有一个notfound.html文 件,我想使用它作为404error的页面:

ErrorDocument 404 /notfound.html

如果文件不在网站的根目录下,你只需要把路径设置为:

ErrorDocument 500 /errorpages/500.html

以下是一些最常用的错误:
401 – Authorization Required 需要验证
400 – Bad request 错误请求
403 – Forbidden 禁止
500 – Internal Server Error 内部服务器错误
404 – Wrong page 找不到页面

接下来,你要做的只是创建一个错误发生时显示的文件,然后把它们 和.htaccess一起上传。

.htaccess文件的常用命令

一、禁止显示目录列表
有些时候,由于某种原因,你的目录里没有index文件,这就意 味着当有人在浏览器地址栏键入了该目录的路径,该目录下所有的文件都被会显示出来,这会给你的网站留下安全隐患。为避免这种情况(而不必创建一堆的新 index文件),你可以在你的.htaccess文档中键入以下命令,用以阻止游客访问你的目录。

目录列表的显示:

Options -Indexes

二、阻止/允许特定的IP地址
某些情况下,你可能只想允许某些特定IP的用户可以访问你的网站 (例如:只允许使用特定ISP的用户进入某个目录),或者想封禁某些特定的IP地址(例如:将低级用户隔离于你的信息版面外)。当然,这只在你知道你想拦 截的IP地址时才有用,然而现在网上的大多数用户都使用动态IP地址,所以这并不是限制使用的常用方法。
你可以使用以下命令封禁一个IP地址:
deny from 000.000.000.000
这里的000.000.000.000是被封禁的IP地址,如果 你只指明了其中的几个,则可以封禁整个网段的地址。如你输入210.10.56.,则将封禁210.10.56.0~210.10.56.255的所有 IP地址。
你可以使用以下命令允许一个IP地址访问网站:
allow from 000.000.000.000
被允许的IP地址则为000.000.000.000,你可以象 封禁IP地址一样允许整个网段。
如果你想阻止所有人访问该目录,则可以使用:
deny from all
不过这并不影响脚本程序使用这个目录下的文档
.htaccess文件(或者”分布式配置文件”提供了针对目录 改变配置的方法, 即,在一个特定的文档目录中放置一个包含一个或多个指令的文件, 以作用于此目录及其所有子目录。作为用户,所能使用的命令受到限制。管理员可以通过Apache的AllowOverride指令来设置。
– 子目录中的指令会覆盖更高级目录或者主服务器配置文件中的指令。
– .htaccess必须以ASCII模式上传,最好将其权限设置为644。

错误文档的定位

常用的客户端请求错误返回代码:
401 Authorization Required
403 Forbidden
404 Not Found
405 Method Not Allowed
408 Request Timed Out
411 Content Length Required
412 Precondition Failed
413 Request Entity Too Long
414 Request URI Too Long
415 Unsupported Media Type

常见的服务器错误返回代码:
500 Internal Server Error
用户可以利用.htaccess指定自己事先制作好的错误提醒页 面。一般情况下,人们可以专门设立一个目录,例如errors放置这些页面。然后再.htaccess中,加入如下的指令:

ErrorDocument 404 /errors/notfound.html
ErrorDocument 500 /errors/internalerror.html

一条指令一行。上述第一条指令的意思是对于404,也就是没有找 到所需要的文档的时候得显示页面为/errors目录下的notfound.html页面。不难看出语法格式为:
ErrorDocument 错误代码 /目录名/文件名.扩展名
如果所需要提示的信息很少的话,不必专门制作页面,直接在指令中 使用HTML号了,例如下面这个例子:
ErrorDocument 401 ”
你没有权限访问该页面,请放弃!

文档访问的密码保护

要利用.htaccess对某个目录下的文档设定访问用户和对应 的密码,首先要做的是生成一个.htpasswd的文本文档,例如:

zheng:y4E7Ep8e7EYV

这里密码经过加密,用户可以自己找些工具将密码加密 成.htaccess支持的编码。该文档最好不要放在www目录下,建议放在www根目录文档之外,这样更为安全些。
有了授权用户文档,可以在.htaccess中加入如下指令了:

AuthUserFile .htpasswd的服务器目录
AuthGroupFile /dev/null (需要授权访问的目录)
AuthName EnterPassword
AuthType Basic (授权类型)
require user wsabstract (允许访问的用户,如果希望表中所有用户都允许,可以使用 require valid-user)

注,括号部分为学习时候自己添加的注释
拒绝来自某个IP的访问
如果我不想某个政府部门访问到我的站点的内容,那可以通 过.htaccess中加入该部门的IP而将它们拒绝在外。
例如:
order allow,deny
deny from 210.10.56.32
deny from 219.5.45.
allow from all
第二行拒绝某个IP,第三行拒绝某个IP段,也就是 219.5.45.0~219.2.45.255
想要拒绝所有人?用deny from all好了。不止用IP,也可以用域名来设定。

保护.htaccess文档
在使用.htaccess来设置目录的密码保护时,它包含了密码 文件的路径。从安全考虑,有必要把.htaccess也保护起来,不让别人看到其中的内容。虽然可以用其他方式做到这点,比如文档的权限。不 过,.htaccess本身也能做到,只需加入如下的指令:
order allow,deny
deny from all
URL转向
我们可能对网站进行重新规划,将文档进行了迁移,或者更改了目 录。这时候,来自搜索引擎或者其他网站链接过来的访问就可能出错。这种情况下,可以通过如下指令来完成旧的URL自动转向到新的地址:
Redirect /旧目录/旧文档名 新文档的地址
或者整个目录的转向:
Redirect 旧目录 新目录
改变缺省的首页文件
一般情况下缺省的首页文件名有default、index等。不 过,有些时候目录中没有缺省文件,而是某个特定的文件名,比如在pmwiki中是pmwiki.php。这种情况下,要用户记住文件名来访问很麻烦。 在.htaccess中可以轻易的设置新的缺省文件名:

DirectoryIndex 新的缺省文件名

也可以列出多个,顺序表明它们之间的优先级别,例如:
DirectoryIndex filename.html index.cgi index.pl default.htm
防止盗链
如果不喜欢别人在他们的网页上连接自己的图片、文档的话,也可以 通过htaccess的指令来做到。

所需要的指令如下:
RewriteEngine on
RewriteCond % !^$
RewriteCond % !^http://(www.)?mydomain.com…*$ [NC]
RewriteRule .(gif|jpg)$ – [F]
如果觉得让别人的页面开个天窗不好看,那可以用一张图片来代替:
RewriteEngine on
RewriteCond % !^$
RewriteCond % !^http://(www.)?mydomain.com…*$ [NC]
RewriteRule .(gif|jpg)$ http://www.mydomain.com/替代图片文件名 [R,L]
source:http://wsabstract.com/howt… .htaccess实现网址规范化

网址规范化在SEO中是一个比较 重要的环节,同时存在不同的网址版本,不但可能造成复制,还不能正确的集中权重。

目前大多数网站,绑定域名都有带WWW和不带两个版本,甚至很多 网站同时绑定多个域名。经过处理(跳转、CNAME……),对于访问者来说可能没有任何影响,看到的都是同样的内容;但对于搜索引擎,就无法确定哪一个网 址是真正的主页。

可控因素,网站内容链接应该保持同一个版本,比如整站中,返回首 页的地址为固定的一个版本。但还有一个不可控的因素,就是别人链到你的网站,所使用的网址。很多自发链接或交换链接时,别人可能会省略掉WWW,或采用绑 定的另一域名。
外界因素不可控,我们可以从网站内部来控制。利用Apache 的.htaccess,使用301重定向,规范网址。
新建一个空文件,文件名.htaccess,填入重定向规则后, 上传到网站根目录。

用301将不带WWW的域名重定向
rewriteEngine on
rewriteCond % ^379.cc [NC]
rewriteRule ^(.*)$ http://www.379.cc/$1 [R=301,L]

用301将绑定的其他多个域名重定向到主域名
RewriteEngine on
RewriteCond % ^379.cc$ [OR]
RewriteCond % ^bbs.379.cc$ [OR]
RewriteCond % ^luoyang.cc$ [OR]
RewriteCond % ^www.luoyang.cc$ [OR]
RewriteCond % ^bbs.luoyang.cc$
RewriteRule ^(.*)$ http://www.379.cc/$1 [R=301,L]

当然,也可以再扩展一下,将index.html、 index.php等也重定向一下:
RewriteEngine on
RewriteCond % ^[A-Z]{3,9}\ /index\.php\ HTTP/
RewriteRule ^index\.php$ http://www.379.cc/ [R=301,L]
Enabling SSI Via htaccess 通过htaccess允许SSI(Server Side Including)功能
AddType text/html .shtml
AddHandler server-parsed .shtml
Options Indexes FollowSymLinks Includes
DirectoryIndex index.shtml index.html
Blocking users/sites by referrer 根据referrer阻止用户/站点访问
需要mod_rewrite模块

例1. 阻止单一referrer: badsite.com
RewriteEngine on
# Options +FollowSymlinks
RewriteCond % badsite\.com [NC]
RewriteRule .* – [F]

例2. 阻止多个referrer: badsite1.com, badsite2.com
RewriteEngine on
# Options +FollowSymlinks
RewriteCond % badsite1\.com [NC,OR]
RewriteCond % badsite2\.com
RewriteRule .* – [F]
[NC] – 大小写不敏感(Case-insensite)
[F] – 403 Forbidden

注意以上代码注释掉了”Options +FollowSymlinks”这个语句。如果服务器未在 httpd.conf 的 段落设置 FollowSymLinks, 则需要加上这句,否则会得到”500 Internal Server error”错误。

Blocking bad bots and site rippers (aka offline browsers) 阻止坏爬虫和离线浏览器
需要mod_rewrite模块
坏爬虫? 比如一些抓垃圾email地址的爬虫和不遵守robots.txt的爬虫(如baidu?)
可以根据 HTTP_USER_AGENT 来判断它们
(但是对于一些搜索引擎把自己的agent设置为 “Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0)” ,就无能为力了)
RewriteEngine On
RewriteCond % ^BlackWidow [OR]
RewriteCond % ^Bot\ mailto:craftbot@yahoo.com [OR]
RewriteCond % ^ChinaClaw [OR]
RewriteCond % ^Custo [OR]
RewriteCond % ^DISCo [OR]
RewriteCond % ^Download\ Demon [OR]
RewriteCond % ^eCatch [OR]
RewriteCond % ^EirGrabber [OR]
RewriteCond % ^EmailSiphon [OR]
RewriteCond % ^EmailWolf [OR]
RewriteCond % ^Express\ WebPictures [OR]
RewriteCond % ^ExtractorPro [OR]
RewriteCond % ^EyeNetIE [OR]
RewriteCond % ^FlashGet [OR]
RewriteCond % ^GetRight [OR]
RewriteCond % ^GetWeb! [OR]
RewriteCond % ^Go!Zilla [OR]
RewriteCond % ^Go-Ahead-Got-It [OR]
RewriteCond % ^GrabNet [OR]
RewriteCond % ^Grafula [OR]
RewriteCond % ^HMView [OR]
RewriteCond % HTTrack [NC,OR]
RewriteCond % ^Image\ Stripper [OR]
RewriteCond % ^Image\ Sucker [OR]
RewriteCond % Indy\ Library [NC,OR]
RewriteCond % ^InterGET [OR]
RewriteCond % ^Internet\ Ninja [OR]
RewriteCond % ^JetCar [OR]
RewriteCond % ^JOC\ Web\ Spider [OR]
RewriteCond % ^larbin [OR]
RewriteCond % ^LeechFTP [OR]
RewriteCond % ^Mass\ Downloader [OR]
RewriteCond % ^MIDown\ tool [OR]
RewriteCond % ^Mister\ PiX [OR]
RewriteCond % ^Navroad [OR]
RewriteCond % ^NearSite [OR]
RewriteCond % ^NetAnts [OR]
RewriteCond % ^NetSpider [OR]
RewriteCond % ^Net\ Vampire [OR]
RewriteCond % ^NetZIP [OR]
RewriteCond % ^Octopus [OR]
RewriteCond % ^Offline\ Explorer [OR]
RewriteCond % ^Offline\ Navigator [OR]
RewriteCond % ^PageGrabber [OR]
RewriteCond % ^Papa\ Foto [OR]
RewriteCond % ^pavuk [OR]
RewriteCond % ^pcBrowser [OR]
RewriteCond % ^RealDownload [OR]
RewriteCond % ^ReGet [OR]
RewriteCond % ^SiteSnagger [OR]
RewriteCond % ^SmartDownload [OR]
RewriteCond % ^SuperBot [OR]
RewriteCond % ^SuperHTTP [OR]
RewriteCond % ^Surfbot [OR]
RewriteCond % ^tAkeOut [OR]
RewriteCond % ^Teleport\ Pro [OR]
RewriteCond % ^VoidEYE [OR]
RewriteCond % ^Web\ Image\ Collector [OR]
RewriteCond % ^Web\ Sucker [OR]
RewriteCond % ^WebAuto [OR]
RewriteCond % ^WebCopier [OR]
RewriteCond % ^WebFetch [OR]
RewriteCond % ^WebGo\ IS [OR]
RewriteCond % ^WebLeacher [OR]
RewriteCond % ^WebReaper [OR]
RewriteCond % ^WebSauger [OR]
RewriteCond % ^Website\ eXtractor [OR]
RewriteCond % ^Website\ Quester [OR]
RewriteCond % ^WebStripper [OR]
RewriteCond % ^WebWhacker [OR]
RewriteCond % ^WebZIP [OR]
RewriteCond % ^Wget [OR]
RewriteCond % ^Widow [OR]
RewriteCond % ^WWWOFFLE [OR]
RewriteCond % ^Xaldon\ WebSpider [OR]
RewriteCond % ^Zeus
RewriteRule ^.* – [F,L]
[F] – 403 Forbidden
[L] – 连接(Link)
Discuz!论坛静态化配置规则如下:
# 将 RewriteEngine 模式打开
RewriteEngine On
# 修改以下语句中的 /discuz 为你的论坛目录地址,如果程序放在根目录中,请将 /discuz 修改为 /
RewriteBase /
# Rewrite 系统规则请勿修改
RewriteRule ^archiver/((fid|tid)-[\w\-]+\.html)$ archiver/index.php?$1
RewriteRule ^forum-([0-9]+)-([0-9]+)\.html$ forumdisplay.php?fid=$1&page=$2
RewriteRule ^thread-([0-9]+)-([0-9]+)-([0-9]+)\.html$ viewthread.php?tid=$1&extra=page\%3D$3&page=$2
RewriteRule ^space-(username|uid)-(.+)\.html$ space.php?$1=$2
RewriteRule ^tag-(.+)\.html$ tag.php?name=$1

wordpress网站性能优化之减少加载时间提高用户体验

最近去听了D2 论坛,更加深刻体会到了网站性能对于用户体验的重要性。

慢500ms =Google用户访问量降低20%

慢400ms=Yahoo! 用户访问量降低5-9%

慢100ms=Amazon销售额降低1%

散会后,不禁想看看自己网站的性能如何。自从把网站搬家到国外,还真有点担心。通过Google网站管理员工具查看网站性能,不禁大吃一惊:您网站的平均网页载入时间为 20.2 秒。该站比99.7%的网站慢。

看来要动手优化一下了。先在自己的Firefox 浏览器里安装了网站性能检测工具Google Page Speed和Yslow。首先用YSlow来检测一下访问网站首页的大小。总共257.3KB。

再用Google Page Speed 看看有什么可以改进的。从发现的问题来看,还是有不少的可以优化的地方。

由于技术能力和时间都很有限,只能进行简单的优化。我做了以下一些优化工作:

一、压缩样式图片

我并没有用什么高深的压缩工具,只是用Fireworks CS4批量处理了图片(没有改变文件类型),原来网站的主题的所有样式图片有195KB, 优化后就减少了54.94KB。而且优化后的图片,肉眼根本看不出区别(至少我是没看出来)。

二、启动gzip 压缩

由于我使用的虚拟主机,并没有配置服务器开启gzip的权限。我只能依靠WordPress 的插件 GZIP Output。首页页面大小(Html/Text)减少了18.9KB。

但是,GZIP Output 只能对于php 文件进行压缩,对于大部头的CSS、JS 文件都无法处理。我又下载安装了WP CSS 和WP JS 插件想分别对CSS 和 JS 文件进行压缩。不过,WP JS这个插件我没搞懂怎么用,WP CSS 倒是应用成功了。网站主题样式表文件从原来的23.5KB 变成了8.1KB,单就首页来说又减少了15.4KB。

三、减少不必要的页面元素

从页面来看载入的js 来看,我有两个Js是用来做网站访问统计的。一个是google analytics,另一个是piwik。权衡利弊我去掉了piwik的统计代码,首页大小又减少了8.3KB。

 

另外,网站页脚的有个图片没什么作用。我干脆给去掉了,首页大小又减少5.66KB,。这样做不仅可以减少页面大小,还可以减少不必要的Http请求。

总结一下

真是不优化不知道,一优化吓一跳。优化后首页大小从原来的257.3KB变成了154.0KB, 总优化数值为103.3KB,比原来页面优化了40.15%。首页的Http请求从原来的25个变为22个。具体优化明细如下:

经过了这一番优化,到底会对页面载入时间产生什么效果呢。让我们使用Web Page Analyzer试试看,它可以模拟用户在不同网络情况下访问页面载入时间。对比一下优化前后的情况,效果还是相当不错的。主流带宽的用户首页载入时间,从20.37秒优化到只有不到3秒。

以上的优化工作其实不只会对首页有优化效果。因为整个网站用的是一个主题样式,其他页面也都得到了优化。至于整个网站的优化性能,我们还用文章开头用的Google网站管理员工具来检验一下。到了一月份再通过它查看网站性能,终于,得到了满意的结果。“您网站的平均网页载入时间为 2.6 秒(更新时间:2010-1-9)。 该网站比 57% 的网站快。”

文章来源:http://www.2beusable.com/website-optimization-practice.html