目的地指南:

做SEO开始,就耳濡目染的知道采集站会被K。

日期:2009-02-28 1:24:55 作者: 出处:

做SEO开始,就耳濡目染的知道采集站会被K。
     那么还是有很多人在做采集站的,因为他流量来的快,很轻松的就能赚到点小钱。
     当然不排除采集高手能挣到更多的钱。比如群里的高手硕硕。
     前些日子问过硕硕采集站防K的方法是什么。硕硕没有说,我知道我触犯了SEO界的潜规则。
     于是潜心研究,通过百度K站的原理来看,总结了如下的防K方法。可能会略有不全,因为自己本身没有做过采集站,只是理论上论证后,再次跟硕硕沟通了下:
     第一、要比你被采集的站在搜索引擎的更新中要快。其实这点很难做到,因为你看上眼的都是权重很高的站。但是也偶尔会遇到权重很低,但是内容很好的站。自己去找找,前两天就遇到一个,是朋友无意中看到的江苏的一个站。
     内容更新的很快,但是搜索引擎收录并不快。另外,你可以采集一些小站的东西,这点可能有点不道德,大家都是做站的,别人的原创被你采集了,那些小站怎么办?虽说网络也是弱肉强食,但是希望能给小站的站长们留条活路,毕竟大家都是这么过来的。
      实际上第一点根据讨论,并不怎么实用。
      第二、更新采集文章的题目和内容段的分布。这点我想不用过多的解释,在很多SEO的教程中都会出现。就算是人肉更新,也会去注意这两块。说到这里,很多人会问,我一采集就是几万篇的文章,等到要文章上线的时候,需要一篇一篇的去更新。那么像硕硕这类的高手们都是怎么做的?很简单,用程序去解决。
      第三、文章量。众所周知,如果你突然更新了大量的文章,或者不小心把你的文章全部重新生成静态了(确实有人之前没有生成,之后才生成的)。搜索引擎会认为你是在大量的更新,是采集。所以,当你新站刚刚上线的时候,你可以多上些文章,在之后的更新中,每天都少量的上一些文章,保持稳定的更新就好。关于这点,我想文章更新的量可能会跟网站的权重有关。
      当然,你如果大量更新原创文章就更没问题了。
      第四、一些细节的地方。这块还没有详细的想过,不过可以很直观的想到例如网站模板一类的东西。用一个唯一的模板一定会比用大众化的模板强,另外在关键字上的填写上等等。
      最后,感谢硕硕给予结论的验证。
      硕硕的补充:实际上搜索引擎对语言的识别是比较傻的,不可能有人的智力,只是人为程序判断,要骗过他 是比较容易的。

 

其实原创文章很少,每天发生的那些事情就那些,很多门户网站的内容也是采集的,只是他们采集的比较高明,他们有很多的编辑,在采集的文章的处理的时候采取了一些技巧。
  现在大大小小的有几十万个站,各个站长都千方百计地研究如何吸引眼珠。这做站如同做文章,不可能把所有的东西都收罗进来,要懂得取舍 再好的内容与你的网站主题也要符合,即使垃圾站(即无原创内容大部分是采集他人内容的站)初期阶段可能不予计较,但是在一段时间后,垃圾站仍是把垃圾的话,就死定了。

  如何选择好的内容,应该注意以下几个方面:

  ①选择内容要你的站的主题符合的比较好。

  比如做轴承站的可以采集轴承新闻、轴承技术什么的,也可以大一点采集机械制造方面的,但不要太偏离了,就不要选择电视剧这样的内容,虽然这类内容吸引人,但一方面给人造成的感觉不专业,另一方面也容易被百度K。 如果你觉得非采这个不可。可以搞个二级域名的方式专门建个相对独立的站,和主站相对脱节。

  ②采集的内容的格式尽量统一。

  尽量选择些精品网站进行采集,采集内容的风格和格式要尽量统一,否则会显得不专业,显得太散乱,影响用户的访问情绪。

  ③不要一次性采集太多。在建站初期各个栏目适当采集几百条垫底就行了然后每天都采集一些,否则初期太多的流量对一个新站来说也无太大裨益,而且很危险,容易被百度K站。

  ④采集内容要选好关键字,做好网站的tag,不要见内容就收,否则真成垃圾了 查关键字在百度中的排位情况,是不是有可能冲击前几位,有一二个关键字就够了,这个是流量的保证。

  ⑤为避免百度K站,选择不同编码的站是个不错的建议,比如可以采集big5的繁体站转化成自己的gbk的,有能力的甚至可以通过机器翻译把英文的变成中文站,这样都是原创性的了,被百度K的可能性就是0。 看到有的站长把百度知识的东西通过翻译引擎直接做了个英文知识站。

  ⑥要采集的源站要有持续更新的能力,尽量不要采死站,呵呵, 一方面能经常采集,另一方面这样的站的信息有时效性,可保证你采集的内容新鲜。

  采集的招数千变,唯一的目标是有安全的流量。因为做为草根站长的我们,只能有流量才能有收入,也是我们最终的目标。

 

随着国内大型CMS 动易 新云 DEDECMS 以及其他各式样的CMS 增加采集功能!网络就到处是采集了!!利用这些采集工具不用很长时间便可以做出N多垃圾站点!!当论坛采集工具 也出现的时候 采集之风就更甚了!基本上网站站点可以随意复制了!既然本文谈的是采集与权重,我现在好像离题了我们进入正题哈!!
  首先来说下我的环境!网站类型:分类信息网 域名注册年限:2年 在百度权重:比被采集站点站点相比要高点 目的:把采集变原创,保证排名和权重 搜索引擎:百度
  我们首先来看下 百度是怎么样来判断一个信息是原创还是采集的!!
  1.一条信息----2.百度----3.百度蜘蛛---4.蜘蛛收录此页面---5.规则审核---6.入库并显示在结果里 按照百度的规律 一条信息从收录到显示结果基本就这几步!
  这几步 最块也要2天时间才能完成! 从1到5 基本上最快也要1天 你不要问我说!我刚发布的他就会收录了?只要你没被K 基本上 百度蜘蛛是把你的数据临时保存起来的。通过5 才会显示在搜索结果内的!
  当你的信息进入5的时候!百度也就是在这个阶段 判断 是否原创或者 采集的!也是从这里决定你的排名高低的!按照上面来说 你有 至少1天时间来进行操作 使百度认为你就是原创!!
  列出例子说明:
  被采集站点 每天大概有500条新的分类信息
  我利用采集工具设置自动采集!
  每日 8点 10点 12点 14点 16点 18点 20点 22点 0点 进行采集!!并且进行直接入库!
  基本上我站信息和被采集站信息发布时间误差不超过 30分钟!
  我们来看下 百度是怎么判断的
  5.规则审核:
  1.对比现有数据,数据库中是否有存在相同内容,不存在就直接收录 默认此信息属性为原创,
  2.对比现有数据,数据库中是否有存在相同内容,存在就进入下个对比
  3.存在相同内容,就对比A和B的所属网站在百度权重.权重高者胜出!低着则排在后面!或者直接删除!
  知道了百度的审核的机制 我们就很好来操作了!及时更新了。说白了,。就是及时采集!我的例子说过了!他最新的信息,我采集过来 误差不超过 30分钟.百度在这个30分钟内,是不可能把这个信息内容缓存起来的!到了这里,就要看百度更新谁的网站快了。谁的网站先更新,那吗谁就是原创!!为什么你也是及时采集了他,但是仍然和他不能比!那就是因为百度先更新的是他!他在规则审核中,。、胜出了!!为什么先更新他 他权重比你高!!说到权重 我说下百度如何判定权重的
  1.外链
  2.网站运营时间的长短
  3.流量
  4.采用的编写语言!
  这只是一部分! 还有的我不在鏊述!
  要高质量的友情连接,和百度K过的站做连接,你那是找K!运营时间的长短 要看个人站长的 毅力和专注了!经常改变 主题改变定位的站 百度不喜欢!一天是音乐,第二天变小说了!百度绝对会在你第三次改之前K了你!!
  流量也是一部分先决条但不是绝对!!网站使用的脚本语言!当然能静态化的就静态化把!如果自己开发能力不怎么样,还是使用现有的CMS把!
  总而言之!
  想尽一切办法缩小 采集更新的时间!想尽一办法提高自己权重!
  还有一条!有很多小型网站是你采集的不错选择!
  采集比自己权重低的网站 会更容易的实现让百度误判的目的!从而达到采集变原创的目的!!

上一篇: 采集站一定没有出入了吗?怎么样才能做好 下一篇:怎么让网站采集内容变原创-SEO伪原创

在线评论
姓名:
电话:
出发人数:
出发日期:
出游线路:
电子邮件:
通讯地址:
其它要求:
验证码:
关于我们 | 广告服务 | 联系我们 | 招聘信息 | 公司地址 | 汇款帐号 | 网站律师 | 网站地图 | 更多友情链接 |