动态 / dynamic

了解国风最新市场动态

搜索引擎如何判断有价值的文章

行业新闻 TIME:2016-01-04
1173 2
  百度是如何判断伪原创和原创?百度到底是喜欢什么样的文章?什么样的文章是比较例如获得长尾词排名?等等诸如此类的一系列的问题。面对这些问题,笔者常常不知如何回答。如果给出一个比较大方向一些的答案,例如需要重视用户体验、要有意义等等,那么提问者会觉得笔者是在应付他,他们往往会抱怨说这些太模糊。可是笔者也没法再给出具体的内容,毕竟不是百度,具体算法又何德何能的来为你们指点江山呢?
  如果是我,我会喜欢什么样子的文章呢?我会喜欢我的用户喜欢的文章,如果硬要加判定标准,那无外乎是两种:1.原创且用户喜欢。2.非原创且用户喜欢。在这里,伪原创就是非原创。那么用户喜欢什么样的文章呢?很显然,一些新观点、新知识往往是用户喜欢的,也就是说通常原创文章都是用户喜欢的,而且即便用户不喜欢,原创站点作为新鲜内容的制造者,也应该受到一定的保护。那么非原创的文章用户就一定不喜欢吗?诚然否也。一些站点,其内容往往是经过搜集整理后聚合而成的,那么这些站点对用户来说就是有价值的,其相对应的文章理应获得较好的排名。
  由此可见,需要重视两类文章即可。一是原创文章,二是有价值的信息聚合站点下的文章。(本文探讨范围仅限内容页,而非专题页、列表页和首页。)
  那么在甄别这两类文章之前,需要先进行信息的采集。(对于spider程序部分不进行阐述)当spider程序下载下来网页信息后,在内容处理的模块中,需要先对内容除噪。
  内容除噪,并非大家经常性的误以为仅仅除去代码而已。对于笔者来说,笔者还要出去页面部分非正文内容的文字。比如导航条、比如底部文字以及各个文章列表。将它们的影响除去后,将得到一段仅仅包含网页正文内容的文本段落。写过采集规则站长朋友应该知道,这个并不难。但搜索引擎毕竟是一款程序,不可能针对每个站写个类似于的采集规则的东西,所以我需要建立一套除噪算法。

联系电话:0471- 6934705/6934710/6934715

网  址:www.2400.cn www.nmgf.net 企业邮箱:kefu@nmgf.net

地  址:呼市中山东路6号金天帝广场6-9层(波士名人国际、新世纪广场旁) 

Copyright © 2003-2020 www.nmgf.net All Rights Reserved. 蒙ICP备05001757号  蒙公网安备 15010202150104号  设为首页 加入收藏 投诉电话:15848128138 18604718919

内蒙古网站建设 呼和浩特网络公司 微信小程序开发 微网站 软件开发 网站建设 内蒙古手机网站 呼和浩特网站建设 内蒙古网络公司 呼和浩特网站制作 呼和浩特网站设计 呼和浩特网页设计 呼和浩特网页制作 呼和浩特做网站 呼市考试系统 内蒙古考试系统 呼和浩特系统开发 

快捷导航
点击联系我们

Copyright © 2003-2020 国风网络

蒙公网安备 15010202150104号

蒙ICP备05001757号