分析搜索引擎依据什么对网站进行排名

搜索引擎排名一直是众人关注的焦点,但是搜索引擎到底是依据什么对网站进行排名的至今无从所知。作为站长的我们必须有自己的看法和猜测才能离成功更近。

  一,原创文章:这是最让站长犯愁的一个指标,要写好一篇文章不仅要有好的素材更要有好的写作功底,不是几分钟几十分钟就能够搞定的。另外文章发布在网站上迟迟不被收录,被人盗版转载之后反而被百度收录了,那么花费的精力时间也就白费了。

  二,外链情况:内容为王,外链为皇是seo业界公认的名词,我们在注重文章质量度的同时自然不能埋没了外链这块大蛋糕。在互联网对垃圾信息整理越来越严格的时代,站长们建设外链无疑增加了不少难度。

  三,网站更新:每天固定时间的更新是做网站的一个大问题,大部分站长都是业余爱好者并非全职,大家都有自己的工作,要做到每天定时更新不是一件容易的事。不仅要做到定时更新,更新的内容也不能太过草率,要做到每天按时按量则为最佳状态。

  四,网站年龄:相信网站年龄就像人一样,年龄大的人去做一份工作往往比年轻人更容易得到信任,同样的内容出现在新网站和老网站上得到的待遇自然也是不同的。

  五,网站结构:一个网站的结构就像是娱乐性的迷宫一般,如果死路太多玩家心情也会大受影响,蜘蛛就是玩家中的一员,你要让他走任何一条路都有出路,满足他的虚荣心,他的心情才会愉悦,你的网站才会有好的结果。

  六,网站的朋友:网站朋友指的不仅仅是友情链接,还有同在一个IP下的网站,同一个IP就像一个居所,众多网站居住在一起,正所谓人以类聚,如果同居的网站不受百度待见,那么就要小心自己的网站受到牵连了。

  七,服务器稳定性:网站所在的IP不仅要避免不受百度待见的同居者,更要注重服务器的稳定,如果百度蜘蛛每次来你家找你都找不到,那么久而久之它自然就不会再上门浪费时间了。所以服务器稳定性一个很关键的因素。

  以上几点是我运营电子商务网个人总结,可能是搜索引擎的排名依据有所出入,但是在不确定搜索引擎排名依据的情况下,这几点就是我做站的目标,我相信做好这几点网站排名也会越来越靠前的,还没有自己看法的新手站长可以稍作参考。相信我的网站月流量上万并不是偶然!也祝愿站长朋友的网站流量早日上万

浅析搜索引擎如何判断网站主动访问用户?

近日,百度站长平台发布了《容易被站长忽视的内容:主动访问用户数据》这篇文章,指出站长在运营网站、关注分析网站数据的过程中往往忽略了对主动访问用户数据的分析。

  什么是网站的主动访问用户?百度站长平台给站长罗列了三点:需要答案、需要解决问题时,自然而然想到某网站的用户;有内容要分享、有委曲要倾诉时,想立即登录到某论坛的用户;有事儿没事儿都在某网站上逛的用户。 而在我从看来,主要是在传达以下三方面的意思给各位站长:

  1.提高网站的回访率,增加用户粘性

  2.优化网站的专注度,提高网站在相关专注领域的知名度

  3.提高网站的用户体验

  至于怎样增加用户忠诚度以及如何提高网站在某领域的权威,这类文章太多太多,这里就不累赘。搜索引擎可以通过多种渠道和手段定位网站的主动访问用户,你知道搜索引擎是通过怎样的渠道来判断一个网站的主动访问用户吗?

  一、搜索关键词

  我们都知道用户找到一个网站除了直接访问、跳转链接等形式外,最主要的就是搜索关键词。而相信使用百度站长工具的站长都知道,百度站长工具的后台有很详细的关键词、点击率、点击量等数据,搜索引擎就是通过这些关键词来分析主动访问用户数据的。

  那通过搜索什么关键词的用户才算是主动用户呢?其实很简单,搜索“网站名称”、“网站名称+其它关键词”这类关键词的搜索用户,搜索引擎判断一定是主动用户。

  二、书签

  书签包括百度搜藏、qq书签、google bookmark等有很多种,很多时候我们觉得一个网站不错都会把这个网站的地址添加到搜藏夹以便下次访问。而搜索引擎通过网站的跳转链接访问数据的分析就能计算出网站的书签访客的数据,而这也是网站主动访客的判断依据之一。

  三、评论

  很多时候站长都喜欢添加友情链接或者互访并相互评论,试想如果A网站上经常有来自B网站的评论,这是不是可以说明来自B网站相关的用户是A网站的主动访客?

  四、cookies数据

  绝大部分的网站和浏览器都支持cookies数据,可以记录访客在某一个时间或者某一段时间在网站上的操作行为或者其它访问网站的历史记录,而搜索引擎可以通过对cookies数据的调用分析出用户的访问行为,进而判断用户对某一个网站的关注度。

解说TF-IDF算法在SEO优化中的应用

TF-idf算法其实是一种用户资讯检索与资讯探勘的常用加权技术,常常被SEOER们应用到,而很多人或许不太知道,其实最直观的了解就是“网站关键词密度”。

  直接切入主题,TF-idf算法到底是如何计算的:

  公式:

  TF:词频

  IDF:逆文本频率指数

  TF-IDF=TF*IDF

  我们举例说明,TF词频的意思,是指一个词出现在页面中的次数,如果一篇文章的总词语数是200,而“网站优化”这个词出现了4次,那么这个词频TF=4/200,也就是0.02。

  而IDF也就是很文件频率,指这个词在多少页面出现过计数为N,文件总数计数为M,那么IDF=lg(M/N)。假设“网站优化”在2000个页面出现,总文件数为1亿,那么文件频率IDF=lg(100000000/2000)=4.69897,那么计算最后的TF-IDF=0.02*4.69897=0.0939794。

  这只是一个判断一个页面的相关度的问题,而在SEO网站优化中,并不只是判断TF-IDF的值加分,我们需要一个识别度高的词来为页面加分。例如:搜索引擎收录一万亿个页面,应该说每个页面都会有“的、是、中、地、得”等等词,这些高频词也叫噪音词或停止词,搜索引擎会去除这些词,所以这些词的加分权重其实应该是0。计算公式:TF-IDF=log(1万亿/一万亿)=log1=0。

  其实在搜索引擎检索中,计算权重的时候,会根据每个词分词来计算,例如:“SEO网站优化的技巧”这个词。

  假设:SEO页面检索数位2000万,网站优化的检索数为1000万,技巧的检索数为50000万

  搜索引擎索引总数假设为100亿。

  SEO在www.ruihess.com这个网站中页面(页面总词数400)出现8次,网站优化出现10次,技巧出现16次。

  那么各自的词频

  TF(SEO)=8/400=0.02,

  TF(网站优化)=10/400=0.025

  TF(技巧)=20/400=0.04

  TF(的)=上面已近提到,的属于高频停止词,权重为0。

  那么搜索“SEO网站优化的技巧”这个页面的相关度为:TF(总)=0.02+0.025+0.05=0.095。

  而IDF(SEO)=LOG(10000000000/20000000)=2.69897

  IDF(网站优化)= LOG(10000000000/10000000)=3

  IDF(技巧)=log(10000000000/100000000)=1.69897

  这么算下来之后,每个词为搜索“SEO网站优化的技巧”为页面的权重和相关度贡献的值分别为:

  Tf-idf(seo)=0.02*2.69897=0.0539794

  Tf-dif(网站优化)=0.025*3=0.075

  Tf-idf(技巧)=0.04*1.69897=0.0679588

  由此可以看出,虽然技巧出现的频率更高,但识别度没有SEO和网站优化高,所以为页面的权重贡献度并不是太大。

  一个词的预测能力也就是识别度越高,那么这个词的权重越大,反之则越小,看到“网站优化“可能你就已经基本了解这个页面要讲什么,但是看到技巧,你可能还不是太明白页面的主题。

  当然这支持搜索引擎的算法的一个点,我们还要结合标签来实现权重的提升,例如H标签,而主关键词周边的词也会加分,这里周边是指在一个标签内的例如:SEO网站优化的技巧主要是一些搜索引擎优化思路的介绍