佳木斯信息港

当前位置:

网站如何被百度收录网站优化如何更好的被百

2019/05/15 来源:佳木斯信息港

导读

1 : 站优化如何更好的被百度蜘蛛抓取A5创业项目春季招商 好项目招代理无忧站排名好不好,流量多不多,其中1个关键的因素就是站收录如

1 : 站优化如何更好的被百度蜘蛛抓取

A5创业项目春季招商 好项目招代理无忧

站排名好不好,流量多不多,其中1个关键的因素就是站收录如何,虽然收录不能直接决定站排名,但是站的基础就是内容,没有内容想做好排名难上加难,好的内容能得到用户和搜索引擎的满意,可让站加分,从而促进排名,扩大站的暴光页面。而要想让自己的站更多页面被收录,首先就要让页被百度蜘蛛抓取,能不能收录我们先不谈,先要抓取才有后续收录。那么站如何更好的被百度蜘蛛抓取呢?

1.站及页面权重。

这个肯定是重要的了,权重高、资格老、有权威的站蜘蛛是肯定特殊对待的,这样的站抓取的频率非常高,而且大家知道搜索引擎蜘蛛为了保证高效,对站不是所有页面都会抓取的,而站权重越高被爬行的深度也会比较高,相应能被抓取的页面也会变多,这样能被收录的页面也会变多。

2.站服务器。

站服务器是站的基石,站服务器如果长时间打不开,那末这相当与你闭门谢客,蜘蛛想来也来不了。百度蜘蛛也是站的1个访客,如果你服务器不稳定或是比较卡,蜘蛛每次来抓取都比较艰巨,并且有的时候1个页面只能抓取到1部份,这样长此以往,百度蜘蛛的体验愈来愈差,对你站的评分也会愈来愈低,自然会影响对你站的抓取,所以选择空间服务器1定要舍得,没有1个好的地基,再好的房子也会跨。  3.站的更新频率。蜘蛛每次爬行都会把页面数据存储起来。如果第2次爬行发现页面与第1次收录的完全1样,说明页面没有更新,蜘蛛也就没有必要常常抓取了。页面内容常常更新,蜘蛛就会更加频繁的访问页面,但是蜘蛛不是你1个人的,不可能就在这蹲着等你更新,所以我们要主动向蜘蛛示好,有规律的进行文章更新,这样蜘蛛就会根据你的规律有效的过来抓取,不但让你的更新文章能更快的抓取到,而且也不会造成蜘蛛常常性的白跑1趟。

4.文章的原创性。

优良的原创内容对百度蜘蛛的诱惑力是非常巨大的,蜘蛛存在的目的就是寻觅新东西,所以站更新的文章不要收集、也不要每天都是转载,我们需要给蜘蛛真正有价值的原创内容,蜘蛛能得到喜欢的,自然会对你的站产生好感,常常性的过来寻食。

5.扁平化站结构。

蜘蛛抓取也是有自己的线路的,在之前你就给他铺好路,站结构不要过于复杂,链接层次不要太深,如果链接层次太深,后面的页面很难被蜘蛛抓取到。

6.站程序。

在站程序当中,有很多程序可以制造出大量的重复页面,这个页面1般都是通过参数来实现的,当1个页面对应了很多URL的时候,就会造成站内容重复,可能造成站被降权,这样就会严重影响到蜘蛛的抓取,所以程序上1定要保证1个页面只有1个URL,如果已产生,尽可能通过301重定向、Canonical标签或robots进行处理,保证只有1个标准URL被蜘蛛抓取。

7.外链建设。

大家都知道,外链可以为站引来蜘蛛,特别是在新站的时候,站不是很成熟,蜘蛛来访较少,外链可以增加站页面在蜘蛛眼前的暴光度,避免蜘蛛找不到页面。在外链建设进程中需要注意外链的质量,别为了省事做1些没用的东西,百度现在对外链的管理相信大家都知道,我就不多说了,不要好心办坏事了。

8.内链建设。

蜘蛛的爬行是随着链接走的,所之内链的公道优化可以要蜘蛛抓取到更多的页面,增进站的收录。内链建设进程中要给用户公道推荐,除在文章中增加锚文本之外,可以设置相干推荐,热门文章,更多喜欢之类的栏目,这是很多站都在利用的,可让蜘蛛抓取更大范围的页面。

9.首页推荐。

首页是蜘蛛来访次数多的页面,也是站权重的页面,可以在首页设置更新版块,这样不但能让首页更新起来,促进蜘蛛的来访频率,而且可以增进更新页的抓取收录。同理在栏目页也能够进行此操作。

10.检查死链,设置404页面

搜索引擎蜘蛛是通过链接来爬行搜索,如果太多链接没法到达,不但收录页面数量会减少,而且你的站在搜索引擎中的权重会大大下降。蜘蛛在遇见死链就像进了死胡同,又得折返重新来过,大大下降蜘蛛在站的抓取效率,所以1定要定期排查站的死链,向搜索引擎提交,同时要做好站的404页面,告知搜索引擎毛病页面。

11.检查robots文件

很多站成心无意的直接在robots文件屏蔽了百度或站部分页面,却整天在找缘由为何蜘蛛不来抓取我的页面,这能怪百度吗?你都不让他人进门了,百度是怎样收录你的页?所以有必要常常去检查1下站robots文件是不是正常。

12.建设站地图。

搜索引擎蜘蛛非常喜欢站地图,站地图是1个站所有链接的容器。很多站的链接层次比较深,蜘蛛很难抓取到,站地图可以方便搜索引擎蜘蛛抓取站页面,通过抓取站页面,清晰了解站的架构,所以建设1个站地图不但提高抓取率还能取得蜘蛛好感。

13.主动提交

每次更新完页面,主动把内容向搜索引擎提交1下也是1个不错的办法,只不过不要没收录就1直去提交,提交1次就够了,收不收录是搜索引擎的事,提交不代表就要收录。

14.监测蜘蛛的爬行。

利用站日志监测蜘蛛正在抓取哪些页面、抓取过哪些页面,还可以利用站长工具对蜘蛛的爬行速度进行查看,公道分配资源,以到达更高的抓取速度和勾引更多的蜘蛛。

就写到这了,站要取得更多的收录就需要做好搜索引擎蜘蛛的抓取优化工作,只有提高了站整体的抓取率,才能提高相应的收录率,这样站的内容才能取得更多展现和推荐,站排名才能得到提高。所以木木seo建议,在整天想着流量,想着转化率之前先好好诊断1下站是不是利于搜索引擎抓取,底子打好才能往上爬,基础建设始终是站优化的根本。

作者:木木seo 文章来自:

2 : 怎样避免站大量重复URL被百度收录?

很多同学会有这样的疑惑,索引量工具显示索引量数值很高但流量总也上不去,也没有发现我们站内有低质内容,百度这是要闹哪样?如果各位同学还有工作经验等内容想分享、或对已有内容持相反意见者,欢迎给站长学院投稿。

首先声明,我们只谈论有检索意义的URL,也就是用户会从搜索引擎查找的页面。其他页面依照经常使用的方法做屏蔽就行了。鉴于很多站长都爱讨论整体的收录量,我必须泼1下冷水,也许你的有效收录是1/10。

URL参数

也叫URL query,是1个复杂,容易被忽视,容易被让步的问题。他是站运营中必不可少的元素,如果简单的去除,其他部门就没法工作了。 静态化是的话题,URL参数常常被用于以下几方面:

同1个实体的不同状态展现,比犹如1个酒店,在不同时间点会有不同的房间库存:⑴0

为了统计不同渠道的流量:

为了统计不同渠道,具体模块的点击量:

调试:

全球奇葩的是亚马逊,竟然把统计参数放到了路径中

出现这类问题的坏处有几点:

1. 浪费搜索引擎对你站的各项配额,从而影响其他正常的页面。

2. 丢失很多本应拿到的链接加分,站外渠道的链接常常是良的。同1个URL的分值可能分散成几10份。

3. SEO的流量被统计到别的渠道(由于tracking字段写的是别的渠道,而且被收录被点击)

4. 常常构成1种局面,产品用1套URL,SEO用另外一套URL, 乃至不同渠道用不同的URL,后期开发和保护的本钱极高。

为了解决这个问题,首先要弄清URL的定义。以我的理解,每一个URL是1个静态的、独立不重复的、故意义的实体,1般也有检索意义(就是有人会搜)。比如1个人、1辆车、1条道路、1个零件。而不能混入各种状态,比如这个人生病的时候,难道就不是他自己了么? 1件商品在促销的状态难道是另外一件商品了么?

理论上canonical标签就能够解决这个问题了, 但是从实际测试结果看,百度对这个标签的支持优先级非常低, 几近可以疏忽不计。那末我的解决方案是这样的:

1. 建立好站的思惟导图和元信息。

2. 所有和SEO元信息相干的参数都放到路径中去

3. 所有和SEO元信息不相干的参数都放到#后边,由于#后边不影响web服务器返回的内容。简单的说就是用#替换?。

4. 每一个页面中都利用js获得#后边的参数对,通过2次要求发回给统计服务器

5. 如果#后边的参数影响页面内容,比如酒店的入住日期。那么这部分内容用ajax加载就行,他是不稳定的,不属于页面内容的1部份。(固然还有变通的办法,暂不赘述。)

6. 原始的#锚点定义肯定会冲突,定义1个#后边的变量,并用js控制屏幕转动,来保证原始锚点的作用。

有人可能会想到,根据ua判断,如果是搜索引擎爬虫,就用跳转的方式去掉URL参数。但效力的方法一定是从1开始就不展现毛病URL。那么前面的例子优化后就变成了:

⑴0

其实很多站早就使用这类方式了,但是还有很多站由于开发效力没法及时实现。所以对1般的小站,1定要推敲开发本钱,不要轻易冒进。只要能避免问题的产生,变通的方法是很多的。

路径中使用非必要元素

很多站仿照亚马逊的做法,把商品名体现在URL中,然后再通过id来决定页面展现的内容:博集典藏馆043基督山伯爵-亚历山东大学仲马/dp/B005TZHJEQ/

这样虽然可以提高1些相干性,但是很危险。在长时间乃至短时间的时间内,大量商品的名称是非常可能有变化的,那么URL也就随着变化。本钱也是非常高的,由于加大了技术实现难度,不管从站内还是站外,每次增加链接都是1个很麻烦的事情。

在我接手艺龙SEO之前,URL被全部改成了这样,对我早期的工作造成了非常巨大的负担:⑴-hotel/

通过日志分析发现基本所有的百度蜘蛛发起的要求都被301跳转了1次(日志分析方法可参考SEO健康度 )。细致调查后发现,从SEO拼接规则到后台的汉字和翻译数据被1直修改。也就是说,这个URL相干的元素有:

1. 中文 (非必要元素)

2. 由中文翻译的英文 (非必要元素)

3. id (必要元素)

而当时负责SEO的同事把英文和id拼接在了URL中,那末这样1个URL前后变成过:

⑴-hotel/

⑴-hotel/

⑴-hotel/

⑴-hotel/

跟相干性比,URL的唯1性和稳定性更重要。所以针对这个问题,URL的策略应当是:

如果这个id是隶属于1个分类下的,比如城市,那么就能够是:

从技术角度说, id1般是数据库的primary key,可以是数字也能够是字符串,那么这个时候URL是1维的; id也能够是联合的唯1索引,那么URL就是2维的,就像上面的(bejing,123)缺1不可。电商类站列表页常常用到3维以上。

大小写

如果站的技术架构用的是开源系统,1般是不会有这个问题的。如果使用了微软的技术架构,这个问题非常常见:

我的建议是统1使用小写,大写自动跳转为小写(谨慎301死循环!)。

目录的规范

很多站同时存在这样的URL,无形中把收录量扩大了1倍:

上边第1个路径的意思是在product目录下有1个123文件。第2个路径的意思是在product目录下有1个123目录,这个目录下可能有很多文件,但是他代表众多文件中的ml或p或px等优先级的那个文件。为了不歧义,我定义文件都是用.html结尾的。

为了减少重复收录,那末按我的习惯是:

=

=

总结

1. 所有部门统1使用SEO定义的URL,屏蔽非SEO URL的入口。

2. 用#替换?

3. 统1使用小写

4. 保证目录的规范

5. 把不规范的URL跳转到规范的URL

3 : 站怎样做才能被百度收录

百度喜欢结构简单的页(比如wan-,具有复杂结构的页可能没法顺利登录百度。您在进行页设计时应尽可能:

1. 给每个页加上标题

站首页的标题,建议您使用您的站名称或公司名称,其它页的标题建议与每个页内容相干,内容不同的页不用相同的标题。

2. 不要把全部页做成1个Flash或是1张图片

百度是通过辨认页源代码中的汉字来认识每个页的。如果您的全部页是1个Flash或1张图片,百度在页中找不到汉字,就有可能不收录您的页。

3. 不对页做重定向

重定向的页可能不容易登录百度。

4.不在页中使用Frame(框架结构)

5.不在页中使用过分复杂的Java Script

某些Java Script的内容对搜索引擎是不可见的,所以不能被辨认和登录。

5.静态页能更顺利登录百度,动态生成的页不容易登录百度

如果您的页url中含有如asp、?等动态特点,页便可能被认为是动态页。

如果您的站中有很多页必须做成Frame结构或动态页,那末建议您少把站首页做成简单的页,并且对站内的1些重要页,在首页加上链接。

6. 不要对搜索引擎进行做弊

做弊的站不能登录百度,即便登录后也随时可能被删除。

做弊站定义

对搜索引擎做弊,是指为了提高在搜索引擎中展现机会和排名的目的,欺骗搜索引擎的行动。

以下行动都可能被认为是做弊:

在页源代码中任何位置,故意加入与页内容不相干的关键词;

在页源代码中任何位置,故意大量重复某些关键词。即便与页内容相干的关键词,故意重复也被视为做弊行动;

在页中加入搜索引擎可辨认但用户看不见的隐藏文字。不管是使用同背风景文字、超小字号文字、文字隐藏层、还是滥用图片ALT等方法,都属于做弊行动;

故意制造大量链接指向某1址的行动;

对同1个址,让搜索引擎与用户访问到不同内容的页(包括利用重定向等行动);

做弊行动的定义是针对站而不是页的。1个站内即便只有1个页做弊,该站也被认为是有做弊行动;

有链接指向做弊站的站,负连带,也会被认为是做弊(但是,做弊站上链接指向的站,不算做弊)。

做弊站害处

根据页的做弊情况,会遭到不同程度的惩罚:

较轻微的惩罚,是系统在给页排名时略为下落该页的排名;

较常见的惩罚,是做弊站的某些关键词(或所有关键词)的排名降到其它任何站以后;

较严厉的惩罚,对做弊行动和后果特别卑劣的站,将从百度中消失;

特别补充,含恶意代码或歹意插件等用户极端反感内容的页,虽然不是做弊,但只要用户投诉,1经确认也会被百度谢绝收录;

4 : 页应当怎样设计,才能被百度有效收录

A5创业项目春季招商 好项目招代理无忧

百度喜欢结构简单的页,具有复杂结构的页可能没法顺利登录百度。您在进行页设计时应尽可能:

1. 给每个页加上标题。

站首页的标题,建议您使用您的站名称或公司名称,其它页的标题建议与每个页内容相干,内容不同的页不用相同的标题。

2. 不要把全部页做成1个Flash或是1张图片

百度是通过辨认页源代码中的汉字来认识每个页的。如果您的全部页是1个Flash或1张图片,百度在页中找不到汉字,就有可能不收录您的页。

3. 不对页做重定向

重定向的页可能不容易登录百度。

· 不在页中使用Frame(框架结构)

· 不在页中使用过分复杂的Java Script

某些Java Script的内容对搜索引擎是不可见的,所以不能被辨认和登录。

· 静态页能更顺利登录百度,动态生成的页不容易登录百度。

如果您的页url中含有如asp、?等动态特点,页便可能被认为是动态页。

如果您的站中有很多页必须做成Frame结构或动态页,那末建议您少把站首页做成简单的页,并且对站内的1些重要页,在首页加上链接。

· 不要对搜索引擎进行做弊。

做弊的站不能登录百度,即便登录后也随时可能被删除

治疗痛经的简单方法
怎么样治疗月经不调
月经过多贫血吃什么好
标签