蜘蛛陷阱是什么

wufei123 2024-05-24 阅读:5 评论:0
蜘蛛陷阱是指:阻止蜘蛛程序爬行网站的障碍物,如站内搜索、电商产品、flash网站、限制性内容等。蜘蛛陷阱的最大特点是:当蜘蛛抓取某个特定url时,它便进入了无限循环,只有入口,没有出口。 在SEO工作中,SEO人员每天都在与内容和链接打交...
蜘蛛陷阱是指:阻止蜘蛛程序爬行网站的障碍物,如站内搜索、电商产品、flash网站、限制性内容等。蜘蛛陷阱的最大特点是:当蜘蛛抓取某个特定url时,它便进入了无限循环,只有入口,没有出口。

蜘蛛陷阱是什么

在SEO工作中,SEO人员每天都在与内容和链接打交道,从目前来看,他们深知独立的原创内容,对于未来站点长期发展的重要性,但这一切的开始,都有一个前提,那就是避免产生“蜘蛛陷阱”。那么什么是蜘蛛陷阱?

“蜘蛛陷阱”是什么?

“蜘蛛陷阱”是阻止蜘蛛程序爬行网站的障碍物,一些网站设计技术对搜索引擎说很不友好,不利于蜘蛛爬行和抓取,这些技术被称为蜘蛛陷阱。 最大的特点是当蜘蛛抓取某个特定URL的时候,它便进入了无限循环,只有入口,没有出口。  

常见的“蜘蛛陷阱”有哪些:  

1、站内搜索  

这是一个常见且容易造成“蜘蛛陷阱”的地方,当你试图在站内搜索某些特定关键词的时候,如果类似search.php?q=这样的URL地址被搜索引擎抓取与收录,那么很可能产生大量无意义的搜索结果页面。  

解决:你可以通过Robots.txt这个文件,屏蔽动态参数。  

2、电商产品  

如果你以往有过操作电商网站的经历,那么你会遇到产品SKU的多样性的问题,同一个主题内容,会根据SKU的不同,产生多个URL,造成大量的内容重复页面,这也导致严重浪费蜘蛛抓取频率。  

当然,还有一种特殊的“蜘蛛陷阱”与电商产品页面类似,就是动态的内容插入,这也往往导致蜘蛛陷入温柔的陷阱。  

解决:确保URL的规范性,你可以试图利用rel=canonical这个标签来解决类似问题。  

3、Flash网站  

为了满足用户的视觉体验,建站公司通常会使用Flash网站,给用户搭建企业官网,这样看起来非常美观,但由于目前搜索引擎并不能很好的抓取与识别flash内容,往往导致站点排名很难提升。  

解决:不要做整站flash,尽量将flash嵌入网页内容的一部分。  

4、限制性内容  

对于一些站点,出去吸引粉丝的目的,很多内容只有登录才能查看,特别是一些强制cookie的操作,这诱导与欺骗了蜘蛛,它很难识别内容,并且不断的尝试抓取这个URL。  

解决:针对网站建设,尽量避免采用这种策略,去吸引用户。  

如何识别“蜘蛛陷阱”  

对于识别蜘蛛陷阱的方法,特别容易,你只需要通过如下内容:  

① 网站日志:利用工具读取当日蜘蛛抓取URL的内容,如果发现特殊的URL地址,那么值得进一步关注。  

② 抓取频率:查看百度搜索资源平台中抓取频率,如果某一天数值特别大,那么很可能陷入蜘蛛陷阱。  

总结:常被讨论的蜘蛛陷阱还有网站框架、sessionid、各类跳转,本文只简单讲述了实际应用中常遇到的蜘蛛陷阱,仅供参考。

以上就是蜘蛛陷阱是什么的详细内容,更多请关注知识资源分享宝库其它相关文章!

版权声明

本站内容来源于互联网搬运,
仅限用于小范围内传播学习,请在下载后24小时内删除,
如果有侵权内容、不妥之处,请第一时间联系我们删除。敬请谅解!
E-mail:dpw1001@163.com

分享:

扫一扫在手机阅读、分享本文

上一篇:seo是什么职业? 下一篇:什么是软文
发表评论
热门文章
  • 华为 Mate 70 性能重回第一梯队 iPhone 16 最后一块遮羞布被掀

    华为 Mate 70 性能重回第一梯队 iPhone 16 最后一块遮羞布被掀
    华为 mate 70 或将首发麒麟新款处理器,并将此前有博主爆料其性能跑分将突破110万,这意味着 mate 70 性能将重新夺回第一梯队。也因此,苹果 iphone 16 唯一能有一战之力的性能,也要被 mate 70 拉近不少了。 据悉,华为 Mate 70 性能会大幅提升,并且销量相比 Mate 60 预计增长40% - 50%,且备货充足。如果 iPhone 16 发售日期与 Mate 70 重合,销量很可能被瞬间抢购。 不过,iPhone 16 还有一个阵地暂时难...
  • Nginx服务器的HTTP/2协议支持和性能提升技巧介绍

    Nginx服务器的HTTP/2协议支持和性能提升技巧介绍
    Nginx服务器的HTTP/2协议支持和性能提升技巧介绍 引言:随着互联网的快速发展,人们对网站速度的要求越来越高。为了提供更快的网站响应速度和更好的用户体验,Nginx服务器的HTTP/2协议支持和性能提升技巧变得至关重要。本文将介绍如何配置Nginx服务器以支持HTTP/2协议,并提供一些性能提升的技巧。 一、HTTP/2协议简介:HTTP/2协议是HTTP协议的下一代标准,它在传输层使用二进制格式进行数据传输,相比之前的HTTP1.x协议,HTTP/2协议具有更低的延...
  • python怎么调用其他文件函数

    python怎么调用其他文件函数
    在 python 中调用其他文件中的函数,有两种方式:1. 使用 import 语句导入模块,然后调用 [模块名].[函数名]();2. 使用 from ... import 语句从模块导入特定函数,然后调用 [函数名]()。 如何在 Python 中调用其他文件中的函数 在 Python 中,您可以通过以下两种方式调用其他文件中的函数: 1. 使用 import 语句 优点:简单且易于使用。 缺点:会将整个模块导入到当前作用域中,可能会导致命名空间混乱。 步骤:...
  • 惠普新款战 99 笔记本 5 月 20 日开售:酷睿 Ultra / 锐龙 8040,4999 元起

    惠普新款战 99 笔记本 5 月 20 日开售:酷睿 Ultra / 锐龙 8040,4999 元起
    本站 5 月 14 日消息,继上线官网后,新款惠普战 99 商用笔记本现已上架,搭载酷睿 ultra / 锐龙 8040处理器,最高可选英伟达rtx 3000 ada 独立显卡,售价 4999 元起。 战 99 锐龙版 R7-8845HS / 16GB / 1TB:4999 元 R7-8845HS / 32GB / 1TB:5299 元 R7-8845HS / RTX 4050 / 32GB / 1TB:7299 元 R7 Pro-8845HS / RTX 2000 Ada...
  • 酷凛 ID-COOLING 推出霜界 240/360 一体水冷散热器,239/279 元

    酷凛 ID-COOLING 推出霜界 240/360 一体水冷散热器,239/279 元
    本站 5 月 16 日消息,酷凛 id-cooling 近日推出霜界 240/360 一体式水冷散热器,采用黑色无光低调设计,分别定价 239/279 元。 本站整理霜界 240/360 散热器规格如下: 酷凛宣称这两款水冷散热器搭载“自研新 V7 水泵”,采用三相六极马达和改进的铜底方案,缩短了水流路径,相较上代水泵进一步提升解热能力。 霜界 240/360 散热器的水泵为定速 2800 RPM 设计,噪声 28db (A)。 两款一体式水冷散热器采用 27mm 厚冷排,...