Ip cloak-QA
一些问题的解答
A站点是否可以使用cloudflare?
答:可以,A站点访问,首先从源代码里面拿到A站点的数据信息,然后通过session或者url判定用户是否为二库顾客,如果是,则调用api获取B站点:副本站点
的商品数据
,如果获取到数据,将替换A站点的商品数据,显示B站点:副本站点
的商品数据。如果获取为空,则显示A站点的商品数据
用户首次访问速度是否会变慢?
答:有的会,有的不会
1.如果用户的url没有特定广告参数
,那么不受影响
2.如果用户通过特定广告参数
的url访问,那么首先前端js先进行参数验证,通过后,调用api获取副本站数据,api将进行:
- url中的
特定广告参数
验证 - 调用第三方斗篷的api进一步验证
- 通过后,返回商品数据
上面的这些工作都是额外的,页面的头部和尾部的渲染不受影响,但是商品部分的渲染需要等待执行api完成后才能渲染,因此这种情况下,页面的头部和尾部等非商品数据板块不受影响,但是 商品内容部分的渲染将明显变慢。
同域双库模式的好处?
答:从理论上讲,越是自然发生的事情,越不需要证明,越是不正常的事情,越是要伪造自然发生的数据,就像,越是坏人,越是要伪装成好人。
正常流量下,从google搜索的自然流量,广告流量进入网站,google的js都会检测来源留下一些cookie数据,网站一旦跳转,这些在浏览器的cookie数据和其他存储的值并不能传递过去,数据 就不正常,即使用子域名跳转,也还是问题。
而同域双库,没有任何跳转,则更趋于自然的方式,更为安全。
已经有Ip斗篷了,为什么还要加上广告参数
Ip斗篷,是用来屏蔽google 爬虫,facebook等爬虫,也就是副本站点的商品数据,不要被google爬虫抓取。
但是支付渠道商,虽然也有爬虫获取数据,而更多的还有人工接入排查,因此靠Ip屏蔽是不显示的。
那么,我可以设定一个特定的入口,让支付渠道商找不到,那么就不会访问到我的副本站点商品库数据。
可能有的童鞋又会稳,已经有广告参数了,为什么还要用第三方的Ip斗篷呢?
这是因为,你在Google上面打广告,那么google肯定是知道你这个特定入口的,爬虫也会以这个特定入口进入你的商城,爬取到副本站点数据,因此必须加上斗篷将 google爬虫挡掉
这样我们就非常清晰了
- Ip斗篷:用来挡掉google爬虫,facebook爬虫
- 特定广告参数:用来挡掉支付渠道商钓鱼。
这样我们的站点就非常安全了。
为什么不自己开发斗篷,而是使用第三方的斗篷?
斗篷需要做一个爬虫的IP库,将google 爬虫,facebook爬虫等全部收集取来,而且需要持续更新,漏掉一个ip就会问题,和木桶理论一样,最短的那根木桶决定木桶能装多少水, 维护这个ip库是非常费力的,使用第三方的 斗篷库是更好的选择,如果有的商家有能力搭建自己的斗篷IP库,也可以联系我们接入。
如果您要更好的三方斗篷商,也可以推荐给我们进行接入。