网站建设 社群运营 巧用“插入其他公众号文章链接”的漏洞抓取公众号全部图文

巧用“插入其他公众号文章链接”的漏洞抓取公众号全部图文

中企动力企业交流群


各位小伙儿伴儿,一定深受过采集微信公众号之苦吧!特别是!!!!!!公众号历史信息!!!这丫除了通过中间代理采集APP,还真没什么招数能拿到数据啊!


直到············

前段时间晚上微信官方发布了一个文章:点这里

大致意思是说以后发布文章的时候可以直接插入其它公众号的文章了。


诶妈呀!这不是一直需要的采集接口嘛!啧啧 天助我也啊!来来·········下面大致的说一下方法。

1、首先你需要一个订阅号! 公众号、企业号是否可行我不清楚。因为我木有·····

2、其次你需要登录!

微信公众号登录我没仔细看。

这个暂且不说了,我使用的是selenium 驱动浏览器获取Cookie的方法,来达到登录的效果。

3、使用requests携带Cookie、登录获取URL的token(这玩意儿很重要每一次请求都需要带上它)像下面这样:


4、使用获取到的token,和公众号的微信号(就是数字+字符那种),获取到公众号的fakeid(你可以理解公众号的标识)


我们在搜索公众号的时候浏览器带着参数以GET方法想红框中的URL发起了请求。请求参数如下:


请求相应如下:


代码如下:


好了 我们再继续:

5、点击我们搜索到的公众号之后,又发现一个请求:


请求参数如下:


返回如下:


代码如下:


好了···最后一步,获取所有文章需要处理一下翻页。翻页请求如下:


我大概看了一下,极客学院每一页大概至少有5条信息,也就是总文章数/5 就是有多少页。但是有小数,我们取整,然后加1就是总页数了。

代码如下:


item.get(‘link’)就是我们需要的公众号文章连接啦!继续请求这个URL提取里面的内容就是啦!

以下是完整的测试代码:



作者:崔庆才(中国统计网特邀认证作者)
来源:中国统计网
本文来源于公众号中国统计网,转载请联系作者并注明来源。

中企动力企业交流群

声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。 如涉及版权问题,请提交至online#300.cn邮箱联系删除。

相关文章

以上产品还未完全满足我的所有需求,在下方提交我的专属需求
我的专属需求:
*手机号:
*验证码:
img
咨询报价
现在咨询