Python两招轻松爬取美团评论（美团评论爬虫）-FinClip官网

Python两招轻松爬取美团评论（美团评论爬虫）

网友投稿 1790 2022-09-17

Python两招轻松爬取美团评论（美团评论爬虫）

结果很多读者对爬数据的过程比较感兴趣，那么今天就讲一下我是怎样获取美团数据，其实并不难，甚至还因为需要手动干预而显得有点不太聪明的样子。

店铺评论数据

在重庆火锅的文章中，我们一共爬取了每个店铺基本信息与对应评价两种数据，那么较为简单的就是评论数据，我们进入一个店铺的详情页，F12查找数据包就能轻松找到对应的评论数据

所以想拿下这一页的评论只要将headers中一些参数加进去使用Requests.get请求即可，注意Cookie是必须要添加的

那么返回的json数据无论直接提取数据还是使用正则查找数据都不是困难的，提取之后使用Pandas保存即可，此处就不在赘述，如果需要爬取多页评论怎么办，先手动加载多页评论发现URL中仅有offset参数变了，每页增加10

所以只要写个简单的循环生成多页URL就能拿下指定页数的评论，OK这仅是一家店铺的评论爬取办法，那怎么获得多家店铺的评论呢？如果我们多找几家店铺的评论数据查看会发现，不同店铺对应的Request URL其实变化的只有店铺的ID

所以下面的问题就转换为如何拿到多家店铺的ID，而这些ID都在搜索页面下的店铺基本数据中。

店铺基本数据

为了找到店铺ID，让我们回到搜索页面中(美团首页—美食—火锅)

上面的页面中就是重庆火锅的第一页，还是F12刷新很容易就能找到包含店铺ID、均价等相关信息的数据包

所以也能轻松的获取Request URL

和上一节取评论的方法一样，修改对应的headers信息再使用requests请求即可，然后将店铺基本信息存下来用于分析，再将ID单独存储用于组合评论页URL

当然这只是第一页的url的返回数据，只要修改其中的page参数就能生成多页URL从而获取多页数据

以为这就结束了？并不是，评论页的URL是不变的，但是这里的URL过几分钟就会变一下，也就是说如果你一次性生成10页或更多的URL去循环请求很有可能在中间这个URL就挂掉了，所以你直接在浏览器中打开这个URL提示请求被拒绝，而不是显示对应的json值，就说明URL换了，解决办法只有在URL更换的时候重新手动获取最新的URL并重新组合剩下需要爬取的页面，有点蠢但是因为更换的部分并没啥规律所以好像也没什么更好的办法......

结束语

企业在数字化转型中如何利用常用前端框架提高开发效率并确保安全合规？

1790 2022-09-17

Python两招轻松爬取美团评论（美团评论爬虫）

企业在数字化转型中如何利用常用前端框架提高开发效率并确保安全合规？

企业如何利用敏捷开发工具提升跨平台应用的效率？

洞察如何利用智慧屏第三方App安装提升跨平台小程序的用户体验和安全性

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计