用C#写个小程序爬取漫画(用c程序实现的算法必须要有输入和输出)

网友投稿 526 2022-09-20

用C#写个小程序爬取漫画(用c程序实现的算法必须要有输入和输出)

用C#写个小程序爬取漫画(用c程序实现的算法必须要有输入和输出)

这是要爬的地址 https://iqiyi.com/manhua/detail_18yzlq8jc5.html,F12 查看网络发现他是通过 https://iqiyi.com/manhua/catalog/18yzlq8jc5/ 这个接口获取目录信息的。

这是第一话的地址 https://iqiyi.com/manhua/reader/18yzlq8jc5_18yzebufq1.html ,跟接口返回的数据对比发现前面的部分是固定的,后面的就是 comicId+"_"+episodeId+".html"。

下面通过C#代码获取漫画第一话的地址。

首先准备一个类方便解析json

这样每一话的地址就显示出来了,最后把每话里的图片保存起来就行了。打开第一话,发现图片地址不是从接口返回的,而是直接写在html里的

在浏览器开发者工具中选中一个图片标签,选择复制 XPath,会得到 /html/body/div[3]/ul/li[1]/img

再把后面的 li[1] 改成 li,然后搜索,就把html中所有的img标签都找到了

下面用C#完成上面的操作,首先需要装一个第三方库。

大功告成!!

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Windows服务器异常---查看系统日志--以蓝屏为例分析
下一篇:Window.open()方法参数详解
相关文章

 发表评论

暂时没有评论,来抢沙发吧~