《懒人Shell脚本》之三——微博分类信息获取与格式化

网友投稿 534 2022-10-29

《懒人Shell脚本》之三——微博分类信息获取与格式化

《懒人Shell脚本》之三——微博分类信息获取与格式化

1、需求:

获取微博网站ctg1_4188#”>社会类媒体的名称信息。

构造成json格式,用于echart格式化显示。

2、分析&实现步骤

第一步:截获

地址:

​​selector='.WB_info';var a=document.querySelectorAll(selector+' a');for(var i =0; i < a.length; i++){console.log(a[i].href+" "+a[i].innerText);}

如下:

VM7557:5 人民网福建频道VM7557:5 澎湃新闻VM7557:5 环球网

上述信息存入:shehui.txt中。

第二步:取上述文件第3列值,存入文件shehui.info.

[root@laoyang process]# awk {'print $3'} shehui.txt | sort

第三步:逐行读取,构造json文件。

[root@laoyang process]# cat readProc.sh#!/bin/shcat /dev/null > format.jsondos2unix shehui.info #格式化,去掉每行末尾的windows结束符"^M”cat ./shehui.info | while read linedoif [ -z "$line" ]; then continuefiecho "{" >> format.jsonecho "\"name\": \"$line\",">> format.jsonecho "\"size\": 1455" >> format.jsonecho "}," >> format.jsondone

第四步:在验证构造的json格式是否正确。

正确的话,提交前端,就能正确显示结果了。

结语:

能用脚本实现的一定不要手写,不要复制、粘贴。

作者:铭毅天下

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:在你的Android应用程序中渲染emoji(使用emojicon)只要一行代码
下一篇:esrally性能分析结果图形化展示深入详解
相关文章

 发表评论

暂时没有评论,来抢沙发吧~