使用百度飞桨EasyDL实现AI文章自动分类-FinClip官网

使用百度飞桨EasyDL实现AI文章自动分类

网友投稿 794 2022-09-30

使用百度飞桨EasyDL实现AI文章自动分类

前言

为了降低人工成本，提升效率，选择用AI来帮助做工作，会有非常好的效果。但是通过自己组建AI算法团队来满足这个需求的话，不免有点成本飙升。为了拥有一套自己的AI工具，那么我们今天介绍一款低成本AI工具“百度飞桨EasyDL”，来实现自动分类。

开始

需求说明

开发一个汽车资讯网站，需要对资讯快速分发，快速分类，快速推送到不同的专栏下。如果用人力来做的话，人力成本高、效率低。那么随着我来一起搞一个便宜的AI助手吧。

步骤一：

步骤二：

选择单标签（说明：因为每篇文章需推送到一个专栏而非多个，因此，文章标题与专栏是一一对应关系，即每篇文章仅打上一个专栏的标签即可）

步骤三：

数据准备

明确需要发布的专栏名称。在该汽车资讯网站中，专栏包括汽车改装、新车测评、自驾游记、买车中心。针对各个专栏名称，收集该专栏下的常见推文标题，一个专栏下收集30-50个标题名称。例如，自驾游记专栏对应的标题：二月最后一个周末带我的Q7京西游，汽车改装专栏对应的标题：自己动手改房车大功告成。形成可上传到EasyDL进行训练的数据，您可以导入原始数据后使用EasyDL的标注工具完成标注，这里的原始数据要求为：Excel/txt的单列数据（如下图）：

也可以先将训练数据处理好后再上传到EasyDL。如果您是将训的训练数据，上传后即可发起训练，如下图：

提示：如果您上传原始数据，也可通过平台内置的标注工具进行快速标注，如下图：

在标注量较大的情况下，您可以开启上图右上角的智能标注功能，您只需要标注30%的文本，剩余的70%文本平台为自动打上标签，提高您的标注效率。

步骤四

模型训练

选择算法时，在对时延没有特殊要求的情况下，建议您可以使用高精度算法进行训练，优势是可以使用较少的数据集也能获得高精度效果。在选择筛选指标时，如没有特殊要求，也可以默认选择精度和召回平衡的策略，使用平台默认值即可。为测试平台模型效果，您可以选择开启自定义测试集，即测试集为不同于训练集的数据，您可以在该数据集下看模型效果，如不开启，则平台会自动将训练数据中抽出部分数据作为测试集展示模型效果。

步骤五

模型部署模型训练完毕后，如您对模型效果满意，可以选择公有云部署，在接口地址中输入自定义名称，如下图：

步骤六

效果优化当模型训练完毕后，可通过模型评估报告查看效果，从报告中四个标签的训练精度表现看，新车评测、买车中心的准确率较低，如下图：

追溯原因，在前期数据准备时，该两个标签的数据量过少。例如，下图中买车中心仅有15条数据，所以，需要对该标签下的数据进行补充，同时，在买车中心下，发现标题有两种不同的风格，每个风格的数据仅有10条也会影响训练精度，因此，扣充的粒度是买车中心标签下每个风格标题的数据量进行扩充，至少保证30-50条。

总结

如上几步就可以让你快速拥有一个自己的AI助手，还不快来动动你的小手么。

微前端架构如何改变企业的开发模式与效率提升

794 2022-09-30

使用百度飞桨EasyDL实现AI文章自动分类

微前端架构如何改变企业的开发模式与效率提升

前端开源框架如何提升开发效率与用户体验的关键因素

前端移动端框架如何推动数字化转型与创新发展

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计