[云框架]TensorFlow Chatbot-用户指南-FinClip官网

[云框架]TensorFlow Chatbot-用户指南

网友投稿 896 2022-10-20

[云框架]TensorFlow Chatbot-用户指南

[云框架]TensorFlow

TensorFlow是Google开源的人工智能（Machine Intelligence）软件库，是使用数据流图（Data Flow Graphs）进行数值计算的开源软件库。Tensor（张量）指在节点间相互联系的多维数据数组，Flow（流）指基于数据流图的计算。TensorFlow架构灵活，小到智能手机，大到数据中心服务器均可展开计算，同时具备很强的通用性，适用于包括图形分类、音频处理、推荐系统和自然语言处理等在内的各种计算领域。

TensorFlow具备以下特点——

灵活（Deep Flexibility）：支持任何数据流图计算便携（True Portability）：支持各类计算设备链接科研和产品（Connect Research and Product）：加速研究成果转化为实际产品自动化微分运算（Auto-Differentiation）：帮助机器学习算法自动求出梯度多语言（Language Options）：利用python构建和执行计算图，支持C++的语言，未来将支持Lua、JavaScript、R等性能优化（Maximize Performance）：支持线程、队列、异步计算，并根据需要分配计算元素

自15年年底开源以来，TensorFlow迅速流行，除了Google，Airbnb、Snapchat、eBay、Twitter等知名公司也纷纷加入到TensorFlow的使用者阵营当中。

本篇云框架将以ErGo（一款基于TensorFlow的Chatbot）为例介绍TensorFlow实践。

内容概览

快速部署一键部署本地部署背景知识业务说明ErGo实现整体架构选取模型选取数据集创建数据集训练训练后数据更新计划社群贡献

快速部署

一键部署

一键部署在好雨云平台

本地部署

准备Docker环境 Git clone git clone https://github.com/cloudframeworks-tensorflow/ErGo 执行如下命令，进行训练训练时长主要取决于数据大小、learningRate（学习效率）、dropout及设备计算能力（推荐使用GPU，训练完成后脚本会自动退出） cd ErGopip install -r requirements.txtpython main.py --train 初始化web uidocker build -t ergo -f Dockerfile.cpu .redis-server &docker run -itd -p 8000:8000 --name ergo ergo 访问 http://localhost:8000

背景知识

TensorFlow门槛较高，背后需要大量且有一定深度的数学理论知识和技术知识：

导数与微积分矩阵与线性代数基本编程原则机器学习基本概念

同时需要有一定的python编程和组织模块的经验，了解Numpy库、matplotlib库、前馈神经网络（feed-forward neural networks）、卷积神经网络（convolutional neural networks）以及循环神经网络（recurrent neural networks）等，建议通过相关专业书籍进行学习或参考下列链接——

Standford - CS 20SI: Tensorflow for Deep Learning ResearchTensorflow PlaygroundTensorflow Docs - 中文

业务说明

聊天机器人（Chatbot）——ErGo，基于TensorFlow实现，可与用户互动完成智能对话。

工作流程可分为提问（Ask）、检索（Retrieve）、抽取（Extraction）、回答（Answer）4部分，用户通过界面（Web）提出问句，ErGo将在已训练数据（Trained Data）中检索并抽取答案，通过界面反馈给用户，如下图所示：

例如——

Master: HI ERGOERGO: HIMaster: I LOVE YOUERGO: I'M SORRY

ErGO实现

整体架构

ErGo的整体架构如下图所示：

ErGo加载Data（语料）并进行数据处理处理完成后，由训练模型（Training Model）加载并进行反复训练完成训练后，ErGo可根据训练后的数据进行相关预测，即与用户完成对话

选取模型

Seq2Seq是最普遍的聊天机器人深度学习模型，ErGo同样采用了Seq2Seq。

Seq2Seq模型由两个主要部件组成，一个是编码器RNN，另一个是解码器RNN。

编码器的工作是将输入文本信息生成固定的表示；解码器则是接收这个表示，并生成一个可变长度的文本来响应。

进一步了解Seq2Seq

seq2seq模型初探seq2seq model

选取数据集

聊天机器人往往用于回答具体某类问题或提供某种服务，因此在训练前，第一件事便是选取数据集，并基于所选数据集类型，在根据自己业务需求定制的训练模型之上，进行定向训练。

序列模型需要大量的会话日志，以便“编码器-解码器网络”能够正确理解每个查询(编码器输入)所期望的响应类型(解码器输出)。

常见数据集包括Cornell_Movie-Dialogs_Corpus（本例使用）、Ubuntu Dialogue Corpus等。

创建数据集

创建数据集设计到数据集预处理，本例中使用已经预处理完成的数据。

进一步了解如何预处理数据，请参考——

Word2vectflearn - data management

训练

Tensorflow原生支持多种数据读取方式，本例默认使用从文件中读取的方式加载处理初始数据，处理后的数据会保存为随机生成的pkl文件

本例中数据模型基于循环神经网络（RNN）及两层长短时记忆网络（LSTM），同时使用了seq2seq模型，其主要就是定义基本的LSTM结构作为循环体的基础结构，通过MultiRNNCell类实现深层循环神经网络，利用dropout策略在处理完的数据上运行tf.train操作，返回全部数据上的perplexity的值，具体实现参考实例代码model

训练后数据

训练完成后，Tensorflow默认会将训练结果保存为model.ckpt。

ErGo每次进行预测（即对话）时会加载相关的模型数据，并返回接近最优的回答。

但在交互过程中，我们可能会发现结果不尽如人意，建议通过以下方法进行改进：

提供更多的数据库，以帮助从更大的会话语料库中学习LSTM结构参数的调优，如LSTM单元数、LSTM层数、优化器的选择、训练迭代次数

如何变成自己的项目

生成数据集获取自己的数据副本，利用相关工具或脚本提取相关的对话序列生成自己的数据集生成单词向量利用word2vec为数据集中出现的单词生成单词向量可以根据需求来拓展修改相关model函数（可选）参考本地部署执行训练访问

更新计划

训练提供训练数据API接口展示提供展示界面API接口文档微信界面展示接入

社群贡献

QQ群: 621870673参与贡献联系我们

云框架系列主题，遵循APACHE LICENSE 2.0协议发布。

微前端架构如何改变企业的开发模式与效率提升

896 2022-10-20

[云框架]TensorFlow Chatbot-用户指南

洞察管理小程序实例的关键在于实现跨平台能力与数据安全，如何利用FinClip助力企业在数字化转型中既合规又高效？

微前端架构如何改变企业的开发模式与效率提升

前端开源框架如何提升开发效率与用户体验的关键因素

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计