transformer里的attention mask产生的单向双向效果和xlnet里的效果-FinClip官网

transformer里的attention mask产生的单向双向效果和xlnet里的效果

网友投稿 1110 2022-11-15

transformer里的attention mask产生的单向双向效果和xlnet里的效果

1，2，3，4是一句话的四个词，并打乱了顺序，

以xlnet为例，

图中，

上图和下图的区别是下图扣去邪线，

上图表示，1可以看到1，2可以看到2，3可以看到3，4可以看到4，

下图表示，1不能看到1，2不能看到2，3不能看到3，4不能看到4，

把这个mask矩阵左下（右上？）角全部置0，则是单向transformer，把整个mask矩阵全部置1，则是双向transformer，

回到上图，矩阵第一行，表示预测1的时候可以看到3->2->4，矩阵第二行，表示预测2的时候可以看到3，矩阵第三行，表示预测3的时候都看不到，矩阵第四行，表示预测4的时候可以看到3->2

为什么如此将矩阵mask能实现看到看不到的效果？因为这个attention矩阵是句子A和句子B造的attention矩阵，用 attetion矩阵再去矩阵乘句子A，则是个完整的attention效果，也就是attention矩阵一行里如果mask掉一部分词，就等于缺少那部分词的信息。（目前理解）

转转小程序领跑二手电商，市场增势明显

1110 2022-11-15

transformer里的attention mask产生的单向双向效果和xlnet里的效果

首个小程序第三方插件平台开放！免费制作小程序功能再次升级！

阿拉丁公布8月期小程序行业报告，小程序生态的快速成熟矩阵效应明显

转转小程序领跑二手电商，市场增势明显

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计

transformer里的attention mask产生的 单向双向效果和xlnet里的效果

最近发表

更多内容

推荐文章

解决方案

热评文章

transformer里的attention mask产生的单向双向效果和xlnet里的效果