一个移动端跨平台的gpu+cpu并行计算的cnn框架-FinClip官网

一个移动端跨平台的gpu+cpu并行计算的cnn框架

网友投稿 1284 2022-11-01

一个移动端跨平台的gpu+cpu并行计算的cnn框架

libGDL

一个移动端跨平台的gpu+cpu并行计算的cnn框架。基于C++和opengles3.0开发，可以非常方便移植到任何一个支持opengles的平台上。

说明

本项目为个人开发，条件限制待解决的问题还非常多(见下面TODO)。有兴趣的开发者或者想沟通的欢迎联系我

代码框架说明文档见wiki：https://github.com/rexbu/libGDL/wiki/%E8%AF%B4%E6%98%8E%E6%96%87%E6%A1%A3

libGDL特点

纯C++代码，没有依赖任何的第三方库，非常方便移植和编译。基于的libGPU是本人开发的一个C++版本的GPUImage基于opengles 3.0实现，所以理论上libGDL可以应用于iphone5s及android 4.4之后的所有手机上卷积层使用opengles的fbo渲染实现，全连接层基于neon优化，卷积层和全连接之间的数据传输通过pbo实现卷积层和全连接层为并行计算

TODO

详细的开发文档和说明文档后续会补充重点放在了卷积层的优化上，全连接层只是简单使用了neon加速，还有较大优化空间由于本人条件限制，android并未做较多的兼容性测试卷积层的大部分时间都消耗在了纹理采样上，每个卷积层的计算速度和通道数、通道尺寸成正比。哪位gpu的底层大牛协助下优化采样效率，速度还可以提升一个量级（注意是量级的提升！）目测android的显存有限，对于较大网络目前的框架会有问题。卷积层和全连接层之间的数据交换使用pbo，但是我发现在少量iphone手机上，pbo并未起作用，耗时和glReadPixels耗时一样，这样会极大影响计算速度（可能在10ms以上）对MobileNet、YOLO等常用模型的支持模型转换目前只提供了tensorflow的ckpt格式转换

目录说明

libGPU: 一个类似于GPUImage的跨平台opengles框架，支持2.0和3.0，项目地址：https://github.com/rexbu/libGPUsrc: libGDL的框架代码style: 基于libGDL定义的一个风格迁移源码tools: 一个以mnist为例的将tensorflow的ckpt模型转为gdl模型

demo说明

程序里提供了2个demo，一个风格迁移、一个mnist。

性能

mnist为例进行了性能测试，模型13.1M，第一个卷积层5x5x32，第二个卷积层5x5x64，第一个全连接层3136x1024，第二个全连接层1024x10。

iphone5s的速度

小米4c的速度（骁龙808）

微前端架构如何改变企业的开发模式与效率提升

1284 2022-11-01

一个移动端跨平台的gpu+cpu并行计算的cnn框架

微前端架构如何改变企业的开发模式与效率提升

前端开源框架如何提升开发效率与用户体验的关键因素

前端移动端框架如何推动数字化转型与创新发展

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计