High-Resolution Photorealistic Image Translation in Real-Time: A LPTN-FinClip官网

High-Resolution Photorealistic Image Translation in Real-Time: A LPTN

网友投稿 812 2022-11-23

High-Resolution Photorealistic Image Translation in Real-Time: A LPTN

paper:Pyramid)Introduction实验结论讨论参考

摘要

现有的I2IT(Image-to-Image Translation)方法要么局限于低分辨率的Image，要么就是高分辨率的feature卷积导致沉重的计算负担，使得reference时间就很长。这就使得现在有的算法不适合于实时应用。本文的目的就在于提高高分辨率实际图像(Photorealistic Image)的I2IT算法的速度，基于紧凑形式的拉普拉斯金字塔(closed-form Laplacian Pyramid)的解耦和重建。具体来说，作者发现，譬如明亮度和颜色操作等变换属性多和低频(low-frequency)部分相关；而内容细节(content details)更多的可以在高频部分被自适应地调整。文中提出了一个LPTN(Laplacian Pyramid Transform Network)来同时执行上述的变换和细化。即，设计了一个轻量化网络采用降分辨率的方法来转化低频分量；一个渐进掩码(masking)策略来有效地调整高频分量。该模型的优点是避免了因为处理高分辨feature了引起的计算量消耗，并且忠实地保留了图像细节。

LP(Laplacian Pyramid)

LP的主要思想是线性地解耦一张图像到一个高／低频带地集合中。LP常用于图像压缩，图像增强，图像去噪等处理中，其优点是：(1). LP变换在每一级上只产生一个带通信号，这使得LP在许多corase-to-fien的milti-resolution算法种得到应用；(2). LP只对下采样的低频信号进行处理，这样不会产生“混频”效果。

Introduction

I2IT(Image-to-Image Translation)，指的是将一幅源图像转换到目标域的过程。这方面的问题现在备受关注，比如在白天黑夜图像转化或multi-sensor之间传输图像，或修饰图像的照明和颜色以提高其审美质量等。和传统的I2IT相比，实时高分辨率I2IT任务的主要挑战在于如何保持效率和避免内容失真。

相比较于传统的encode-decode方法的局限在于：关注于低分辨率图像处理的应用或者在reference时耗费了太多的时间，这使得这种方法远远达不到实际应用的地步。

基于上述的发现，文中提出了一种快速且有效的方法，即LPTN来转化提高效率。利用级联残差模块来构建一个轻量化的网络用于处理低频分量；同时为了拟合在低频分量上的操作，并忠实地重构图像，文中自适应地调整高频分量来避免在高分辨率上执行卷积而带来的高额计算量。为了实现自适应地调整高频分量，构建了一个微型网络来计算LP中最顶级地高频分量地mask，然后渐进的上采样来达到和其他level地分辨率一致。本方法使实时I2IT可以在４K分辨率图像上执行实时操作，并且提升了网络地效率相较于传统方法而言。

实验

为扩展I2IT任务到高分辨率场景，我们从Flickr 网络收集了两个非成对数据集，器分辨率从1080p变化到4K范围。一个为白天-黑夜变换，一个为夏天-冬天变换。

此外，为定量评估所提方法，我们在MIT-Adobe-FiveK 数据集上进行实验对比。参考现有方案，我们采用expertC 作为目标。

结论

通过使用LP解耦图像，文中提出的框架将特定领域的视觉属性和具有渐变分辨率的纹理以可逆的方式分离出来，并在低分辨率分量训练了转化和细化网络。

讨论

笔者的思考，将图形进行多尺度，多分辨率变换然后对高/低频进行各自处理，这类方法有很多，可供选择的pyramid 就有Laplacian pyramid，比率低通金字塔变换，对比度金字塔变换，梯度金字塔变化等。和pyramid类相对应的图像分解算法就是wavelet 类时频域变换的算法。图像融合算法这个话题由来已久，现在的问题在如何将原来的算法所使用的分辨率(256256 或者 512512)提升到现在的图像传感器所采集的数据的高度，比如4K。同时在应用时对reference 时间的提升。受这篇文章的启发，可以考虑如何使用wavelet 变化将高分百年率图像实时的融合起来。比如Contourlet 变换，其中也是用到了LP来构建多尺度分解。但是Contourlet在高频分量，即图像的纹理和细节方面的保留能力更为突出。同时，文中提到，低频分量主要是和illumination 和color 相关，这表明，图像的弱光增强也主要是在图像的低频分量进行操作，因此可以采用Laplacian pyramid 或者wavelet 变换来实现Image Enhancement.

参考

https://zhuanlan.zhihu.com/p/367964010

Flutter开发App的未来及其在各行业的应用潜力分析

812 2022-11-23

High-Resolution Photorealistic Image Translation in Real-Time: A LPTN

如何提升企业数字化转型的效率与灵活性

app开发者平台在数字化时代的重要性与发展趋势解析

Flutter开发App的未来及其在各行业的应用潜力分析

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计