SIGGRAPH2022 | Text2Human 玩的是真花呀-FinClip官网

SIGGRAPH2022 | Text2Human 玩的是真花呀

网友投稿 976 2022-11-23

SIGGRAPH2022 | Text2Human 玩的是真花呀

今天来玩一个 Text2Human 仅通过提供关于性别和衣服的文字描述来生成一个人的图像。

代码：Text-Driven Controllable Human Image Generation

视频demo：

摘要

生成高质量和多样化的人类图像是视觉和图形中一项重要但具有挑战性的任务。然而，现有的生成模型往往在服装形状和纹理的高度多样性下达不到要求。此外，甚至希望生成过程对于外行用户来说是直观可控的。在这项工作中，我们提出了一个文本驱动的可控框架 Text2Human，用于高质量和多样化的人类一代。我们从给定的人体姿势开始通过两个专用步骤合成全身人体图像。 1）对于一些描述衣服形状的文本，首先将给定的人体姿势转换为人体解析图。2）然后通过为系统提供更多关于衣服纹理的属性来生成最终的人体图像。具体来说，为了对服装纹理的多样性进行建模，我们构建了一个分层纹理感知码本，用于存储每种纹理的多尺度神经表示。粗略级别的码本包括纹理的结构表示，而精细级别的码本侧重于纹理的细节。为了利用学习到的分层码本来合成所需的图像，首先使用混合专家的基于扩散的变换器采样器从码本的最粗略级别采样索引，然后用于预测更精细级别的码本索引。解码器将不同级别的预测索引转换为人类图像，并结合分层码本进行学习。混合专家的使用允许生成以细粒度文本输入为条件的图像。对更精细级别指数的预测改进了服装纹理的质量。广泛的定量和定性评估表明，与最先进的方法相比，我们提出的 Text2Human 框架可以生成更加多样化和逼真的人类图像。

Raw Dataset

DeepFashion-MultiModal，具有丰富多模态标注的大规模高质量人体数据集。它具有以下属性：

高分辨率人体照片共44096张，全身12701张每个完整的人体图片手动标注了 24 个类别的人类解析标签仔细标注每个完整身体图像的关键点对于每张人类图片，我们提取 DensePose每个图像都用服装形状和纹理属性手动标记对于每张照片，都包含文字说明

Dataset pre-processing

以下组件构成了预处理pipeline：

根据人体姿势将人体对齐到在图像中心将衣服颜色和面料标注组合成一个纹理标注整理标注，并应用一些图像过滤将整个数据集分为两组：训练和测试

模型训练

在模型训练期间，从训练解析生成网络开始。然后，训练分层 VQ-VAE 的顶层。（VQ-VAE是Vector Quantized Variational Autoencoder。VQ-VAE是在Neural Discrete Representation Learning中提出的）

，作者还提供了 UI 界面，仅需要对衣服和纹理进行描述即可生成最终的结果。

另外 huggingface 也提供了一个在线demo：https://huggingface.co/spaces/hysts/Text2Human

下面是我测试的结果

目前还没有太摸清这些描述词如何设置才能生成比较理想的结果，试了几个好像并不是非常完美，大家感兴趣可以去试试哈

今天的分享就到这里，大家喜欢的话，可以多多支持，感谢！

微前端架构如何改变企业的开发模式与效率提升

976 2022-11-23

SIGGRAPH2022 | Text2Human 玩的是真花呀

微前端架构如何改变企业的开发模式与效率提升

轻量级前端框架助力开发者提升项目效率与性能

前端开源框架如何提升开发效率与用户体验的关键因素

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计