Paper Reading: MaskGIT: Masked Generative Image Transformer

Skirrey

16

文章

0

说说

11

ssk52839916[AT]gmail.com

Skirrey

今天天气真好

近期文章

近期评论

Skirrey on 换新电脑啦
猪崽 on 换新电脑啦
CC on Applied Stochastic Differential Equations 抄书
Skirrey on 520buff!!
CC老公 on 大哥抽代

当前位置：

首页 > Computer Vision > Generative Model > Paper Reading: MaskGIT: Masked Generative Image Transformer

Skirrey

3 years前 • 46 • 0 •

Paper Reading: MaskGIT: Masked Generative Image Transformer

正文索引 [隐藏]

Conflicts
Tricks

Conflicts

Transformer拿来作为自回归模型在预测序列信息时是没有太大问题的，但是图像token化后也并不能完全被当做序列信息来看待，那么一个token一个token地迭代太慢了，需要加速。这篇文章就给出了一个simple的加速策略：一批一批地生成。

Tricks

示意图如下

每次生成一批的话则有两个关键的问题

分几步迭代？每一步迭代多少个？
根据Transformer的性质每次都会出所有token，那么保留哪些呢？

这篇文章的回答是：

分T步，每一步的迭代个数可以用一个所谓的Mask Scheduling Function $\gamma (\frac{t}{T})$来实现
当我们采样好每个预测的token之后，它被选择保留下来的”confidence” score直接沿用他被预测的概率，选择那些”confidence” score高的token 保留下来固定，剩下的继续迭代。

paper链接link

Generative Model, Paper Reading

打赏

请作者吃个鸡腿！

Skirrey's Blog

Skirrey

近期文章

近期评论

Paper Reading: MaskGIT: Masked Generative Image Transformer

Conflicts

Tricks

扫一扫支付

评论放弃治疗

归档

分类

标签云

近期文章

近期评论

Paper Reading: MaskGIT: Masked Generative Image Transformer

Conflicts

Tricks

扫一扫支付

评论 放弃治疗

归档

分类

评论放弃治疗