提出了一个基于离散余弦变换(DCT)的图像生成模型。DCTdiff通过在DCT空间中训练扩散模型,利用频率域的优势提高了图像的生成质量和效率。
笔记2
Here's something encrypted, password is required to continue reading.
Wavelets are all you need
这篇论文提出了一种新的自回归图像生成方法,主要基于两个关键要素。第一个是小波图像编码,通过从粗到细的顺序对图像的视觉细节进行标记,首先处理最显著的小波系数的最显著位。第二个是语言模型转换器的变体,其架构经过重新设计和优化,以适应这种“小波语言”中的标记序列。该转换器学习标记序列中的显著统计关联,这些关联反映了不同分辨率下小波子带之间的已知关联。论文还展示了在生成过程中进行条件化的实验结果。
笔记1
笔记1
RoFormer
Roformer Enhanced Transformer With Rotary Position Embedding 论文阅读笔记
VAR
通过预测下一尺度的自回归来生成图像
机器学习期末复习
逢考必过
Randomized_AR & RandAR
对比两篇随机自回归图像生成模型论文
WaLa
Wala (Wavelet Latent Diffusion) 是一种结合小波编码和扩散模型的3D生成模型,通过压缩潜在空间来显著减少计算成本,同时保持高质量的生成效果。
car
关于CAR和ControlVAR的实验结果记录和论文阅读记录