近日,上海交通大学团队在国际会议ICLR 2025上提出了一种创新的Token级缓存方案,名为ToCa(Token-wise Caching),这一方法使得扩散模型在图像和视频生成中加速超过2倍,且无需重新训练,极大地推动了视觉生成技术的应用前景。扩散模型(Diffusion Models)在生成高质量图像和视频方面表现出色,但其高昂的计算成本和推理速度一直是制约其实际应用的关键因素。为了降低这些 ...
凭借Toca技术的推出,我们期待拯救慢速推理的困境,推动视觉生成模型的实时应用及工业化进程。随着技术的不断演进,这种无损加速或许将为更多应用场景引入新的可能性,值得我们共同展望与探讨。详细论文与Github链接,欢迎点击阅读与留言互动!