vqvae出自[1711.00937] Neural Discrete Representation Learning,用于无监督学习离散表征,目前在多模态生成领域还有使用. 这里学习一下代码
文生图相关模型最新进展小结
发表于 更新于
本文字数: 4.2k 阅读时长 ≈ 4 分钟
本文字数: 4.2k 阅读时长 ≈ 4 分钟
在较早的VAE和GAN时代,通过图形生成模型,可能出现模式坍塌(个人理解就是生成图像多样性不足)并且只有图像数据参与,在之后的diffusion时代(包括现在),有了多模态的加入,通过文本、深度图以及骨骼图(e.g.ControlNet)控制图像生成有了更高的自由度和创造性.此外有了类似LoRA,IP-Adapter等等技术提供了更好的微调方式用于在更新模型权重保持良好的风格迁移(比如原本模型训练集中没有的人物,在微调时增加新人物训练能有良好表现)或人物一致性(不同的角色不至于长得一样)
而在最近有了更多在一些较大模型(stable diffusionv3,novelai,sdxl等)上微调的模型,它们更加专注于某种画风。此外本文尝试总结目前文生图、艺术图片等生成式AI应用,最后从图片展望生成式视频创作。相对于论文、原理,这里更注重模型与应用。
c++17中的新东西
发表于 更新于
本文字数: 488 阅读时长 ≈ 1 分钟
本文字数: 488 阅读时长 ≈ 1 分钟
c++的几个重点版本,c++11,c++17,c++20都是有必要去了解的. c++11是现代c++的基石,c++20有了更现代的东西,而c++17承前启后,多了许多现代c++常用但又常忽略的东西,这里简单介绍一些.
现代C++中的异常处理
发表于 更新于
本文字数: 7k 阅读时长 ≈ 6 分钟
本文字数: 7k 阅读时长 ≈ 6 分钟
处理异常和错误是现代编程中的重要一环,许多框架中都有一些API会返回错误以供处理. 在现代c++中,也有专门用于处理的方法
现代化的浏览器可重用元素:web component
发表于
本文字数: 9.9k 阅读时长 ≈ 9 分钟
本文字数: 9.9k 阅读时长 ≈ 9 分钟
Web components 是用于创建独立组件的一组标准:自定义 HTML 元素,它们具有自己的属性和方法,封装好的 DOM 和样式。