ControlNet训练和微调自己数据集 Learn to train and fine-tune ControlNet with your own datasets using detailed guides and scripts on StudyingLover's blog. 2023-04-27 #文字生成图片
I3D笔记 I3D笔记 I3D是一个视频理解模型,采用双流网络的架构,他的核心贡献是提出了如何对2d网络进行膨胀操作,同时提出了一个新的数据集 Kinetics 工作回顾 image.png 在以前,视频理解有三种做法 1. LSTM 2. 3D ConvNets 3. Two-Stream Networks(双流网络) Two-Stream Inflated 3D ConvNets 这篇文章提出的模型被 2023-04-23
clip_interrogator教程 clip_interrogator教程 文字生成图片是近年来多模态和大模型研究的热门方向,openai提出的CLIP提供了一个方法建立起了图片和文字的联系,但是只能做到给定一张图片选择给定文本语义最相近的那一个,实际项目开发中我们总是需要从一张图片获取描述,感谢社区的活力,clip-interrogator应运而生。 受限于clip-interrogator 等于没有的文档,就有了这篇文章来写一些 2023-04-22 #文字生成图片
ControlNet代码改造计划 虽然现在webui已经支持了ControlNet,但是如果我们需要单独抽出来ControlNet做一些项目就需要对ControlNet进行改造。同时我也想加入一些开源的工具让ControlNet更加有趣,例如clip_interrogator. 关于什么是Canny,Hough,可以看北邮鲁鹏老师的课程计算机视觉(本科)北京邮电大学 鲁鹏 如果你想在webui使用ControlNet,可以看我之前 2023-04-21 #文字生成图片
Segment Anything笔记 Segment Anything笔记 Segment Anything project是一个用于图像分割的新任务、模型和数据集。在他刚出来的那一天,知乎等平台就已经高呼CV已死。为了这个项目,作者创建了迄今为止最大的分割数据集,1100万张在10亿次授权且尊重隐私的图像上的数据集。模型也被设计和训练成了promptable,就是说可以给他一些提示。作者在多个数据集测试了他的结果并认为结果令人满意。 2023-04-07 笔记 #多模态 #图像分割
Imagic笔记 Imagic笔记 先前的工作大多数方法目前仅限于以下一种:特定的编辑类型(例如,对象叠加,样式转换),合成生成的图像,或需要一个共同对象的多个输入图像。文章作者展示了将复杂的基于文本的语义编辑应用于单个真实图像的能力。与之前的工作相反,这篇文章提出的方法只需要一个输入图像和一个目标文本(所需的编辑)。它生成一个与输入图像和目标文本一致的文本嵌入,同时微调扩散模型以捕获特定于图像的外观。 扩散模型是 2023-03-29 笔记 #文字生成图片
UE,Unity和WebGL技术对比 UE,Unity和WebGL技术对比 随着科技的不断进步和数字化时代的到来,元宇宙(Metaverse)已经成为了人们对未来虚拟世界的向往和探索。构建一个具有真实感、互动性和无限可能性的元宇宙需要借助于强大的技术平台。UE(Unreal Engine)、Unity和WebGL作为当前最主流的数字娱乐和游戏开发引擎,被广泛应用于游戏、影视等领域。那么在构建元宇宙的过程中,这三种技术平台各自有什么优缺 2023-03-21 #ThreeJS #元宇宙
ControlNet笔记 ControlNet笔记 作者的代码开源在GitHub。 想要体验ControlNet看我的文章 介绍 作者在文章开头先对当前大型text-to-image model提出了疑问:这种基于提示的控制是否满足我们的需求?例如在图像处理中,考虑许多具有明确问题公式的长期任务,这些大型模型能否被应用于促进这些特定任务?我们应该建立什么样的框架来处理广泛的问题条件和用户控制?在特定任务中,大型模型能否保持 2023-03-20 笔记 #文字生成图片
通过colab体验ControlNet 通过colab体验ControlNet 跑通流程 首先,我们要会xxxx并且有一个Google账号。这是一句废话。 启动webui 访问https://colab.research.google.com/ 然后登陆自己的谷歌账号, 然后访问https://github.com/camenduru/stable-diffusion-webui-colab image.png 可以看到这里有很多的 2023-03-20 #文字生成图片