ControlNet笔记

ControlNet笔记作者的代码开源在GitHub。想要体验ControlNet看我的文章介绍作者在文章开头先对当前大型text-to-image model提出了疑问：这种基于提示的控制是否满足我们的需求？例如在图像处理中，考虑许多具有明确问题公式的长期任务，这些大型模型能否被应用于促进这些特定任务？我们应该建立什么样的框架来处理广泛的问题条件和用户控制？在特定任务中，大型模型能否保持

2023-03-20

笔记

#文字生成图片

通过colab体验ControlNet

通过colab体验ControlNet 跑通流程首先，我们要会xxxx并且有一个Google账号。这是一句废话。启动webui 访问https://colab.research.google.com/ 然后登陆自己的谷歌账号，然后访问https://github.com/camenduru/stable-diffusion-webui-colab image.png 可以看到这里有很多的

2023-03-20

#文字生成图片

Cascade EF-GAN笔记

Cascade EF-GAN Cascade EF-GAN可以更好地保留与身份相关的特征和细节，特别是在眼睛、鼻子和嘴巴周围，进一步帮助减少生成的面部图像中的伪影和模糊。模型架构作者设计了一种级联式网络，同原本对一张人脸做更改变成了对一张人脸和脸上几个部分同时做更改。因为对一个人类来说分辨一个人的方式就是看人的眼睛，鼻子和嘴巴。Cascade EF-GAN能够识别面部表情编辑中局部重点的重要性

2023-03-12

笔记

#文字生成图片

Everybody Dance Now笔记

Everybody Dance Now 为了完成给定一个人跳舞的视频到另一个人的目标，文章作者将这个过程分成三部：pose detection, global pose normalization, and mapping from normalized pose stick figures to the target subject pose detection 使用openpose对骨骼点进行

2023-03-11

笔记

#文字生成图片

从0开始写c语言课设

从0开始写c语言课设项目简述管理系统是C语言课设的经典项目，但是在chatGPT已经兴起的今天依然有不少同学因课设而困扰，本文将从0开始写一个简单的药店管理系统。项目开源于 GitHub flowchart TD; login-->read_from_file login-->encrypt-->login read_from_file-->*

2023-03-03

工具

#C语言

DALLE2笔记

DALLE2笔记 Abstract graph LR; 文本--CLIP模型-->文本特征; 文本特征--prior生成图像特征-->两阶段模型; 两阶段模型--decoder-->图像; 文本--ground truth-->两阶段模型; 基于扩散模型的解码器能够通过给定信息的解码器，生成很多不一样的图片，语义信息和风格比较接近，只是细节不一样。可以直接修改和编

2023-02-09

yolov5和yolov5-face环境搭建和常见踩坑

yolov5环境搭建在随便哪新建一个requirements.txt文件内容是 1234567891011121314151617181920212223242526272829303132333435363738394041424344# YOLOv5 requirements# Usage: pip install -r requirements.txt# Base -----------

2023-02-07

踩坑

#机器视觉

copliot才是代码开发神器

copliot才是代码开发神器本文使用copilot和chatGPT辅助完成 copilot是微软的AI代码生成器，可以帮助我们快速完成代码编写(这句copilot简介是copilot写的)。在openai的chatGPT出现后，copilot的风头有所下降，直到刚才…… 几分钟前我在写我的博客ThreeJS实现屏幕坐标转3d坐标时，原本的第一段代码是这样的： 12345678910111213

2023-02-04

工具

#Microsoft

ThreeJS实现屏幕坐标转3d坐标

ThreeJS实现屏幕坐标转3d坐标本文使用chatGPT辅助完成在虚拟世界中，3D坐标与屏幕坐标之间的转换是一个重要的问题。使用ThreeJS开发3D场景时，经常需要将屏幕坐标转换为3D坐标。在本文中，我们将介绍如何使用ThreeJS实现屏幕坐标转3D坐标的两种方法根据相机的投影矩阵和射线拾取在我的笔记摄像机模型中详细推导了相机的投影矩阵。在ThreeJS中，相机的投影矩阵是一个4x4

2023-02-04

工具

#ThreeJS

在fluid主题中加入Google广告

在fluid主题中加入Google广告在fluid的官方文档中，提供了在fluid主题中加入Google广告的方法，但是其中提到的参数data-ad-slot并没有说清怎么获取，所以我决定详细写一下如何获取。注册Google Adsense 访问Google Adsense，注册一个账号，然后点击右侧的广告。创建一个广告单元选择上方的按广告单元这里我选择了推荐的展示广告接着自定义

2023-01-27

踩坑