展示一下玩儿半个月后的成果:
最新更新:
发现对于大分辨率图片,7G的animefull-latest未剪枝模型比naifu中使用4G剪枝模型效果更好!主要区别是7G模型的细部线条更合理,色调更饱满,而且消除了4G模型产生的格子状噪点!下图是个很好的例子:两张图使用的参数是完全一样的,只有模型不同
从b站上www.bilibili.com/video/BV1EV4y1L7dX下了一个包试了试:
试用体验:AI在这方面的进步比想象的要大。怎么写tag至关重要,调参也要讲技巧。细节确实有问题,残次品不少,需要人工筛选和修改。
补充:对于tag,重要的是认识到这一点:novelAI并非将没写入输入框的tag视为可有可无的,而实际上是——没写的tag元素都不能有。所以,如果我们需要一个元素,而且这个元素拥有一个比较常见的tag,那么就一定要写进去,不然AI就会刻意压低那个没写的tag的概率。这一点实际上也是生成的内容的雷同度高的一个重要原因。
更新点自己跑出来的图:
咒语fog, knight, sword, dragon, mountain, cloud, castle, moon
咒语fog, knight, sword, dragon, mountain, cloud
咒语masterpiece, best quality, sea, tree, mountain, island, cloud
咒语star, cliff
咒语star, cliff
依然是star, cliff
咒语sing, dance, rap, basketball
咒语city, night, water, piano, tank, radar, mushroom, computer, bottle, ball, hat 其实是乱写的
咒语city, night, water, tank, radar, mushroom, computer, bottle, ball, hat, cat, doll, disk, candy
咒语night, water, tank, radar, mushroom, computer, bottle, ball, hat, cat, doll, disk, candy
咒语cheese, fish
下面试了一组以图生图的,图片未做筛选,所有生成的都放出来了。
原图:
NovelAI生成:strength0.7 noise 0.2 使用tag为:boy, back
左手变态发育了。突然变成妹子。
突然穿上丝袜。
这个背景挺漂亮背带变成了分屏线。背带终于有了,但只有一条。
又试了一组纯文本生成的,可以看出AI确实不讲逻辑:
tag为piano, girl, concert
虚空弹琴。坐在钢琴里。奇怪的构造。这个还行。每人三条腿。hhhhh这个还ok钢琴画出吧台的感觉。这是斯坦威豪华加长巨型三角吗?
用3090显卡生成1024*512的图片用了20G显存,一张图片耗时13秒。