这段视频主要介绍了五种实现反推提示词的方案,包括使用WD14节点、clip询问机节点、moondream视觉模型、ComfyUI-ollama节点和Gemini进行反推。同时,通过实例展示了不同方案的应用效果,并指出了各自的优缺点。
- 第一种方案:WD14节点
使用简单,但只能识别图片中的主体元素,无法识别主体之间的逻辑关系。 - 第二种方案:clip询问机节点
反推出来的提示词以句子的形式呈现,具有逻辑关系,但对图片风格的识别表现不佳。 - 第三种方案:moondream视觉模型
可以详细的描述图片中的内容,但反推出来的提示词仍然是句子形式,具有逻辑关系。 - 第四种方案:ComfyUI-ollama节点
反推出来的提示词是一篇小作文,描述非常详细,但生成的图片与原图相比有些许差距。 - 第五种方案:Gemini
反推出来的提示词较多,但与CONFEUI欧拉马相比仍有所不及,且需要魔法访问
AIGC专区:
https://heehel.com/category/aigc
教程专区:
https://heehel.com/category/ai-tutorial
最后,指出根据反推出来的提示词生成的图片与原图的相似度是评估方案优劣的关键,而不是提示词的详细程度。