简介
混元-DiT:高性能细粒度中文理解,多分辨率扩散Transformer模型。它是一种文本到图像的扩散转换器,可以对英语和中文进行细粒度的理解。设计了变压器结构、文本编码器和位置编码。Hunyuan-DiT 在中文到图像生成方面树立了新的最先进水平。
模型下载链接👇
模型列表(持续更新,建议收藏)
HunyuanDiT-v1.2.safetensors
HunyuanDiT-v1-2_sdxl-vae-fp16-fix.safetensors
dialoggen对话生成器
dialoggen_00003-of-00004.safetensors
dialoggen_00004-of-00004.safetensors
openai_clip-vit-large-patch14-336_model.bin
openai_clip-vit-large-patch14-336_tf_model.h5
混元ComfyUI工作流预设下载👇
效果预览