基于 Gradio + Groq 的多模态 AI 应用开发

通过 Gradio 提供的界面实现语音→文字→LLM 响应的完整流程,多模态交互,轻松实现语音、图像、文字三合一的智能体验!
项目地址:https://github.com/bklieger-groq/gradio-groq-b
核心功能:
语音转文字(Whisper 模型)
图像理解(Llama-3.2-vision 模型)
文字对话(ChatGPT 等模型)
来自 @BenjaminKlieger 项目展示!

群主 管理员

热门评论
:
该帖子评论已关闭
图片审查中...
编辑答案: 我的回答: 最多上传一张图片和一个附件
x
x
今日签到
有新私信 私信列表
搜索