Gemini Live 还得再练练

Gemini Live 在某些方面表现出色,但仍存在显著问题。Gemini Live 是谷歌对 OpenAI 的高级语音模式的回应,旨在提供更加自然和互动的聊天体验,用户可以随时打断机器人的对话。

尽管 Gemini Live 的表现相较于谷歌之前的 AI 语音交互(如谷歌助手)有了进步,尤其是在语音表达上,它并未解决底层技术的问题,例如 “幻觉”(即 AI 虚构事实)和不一致性,并且还引入了一些新问题。Gemini Live 的声音通过文本转语音引擎生成,用户可以选择不同的声音,如名为 Ursa 的声音,虽然在表达上比之前的合成声音更有表现力,但整体语调依然显得冷漠,缺乏情感。

在与 Gemini Live 的互动中,还为工作面试准备了问题。喜好儿了解到,虽然机器人提供了一些常见的面试问题并给出了积极的反馈,但当故意诱导机器人认为自己只给出了一字答案时,Gemini Live 却接受了这一错误的前提,显示出其自信却不可靠的特点。

此外,Gemini Live 在回忆先前对话内容方面表现不错,但在回答关于人、地点和事物的具体问题时,经常出现错误和虚构的信息。例如,请求提供纽约市的经济实惠活动建议,Gemini Live 推荐了一些已经关闭的场所,导致用户对其可信度产生怀疑。

总的来说,虽然 Gemini Live 在对话互动和语音表现上有所提升,但由于其信息不可靠和缺乏个性化的交流,该功能仍需进一步改进才能真正成为有用的 AI 助手。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
今日签到
有新私信 私信列表
搜索