GPT-4V在美国医学执照考试（USMLE）上的研究结果令人瞩目

+AI动态 AI+文本/音频生成 ChatGPT 网站公告
23年11月24日
🍔喜好值+
编辑

HeeHel喜好儿官方小编

GPT-4V在美国医学执照考试（USMLE）上的研究结果令人瞩目

摘要如下：

GPT-4V在美国医学执照考试（USMLE）中展现了惊人的整体准确率，高达90.7%。
在处理图像问题时，GPT-4V的表现超越了许多医学生的水平。
当GPT-4V给出正确答案时，其解释几乎与领域专家相媲美。

研究人员采用GPT-4V对USMLE的问题进行了广泛测试，得出以下关键结果：

整体表现卓越： GPT-4V在USMLE中的整体准确率达到了惊人的90.7%，显著超过了ChatGPT（58.4%）和GPT-4（83.6%）。考虑到USMLE的难度和复杂性，这一结果显示了GPT-4V在医学知识领域的强大表现。
图像问题上的优异表现： GPT-4V在处理包含图像的问题时表现出色，其准确率分别为86.2%、73.1%和62.0%。这相当于AMBOSS医学生中的70至80百分位，凸显了GPT-4V在图像识别方面的卓越性能。
医学子领域的不同表现： GPT-4V在不同医学子领域表现差异明显。在免疫学和耳鼻喉科领域中，准确率达到了100%，而在解剖学和急诊医学领域则降至25%。这揭示了其在特定领域的潜在局限性。
错误回答的解释质量：当GPT-4V回答错误时，解释质量下降，包括18.2%的虚构文本、45.5%的推理错误和76.3%对图像理解的误差。这表明在错误情境下，模型的解释可能存在一定缺陷。
医生提示的影响：通过医生给予简短提示，GPT-4V的错误率平均降低了40.5%。对于更难的测试题，性能提升更为显著，强调了与专业人士协作对提升AI模型表现的重要性。

总体而言，这项研究显示了GPT-4V在医学知识测试中的强大潜力，为未来在医学教育和临床决策支持领域提供了有力的参考。

详细介绍网址链接：https://www.medrxiv.org/content/10.1101/2023.10.26.23297629v3
原论文网址链接：https://www.medrxiv.org/content/10.1101/2023.10.26.23297629v3.full.pdf

GPT-4V在美国医学执照考试（USMLE）上的研究结果令人瞩目

aigc ai技术 GPT-4V 准确率医学医学生水平医疗看病研究结果美国医学执照考试（USMLE）领域专家

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{data.mission.credit}}积分

今日签到

连续签到

TOP1

Comfyui工作流分享：一键实现两种高清修复工作流，图像清晰度提升或者图像细节提升【设计师学Ai】
6月6日
TOP2

Common Sense Machines（CSM）官方使用教程：2D转3D篇
3月7日
TOP3

AI Animation Tools：一个AI动画创意人员、工作室和客户的工具集成网站
3月30日
谷歌忙于手动删除自己搜索引擎中奇怪的人工智能答案
5月26日
【Padphone】大神测试stable video diffusion 1.1，制作AI史诗预告片【神灭】x湮灭
2月5日
【CyberWon】GPT-SoVITS-TTS2.3版本！AI语音合成，生产力拉满，一键拖动生成好的音频到音轨上，支持剪映和AU
4月15日
Luma AI推出神器Genie！通过文本生成高精度3D模型，免费使用！
1月11日
喜好儿AI周报Weekly（第6期）Midjourney V6巅峰更新| DomoAI | Meta雷朋眼镜 | DALL-E3 | 微软集成Suno | 反AI工具和反反AI工具 | Tonic | Midreal AI | 神采PromeAI | VideoPoet |
23年12月24日
ChronoDepth：从视频扩散先验中学习时间一致的视频深度
6月4日
王老吉 x 网易云课堂 x HCI讲堂联合举办——AI视觉大赛落下帷幕，得奖者已诞生，奖品居然有这些？！
1月24日
【玄离199】GitHub上的免费开源项目要怎么安装运行使用？一个视频教会你！
3月24日
外国博主评OpenAI新的 ChatGPT 模型击败所有其他 AI 模型 - GPT-4o 和实时聊天
5月14日

❯

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
联系客服
公众号

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部