您当前的位置：首页 >> 园区 > >>

ChatGPT通过美放射学委员会考试

来源: 科技日报时间：2023-05-18 06:07:05

(相关资料图)

科技日报北京5月17日电（记者刘霞）加拿大科学家在16日出版的《放射学》杂志上刊登新论文称，最新版本的ChatGPT通过了美国放射学委员会的考试，突出了大型语言模型的潜力，但它也给出了一些错误答案，表明人们仍需对其提供的答案进行核查。

为评估ChatGPT在美国放射学委员会考试问题上的表现并探索其优势和局限性，多伦多大学研究人员首先测试了基于GPT-3.5的ChatGPT的表现。研究团队使用了150道选择题，这些选择题与加拿大皇家学院和美国放射学委员会考试的风格、内容和难度相当。这些问题不包括图像，分为低阶（知识回忆、基本理解）和高阶（应用、分析、综合）思维问题。高阶思维问题可进一步细分为影像学表现描述、临床管理、计算和分类、疾病关联。

研究人员发现，基于GPT-3.5的ChatGPT的正确率为69%，接近70%的及格线。该模型在低阶思维问题上表现相对较好，正确率为84%，但回答高级思维问题时表现不佳，正确率仅为60%。而性能更优异的GPT-4的正确率为81%，且在高阶思维问题上的正确率为81%，远好于GPT-3.5。但GPT-4在低阶思维问题上的正确率仅为80%，答错了12道题，而GPT-3.5全部答对了这些题目，这引发了研究团队对GPT-4收集信息的可靠性的担忧。

这两项研究都表明，ChatGPT会有提供不正确答案的倾向，如果仅仅依靠它获取信息，非常危险，因为人们可能意识不到其给出的答案是不准确的，这是它目前面临的最大的问题。（来源：科技日报）

标签：

上一篇：叮当健康（09886.HK）：5月17日南向资金减持79.05万股

下一篇：最后一页

为您推荐

ChatGPT通过美放射学委员会考试 2023-05-18
叮当健康（09886.HK）：5月17日南向资金减持79.05万股 2023-05-18
suffering是什么意思_suffering 2023-05-18
男士秋冬季服装搭配_男士冬季服装搭配 2023-05-17
为什么买白色车的人越来越多 2023-05-17

疑因挂错号怀孕女儿怒扇母亲，工作人员拉架也被打：妈妈先动手环球快消息

5月15日，山西运城。运城中心医院妇产科就诊等待区，一女子用手扇打母亲头部多达12下，保安劝阻仍不停手。

来源：时间：2023-05-17
茶叶受潮了怎么处理_电视机受潮怎么处理_全球视点

1、如果旧电视长时间不用，或者近期是雨季，那么就要注意电视可能受潮的问题了。如果电视没有受到湿气的严

来源：时间：2023-05-17
梭鱼湾足球场将迎来国足赛事

缅甸足协5月16日宣布，缅甸队将于6月16日与中国队进行一场友谊赛。据了解，国足6月份的集训已选定在大连进

来源：时间：2023-05-17
qq发不了图片和语音怎么回事 QQ发不了图片今日热文

今天来聊聊关于qq发不了图片和语音怎么回事，QQ发不了图片的文章，现在就为大家来简单介绍下qq发不了图片和

来源：时间：2023-05-17
2023深圳社保缴费基数是多少？深圳社保一二三档每月交多少钱？

2023深圳社保缴费基数最低是多少？2023深圳一二三档社保交多少钱？下面跟社保网小编一起来看看2023深圳社保

来源：时间：2023-05-17

疑因挂错号怀孕女儿怒扇母亲，工作人员拉架也被打：妈妈先动手环球快消息

茶叶受潮了怎么处理_电视机受潮怎么处理_全球视点

梭鱼湾足球场将迎来国足赛事

qq发不了图片和语音怎么回事 QQ发不了图片今日热文

2023深圳社保缴费基数是多少？深圳社保一二三档每月交多少钱？

头条

业界

动态

科教排行