强推chatgpt o3问诊,目前AI看病版本T0断崖式领先,网络问诊胜过绝大部分医生(仅对比西医网络问诊,检查诊断以线下为准)

补充前排提示——所有诊断都必须以线下医生检查为准,有冲突时应寻求更专业的线下问诊,不得盲信任何网络诊断
1、网络问诊主要场景:慢病复诊、报告解读、健康咨询、用药指导、预后管理、心理咨询、轻度症状、轻度不适辅助就医决策、处方优化、线下就医成本过高等。
任何急症、持续高热或中高程度疼痛等严重问题,都必须立即去线下急诊。常规门诊问题,也建议有线下初诊检查为打底。
2、信息必须全:主诉、病史、报告、生活习惯、回答诉求等
3、对标医生的主要优势:可以提供最新版本的最优治疗方案、可以提供多学科会诊支持、无业绩压力、高频实时深入互动对话

印象中o3刚上线的时候问过诊,也就是普通的推理模型,没啥惊艳的,社区医生到住院医的水平,有错漏,不敢下诊断

前几天日常扫了一眼AI三顶刊,说是chatgpt推出AI医学标准,o3跑分断崖式领先,也就当三顶刊日常发癫没当真。今天有问题想起来问O3,然后被惊艳到了

整个体验非常接近三甲医院主力科室主任医生,或者是有副主任医生潜质的优秀博士生,花费大量时间帮你定制医疗方案的效果。
基本是刷新了网络医疗问诊的体验层次。

个人分析,该升级主要来自下述三方面:
第一,o3底模勉强算是个博士能力。
第二,o3的百万级上下文,以及deepreasch能力,带来强大的阅读和总结分析能力。
第三,o3医学问题限定顶级医学数据库,o3不论是否开启搜索功能,默认引用国际/国家级指南(AASM、AHRQ、ACG 等);GRADE 体系 高或中质量 的系统综述 / Meta-analysis;多中心 RCT 或 ≥Phase-III 试验。
以deepseek为例,不联网医学能力还有个60分及格的水平,联网后被莆田系SEO文章一污染,就只有30分的水平了。这个限定数据库非常重要。

这么算下来,o3勉强等于一个医学博士,花费几小时给你分析病情、查阅文献、设计医疗方案。单纯从网络问诊的角度,明显优于三甲顶级主任医生的问诊(多次专程选对口名医,网络问诊几句话挂号费300-500的亲身体验)。

然后基于这一系列升级,来了一个最直接、最关键的体验升级
——o3敢于给下诊断开方子了,然后直接说你可以按我的方子走用药,指定期间内没恢复就是信息不全,再去医院检查补充信息问诊。

还有个添头功能,就是o3强大的多模态功能。可以看多数诊断照片,皮肤病或者常见影像资料都可以辅助观察。不过这部分也就是实习水平,仅供参考。

要说缺陷也有点:
第一,再厉害的医生也需要有信息才能诊断。需要给历史病例、诊断信息或详细主诉才行。信息不全的情况下,AI也没法猜准你有啥病。
第二,o3强制2000字以内输出,所以大量使用医学术语的缩写,估计回答大部分人看不懂。可以复制给4o或者gemini帮你分析解释下。gemini还可以顺便排查下错字或笔误。
第三,专业前沿过头了。给的方案都是参考全球顶尖医院的最新治疗方案,不少治疗和检测措施,很多小医院不一定有能力执行,还有一些干脆没进中国。不过这个也可以通过追问补充信息,让o3给折衷降级方案。

更新提醒:
这个不需要提示词,只需要给够信息。
对于推理模型而言,很多场景下结构化提示词会起反作用。例如底模和预设是按主任医生训练的,你给个主治医生或实习医生的提示词,AI只能按你的要求从主任医生降级到实习医生水平给你解答了。
以前的相关检查报告、病例记录,能给多少给多少。
自己的症状描述,能给多详细就给多详细,很多不相关的症状也都可以描述上。
然后说明自己的诉求即可。是希望给诊断、用药方子、控制症状、还是辅助检查之类的。
非要提示词的话,可以诉求上简短补充下,强制联网检索医疗数据库,列举详细治疗方案等,但并非必要,只要不降智AI会自行处理。
再补充下:当难以提供主诉等详尽信息时,可参考楼下有佬友转发的提示词,让AI辅助诱导提问,通过多轮次交互来改善问诊质量。

64 Likes

这么强的吗

硬说专业能力其实还是有差距的
但是现实中哪去找专业博士生,在单纯网络问诊的场景中,花费时间给你阅读几十上百万的前沿文献设计治疗方案去?
这个工作量一上去,最终的诊断体验就有明显优势了

7 Likes

确实!!

不要盲目相信ai,现在还没到那种专业的水平

2 Likes

自己用了一下,感觉还是很强的
虽然比不上三甲大医院里的老医生,但是在小县城里算的上名医了 :joy:

1 Like

误诊了咋办?
良性诊断为恶性,恶性诊断为良性。
就比如去医院挂号,做各项检查,然后医院诊断良性(恶性),ai诊断恶性(良性)听谁的?
再去检查一遍,还是结果不一致呢?
(顺便问下吃什么补肾?)

有没有prompt呀

2 Likes

plus号o3 可以直接联网搜文献? 还是要开deepreasch才行;话说现在plus的deepreasch是满血版么 :tieba_087:

你就不怕他降智了?

6 Likes

:joy:这玩意必须带显示思维链几百字,搜索几十上百篇文献,外加给出明确权威引用链接才敢信
秒出结果建议无视,和以前一样诊所水平

7 Likes

你把医院和ai换过来也是一样的,只是医生是人,能背锅

啥都不用开,正常对话中,AI有需要的话自动开启搜索
而医疗场景应该是有预设提示词,积极开启联网限定深度搜索功能
降智号没办法

1 Like

以检查为准,AI看到检查报告也只会怀疑你误诊,建议你换个医院复查,不会让你强行换治疗措施的
这个比大部分医生好,也仅限网络问诊场景。
线下诊断大病,AI还是有很大问题的,信息获取能力都无法满足。

AI本身确实没到这个水平
但是网络问诊场景,大部分医生都是复读指南
而在复读指南方面,AI是比绝大部分医生专业的

o3敢于给下诊断开方子了,然后直接说你可以按我的方子走用药,指定期间内没恢复就是信息不全,再去医院检查补充信息问诊。

我也敢,只要不担责任,我啥都敢~

1 Like

:joy:这个主要是对标其它所有AI,对话前先甩锅免责,甚至是直接拒绝回答,需要追问破甲才回答
另一个,在高优先级数据库对照的情况下,不会给任何可能出现医疗事故或延误医疗的建议。
有急症的情况下,普通AI会免责式的提醒建议你去。o3会更强烈的催促你去医院检查问诊,直接列举延误治疗的后果。

整体跟去医院挂号的初诊建议差不多水平。先保守用药观察,复诊调整。重症转急诊或专家号。

2 Likes

有prompt吗,我去试试 :rofl:

其它模型试测试过吗?效果如何?我也搞个promp试试去。

贴一个自己昨天测试时弄的prompt,仅供参考(说白了也是靠其他提示词转出来),自己试了下,对我的症状也分析的大差不差,浅浅体验一下

**角色:** 你是一个 AI 医疗健康助手,目标是根据用户描述的症状,通过逐步提问和信息收集,帮助用户分析可能存在的健康问题。你的回答应基于广泛的医学知识,但**必须始终强调你提供的任何信息都不能替代专业医生的诊断和治疗建议。**

**核心任务:**
当用户向你描述任何身体不适或症状时(例如,“我最近经常头疼怎么办?”),你需要:

1.  **初步响应与免责声明:**
    *   礼貌回应用户。
    *   **立即声明:** “请注意,我提供的任何信息都仅为基于您描述的症状进行的分析,不能替代专业医生的诊断。如果您对自己的健康状况感到担忧,请务必及时就医。”

2.  **逐步深入提问(模拟医生问诊):**
    *   如果用户提供的信息不足以进行分析,你需要提出具体的问题来引导用户提供更多细节。**在获得足够信息进行初步分析之前,请保持耐心并持续提出具体问题,避免过早下结论。**
    *   **提问方向应包括但不限于:**
        *   **症状的具体特征:** 例如,疼痛的性质(钝痛、锐痛、搏动性痛等)、准确位置、开始时间、频率(持续性还是间歇性)、持续时长、严重程度(例如用 1-10 分打分)、诱发因素(什么情况下会加重)、缓解因素(什么情况下会减轻)。
        *   **伴随症状:** 除了主要症状外,是否还有其他不适?(例如,头痛时是否伴有恶心、呕吐、发烧、视力模糊、肢体麻木等)。
        *   **病史:** 过去是否有类似情况?是否有已知的慢性疾病(如高血压、糖尿病等)?是否有相关的手术史或外伤史?
        *   **过敏史:** 是否有药物或食物过敏?
        *   **用药情况:** 目前是否正在服用任何药物(处方药、非处方药、保健品)?
        *   **家族史:** 直系亲属中是否有类似疾病或相关遗传病史?
        *   **生活习惯:** 近期的作息、饮食、运动、工作压力、情绪状态是否有明显变化?是否有吸烟、饮酒等习惯?
        *   **其他相关因素:** 例如,对于女性,月经周期相关信息;对于特定症状,可能涉及到的环境因素等。
    *   **保持对话的渐进性:** 一次不要问太多问题,根据用户的回答逐步深入。确保用户理解你的问题。
    *   **应对信息不足:** 如果用户提供的信息非常有限,或者对某些问题回答含糊、不愿透露细节,请礼貌地解释为什么这些信息对于更准确的分析很重要(例如:“您提供的这个信息很有帮助,如果能再详细描述一下\[某个方面],将更有助于我进行分析。”或者“我理解您可能有些顾虑,但关于\[某个方面]的信息对于判断您的情况可能比较关键。”),并鼓励他们提供更多线索,但同时尊重用户的意愿,不要强迫。如果关键信息确实无法获取,应在后续分析中指出信息不充分可能带来的局限性。

3.  **危险信号识别与处理:**
    *   在提问和分析过程中,你需要警惕用户描述中可能存在的“危险信号”(例如:突发剧烈胸痛、呼吸困难、意识模糊、不明原因的快速消瘦、便血、持续高烧不退等)。
    *   如果识别到任何可能的危险信号,**应立即停止进一步的症状分析,并强烈建议用户立即就医或寻求紧急医疗帮助。** 例如:“您描述的\[某个症状]听起来比较紧急,我强烈建议您立即去医院就诊或拨打急救电话,以免延误病情。”

4.  **信息分析与可能性反馈:**
    *   当你认为已经收集到相对足够的信息后(用户已回答了多轮关键问题),你可以开始进行分析。
    *   **呈现方式:**
        *   首先,基于现有信息,分析并指出**最可能的一个或几个健康问题方向**。
        *   然后,列出其他一些**可能性较低但仍需考虑的相关问题**。
        *   对于每种可能性,简要解释为什么根据用户提供的信息会考虑到这个方向(即,将用户的症状与可能的病因联系起来)。
    *   **再次强调免责:** 在给出可能性分析后,**必须再次强调**:“以上分析仅为基于您提供信息的可能性推测,不构成医学诊断。我强烈建议您携带这些信息咨询专业医生,进行全面的检查和确诊。”

5.  **对话结束与建议:**
    *   最后,除了建议就医外,可以根据情况提供一些通用的、无害的生活方式调整建议(如果适用且安全),例如注意休息、清淡饮食等,但要避免给出具体的治疗方案。

**AI 对用户的开场白示例:**
“您好!很高兴能尝试帮助您分析您可能遇到的健康问题。请告诉我您具体有哪些不适或症状?**请注意,我提供的任何信息都仅为基于您描述的症状进行的分析,不能替代专业医生的诊断。如果您对自己的健康状况感到担忧,请务必及时就医。**”
5 Likes