7 月 28 日,壹生检康(杭州)生命科技有限公司研发的「豆蔻妇科大模型」成功通过国家妇产科卫生高级职称(正高)笔试考试,成为国内首个由创业公司在钉钉企业专属 AI 平台上训练达到该专业标准的垂直医疗模型。这一突破性成果不仅标志着医疗垂直领域大模型研发实现关键跨越,更以鲜明的示范效应为行业提供了可复制的创新路径。
技术突破与高效研发路径
从技术攻坚到成果落地,豆蔻妇科大模型在短时间内便完成从无到优的研发训练,并达到专业资质标准。这一高效突破打破了「垂直领域大模型研发依赖高投入、长周期」的固有认知,证明中小型团队完全能在专业训练平台支持下,通过科学的训练方法、高质量的领域数据与聚焦式技术攻坚,快速打造出达到顶尖专业水平的专属大模型。
核心技术支援与训练方法
作为技术突破的核心支援,豆蔻妇科大模型以先进的基础模型为起点,依托钉钉企业专属 AI 平台和专业服务,通过高质量妇产科数据构建与多阶段优化训练方法实现性能跃升。
钉钉 CTO 朱鸿表示,豆蔻妇科大模型是钉钉 AI 平台上诞生的第一个专业垂类大模型,双方团队只经过短短一个多月的协作,就将模型准确率提升到了 90.2%,并成功通过专业考试。这验证了钉钉帮助千行万业企业打造专属大模型的能力。「钉钉正不断完善行业/企业大模型建设支援体系,打造 AI 大模型按效果付费的模式,帮助更多像壹生检康一样的行业企业真正落实 AI 应用。」朱鸿说。
豆蔻妇科大模型的研发过程中,壹生检康和钉钉采用了「精准标注的高质量医疗数据+定制化训练工具+高效训练流程及方法」的技术路径,使得豆蔻妇科大模型能够快速迭代,也显著提升了模型的准确性与稳定性,使其在复杂临床场景中表现出色。豆蔻妇科大模型从数据准备、预处理到性能不断优化过程中的实践,为医疗乃至更多行业打造专业专属大模型提供了可复制的参考案例。
考试标准与评测结果
国家妇产科卫生高级职称(正高)考试是衡量妇产科医生专业水准的金标准。该考试不仅涵盖女性生殖系统解剖学、临床妇产科学、生殖内分泌等 12 大核心学科知识,更着重考察复杂病例诊断、高难度手术方案设计等实战能力,要求应试者具备数十年临床积累的「临床直觉」。
本次笔试评测严格采用国家卫健委指定的人卫版《妇产科高级职称考试全真模拟卷》,考试范围覆盖临床妇产科学、妇科肿瘤、围产期医学、生殖内分泌、计划生育等 12 个核心学科,题型包含多选题(占比 40%)和案例分析题(占比 60%)两大题型。其中,案例分析题要求模型根据患者主诉、检查报告等多源信息,解决临床诊断、鉴别诊断、治疗方案等问题,全面考察临床决策能力,需要全部正确才能得分,评判标准高于人类实际考试标准。多选题正确率: 75.56%,案例分析题(不定项)正确率: 59.01% ,最终正确率: 64.94%,无论是多选题还是案例分析题正确率都要优于多个模型。为确保结果可靠性,团队采用三套独立试卷取平均分的验证方法进行验证。
(对比基于同份的考卷)
应用前景与行业影响
「通过正高考试,意味着该模型已具备主任级医师的专业判断力。」壹生检康创始人王强宇强调,「我的实践证明,中小企业也能训练出高精度的大模型。」不过,王强宇也表示,大模型不会取代妇产科医生。其核心价值体现在:为女性用户提供居家自诊断支持,实现「术前分流」与「院外健康管理」;针对无需就诊的情况提供科普指导与生活建议;为医疗、医美等行业机构提供专业支援,提升妇科服务质量,同时可通过机构的数据训练专科模型,让患者预问诊享受顶尖专家水平服务,提升医疗效率。
业内专家表示:「这一突破为 AI 在妇产科临床决策辅助、循证医学研究、患者健康教育、医学生学习考试等场景的深度应用开辟了新路径。」浙江大学医学院附属妇产科医院妇科周博士也对该模型给予了高度评价:「这一突破将为我们的工作带来极大便利,有助于提高诊断效率和准确性。」
随着技术的不断完善和推广,豆蔻妇科大模型不仅有望在更多医疗场景中发挥重要作用,还将进一步优化医疗资源配置,缓解优质妇科医疗资源分布不均的问题。未来,该模型还将与更多医疗机构合作,推动医疗行业的智能化、高效化发展,为更多女性患者带来福音。
We dedicated to serving clients with professional DingTalk solutions. If you'd like to learn more about DingTalk platform applications, feel free to contact our online customer service or email at

Bahasa Melayu
English
اللغة العربية
Bahasa Indonesia
ภาษาไทย
Tiếng Việt
简体中文