当前位置:首页 >风集独 >国内首个医疗专科推理数据集开源,蚂蚁百灵大模型助力行业落地

国内首个医疗专科推理数据集开源,蚂蚁百灵大模型助力行业落地


12月28日,国内由信通院主办的医疗源蚂蚁百“虹桥之源”大模型驱动数字经济新生态峰会在上海召开。会上,专科助力蚂蚁集团商业机器智能部总经理顾进杰介绍蚂蚁正式开源国内首个医疗专科推理信息集,推理这将有助于提升大模型在医疗领域的信息行业专业性。 国内首个医疗专科推理信息集开源,集开蚂蚁百灵大模型助力行业落地蚂蚁集团商业机器智能部总经理顾进杰介绍国内首个医疗专科推理信息集

在医疗行业,通用型语言模型在应对医疗问诊时,模型会直接给出答案,国内而医生则会根据专业知识进行反复的医疗源蚂蚁百症状探讨,才能给出答案。专科助力另外,推理大模型的信息行业幻觉问题和推理能力不足,当前高质量的集开中文医学专科信息集又较为稀缺,这对训练出色的灵大落地医疗领域大模型提出了挑战。

为克服这些难题,蚂蚁集团与上海仁济诊所泌尿科专家团队联合研发,基于医生团队临床经验,通过构造模拟病例信息的方式,推出了首个中文医疗专科问答推理信息集RJUA-QA,这也是业内首个临床专科信息集。

信息集由训练、验证、测试三部分组成,包含2132个问答对,每个问答对由医生根据临床经验编写的问题、专家提供的回答以及用于帮助推理的上下文构成,病种覆盖了97.6%以上的泌尿科就医人群,能真实复刻诊疗场景。信息集能提高大模型在医疗鉴别推理方面的能力,并作为在严肃可控场景下应用的评测基准。

顾进杰进一步介绍了蚂蚁百灵大模型在医疗领域的工艺进展。“专业性、可控性、轻量化是大模型工艺在医疗行业落地的三个关键挑战和机会。”顾进杰说道。

专业性上,由于医疗行业有超百个科室,每个专科和病症,都需要专业的调试。蚂蚁集团联合医疗专家共同研发了多模态医疗知识引擎,进一步推动中国专业医疗信息集的构建与开放。

在可控性方面,百灵大模型结合知识图谱工艺,让大模型的每一个回答都有据可依。“生成内容可以满足不同诊所、不同科目的定制需求,包括风格与调性等”,顾进杰说。蚂蚁集团在超大规模图学习和知识图谱工艺长期积累,今年联合OpenKG发布的OpenSPG开源项目,重新定义了工业界的知识图谱语义架构,知识检索增强工艺也是大幅提升大模型正确性与可控性的关键课题。

医疗行业有信息隐私、专业知识和系统自主性的需求,考虑到机构的算力成本与便捷部署,百灵大模型还攻坚了轻量化工艺。在12月份开源的模型轻量化框架(PIA)中,集成了模型剪枝、压缩、量化、推理加速等全链路环节的优化,具备开箱即用、功能无损、低代码接入等优点,可在天级别完成10倍以上压缩比。

据雷峰网(公众号:雷峰网)了解,目前,蚂蚁百灵大模型在中英文的医疗考试以及基准测试达到或超过了GPT4水准,例如,在中文医疗LLM评测榜单promptCBLUE上,取得A榜第一,B榜第二的成绩;在国际医疗问答榜单PubMedQA中,以80.6%的准确率取得了前五的成绩,而且是前十中参数量最小的模型,更适合被机构部署和使用。


雷峰网原创文章,未经授权禁止转载。详情见转载须知。

国内首个医疗专科推理信息集开源,蚂蚁百灵大模型助力行业落地

(责任编辑:短料)

    推荐文章
    • 埋头钻研一年后,阶跃星辰交出了第一份答卷

      埋头钻研一年后,阶跃星辰交出了第一份答卷历经去年持续一年之久的百模大战后,今年伊始,落地应用开始成为大模型的主流叙事方式。本以为,在月之暗面、智谱、MiniMax、百川、零一万物等一众明星企业之后,关于通用大模型的格局既定,没想到,平静水面 ...[详细]
    • 智谱AI狂飙:与商业化博弈的一年

      智谱AI狂飙:与商业化博弈的一年【雷峰网(公众号:雷峰网)】“这一年时间过得太快了。”2023 年 12 月 AI 科技评论在搜狐网络大厦见到智谱AI COO 张帆时,张帆如是说。张帆在 2023 年 3 月加入中国大模型领域“当红 ...[详细]
    • 博搏云的生态蓝图:稳固住AGI全栈服务商的重要阵地

      博搏云的生态蓝图:稳固住AGI全栈服务商的重要阵地生态是一切产业发展的基础。完善的生态可以加速知识、技术、应用场景的积累,使创新成果更快地转化为产品,连接产业链上下游,也可以为人才的培养和流动提供良好平台。中国已被视为全球AI领域最具竞争力的国家。人 ...[详细]
    • 阿里云 all in AI 的决心

      阿里云 all in AI 的决心如何抓住 AI 的机会?这是进入大模型时代后,面对新的起点,各大云厂商在不断思考的问题。毋庸置疑,AI 与云已经成为紧密的拍档。大模型的迭代进化离不开云计算的支撑,而大模型的落地应用,给云计算勾勒了一 ...[详细]
    • 创业板指涨逾1%,沪指站稳3500点上方

      创业板指涨逾1%,沪指站稳3500点上方来源:财联社财联社7月9日电,指数持续走强,创业板指拉升涨逾1%,沪指涨0.35%,深成指涨0.60%。影视传媒、核聚变、机器人、军工等方向涨幅居前,沪深京三市上涨个股近3100只。股市动态:09:3 ...[详细]
    • 埋头钻研一年后,阶跃星辰交出了第一份答卷

      埋头钻研一年后,阶跃星辰交出了第一份答卷历经去年持续一年之久的百模大战后,今年伊始,落地应用开始成为大模型的主流叙事方式。本以为,在月之暗面、智谱、MiniMax、百川、零一万物等一众明星企业之后,关于通用大模型的格局既定,没想到,平静水面 ...[详细]
    • 零一万物 API 上线,用户反馈多模态中文能力超过 GPT

      零一万物 API 上线,用户反馈多模态中文能力超过 GPT【雷峰网(公众号:雷峰网)】近日,大模型初创公司零一万物发布了Yi 大模型 API 开放平台,为开发者提供通用 Chat、200k 超长上下文、多模态交互等模型。零一万物由创新工场董事长兼首席执行官李 ...[详细]
    • 价格战之后,智谱来到商业化的下一站

      价格战之后,智谱来到商业化的下一站「雷峰网(公众号:雷峰网)消息」刚刚过去的 5 月里,中国 AI 大模型领域掀起一场价格战,激起行业热议。这次价格战的两股势力分别是互联网大厂和大模型创业公司,以字节、阿里云、腾讯和智谱为主要参战代表 ...[详细]
    • 在 AI 战场里拿掉英特尔,PC 能活吗?

      在 AI 战场里拿掉英特尔,PC 能活吗?ChatGPT引发了一场大模型淘金热。一开始大家扎堆训练大模型。发现入局没有那么简单,发展到第二阶段,就开始出现了寄生于ChatGPT的众多APP和应用。无论是发力于向量数据库缓存,还是支持模型微调以 ...[详细]
    • 港科大褚晓文:医疗场景下的 AutoML ,模型参数量更小、分类准确率更高

      港科大褚晓文:医疗场景下的 AutoML ,模型参数量更小、分类准确率更高探索 AI 和医学结合更多的可能性,是人工智能发展的一个重要命题。AutoML 作为近年来备受瞩目的概念之一,被视为解决算法工程师来提高训练模型效率的一个工具,在工业、农业、零售等诸多场景中均有被使用 ...[详细]
    热点阅读