基于医疗机构对 AI 的需求已从单点实验进步至全院级协同,医疗专精模型训练的需求日益增强,医梦 AI 数据蒸馏中心为专精模型训练搭建数据蒸馏工程,通过对医疗业务数据的定向治理,将原始的数据构建为可支持定向训练的数据集。
数据蒸馏中心通过对医疗业务系统开发数据中间件,将原始HIS、LIS、PACS、EMR等数据进行深度提取,再通过开发模型蒸馏程序(支持reasoning、function calling等推理、智能体扩展数据集),快速精准构建高质量、高数量的优质数据集。
"「医梦AI 数据蒸馏中心」旨在将业务数据治理为可供模型训练用的数据集。"
BY Blazer Han.
数据蒸馏中心作为AI生态中专精模型训练的基础,与模型训练中心、模型开放平台均有数据流交互,如下图中黄色数据流所示:
· 数据中间件框架开发
· 数据蒸馏
· 数据归档数据集
出于对医疗机构的数据安全考虑,医梦AI数据蒸馏中心仅支持私有云运行,医疗机构可通过购买本地硬件或租用云算力服务平台来实现数据蒸馏。
· HIS
· EMR
· LIS
· PACS
· 数据蒸馏定制计划:因模型训练方向不同,数据蒸馏中心方案需视模型能力而定,请私信我们进行数据蒸馏定制。