| 主题 | MICS学术沙龙活动:DeepSeek与医学图像计算 |
| 时间 | 2025年02月15日(星期六)上午09:00-12:30(北京时间) |
| 主持人 | 何晖光(中国科学院自动化研究所)王连生(厦门大学) |
| 主办单位 | 医学图像计算青年研讨会 |
日程安排
2025年02月15日 09:00-12:30
| 9:00-9:05 | 开场沈定刚教授 / 王连生教授 |
| 9:05-9:35 | 报告题目:现代机器学习的数理基础问题——以DeepSeek为例孟德宇(西安交通大学) |
| 9:35-10:05 | 报告题目:DeepSeek R1 为医学数据推理与信息整合提供的启发:临床决策支持新范式李 响(哈佛大学、麻省总医院) |
| 10:05-10:35 | 报告题目:Think Like o1&R1: Inference-time Scaling for Medical Reasoning张晓凡(上海人工智能实验室、上海交通大学) |
| 10:35-11:05 | 报告题目:从 DeepSeek-V3 到 R1:技术演进与启示孙善辉(联影智能) 黄威靖(联影智能) |
| 11:05-11:25 | 报告题目:DeepSeek与细粒度医学影像视觉语言模型骆功宁(哈尔滨工业大学) |
| 11:25-11:45 | 报告题目:DeepSeek与医疗大模型发展现状与展望钱 波(南京航空航天大学) |
| 11:45-12:30 | Panel讨论1. 请您描述一下这一次的DeepSeek模型,与过往的大模型有什么区别?2. 在DeepSeek赋能下,您看好哪些医疗场景?具体如何赋能或者结合?3. 如何在DeepSeek加持下,更好地开展医疗领域的研究?4. 展望DeepSeek和大模型的未来发展。5. DeepSeek的发展对于医学图像计算领域有什么启发。嘉宾:何晖光、王乾、倪东、刘再毅、夏勇、盛斌、强彦、王洪凯、雷柏英主持:王连生 教授 |
报告嘉宾简介
孟德宇 (西安交通大学)
报告题目:现代机器学习的数理基础问题——以DeepSeek为例
报告摘要:以深度学习/大模型为代表的机器学习方法与技术为当今科技领域的研究焦点,近期DeepSeek产品性能更引起了领域对于机器学习/人工智能领域的广泛关注。然而,相比技术水平的迅猛提升,机器学习基础理论研究进展远远滞后,大量技术经验发现无法找到理论支撑,以科学性为前提的学科大厦面临危局。重建机器学习理论体系已成为当今重大科技前沿问题。针对这一挑战,本报告将以深度学习三大技术实验现象(任务泛化能力、智能涌现现象、鲁棒-精确悖论)理论内涵作为分析对象,介绍未来机器学习理论可能发展的新型学习、统计与物理理论新框架,以及本研究组分别针对通信、生命、医疗技术领域的场景动态适应、生命智能涌现、智能可靠诊疗三大技术问题的机器学习数学技术方面的初步探索。
个人简介:孟德宇,西安交通大学数学与统计学院教授,大数据分析与计算分析工程实验室统计与大数据中心常务副主任。长期致力于机器学习基础理论的研究,在机器学习相关领域期刊会议发表论文百余篇,谷歌学术引用超过34000次,现任IEEE Trans. PAMI,National Science Review等7个国内外期刊编委。
李 响 (哈佛大学、麻省总医院)
报告题目: DeepSeek R1 为医学数据推理与信息整合提供的启发:临床决策支持新范式
报告摘要:DeepSeek R1 利用简洁有效的训练方式达到了在其参数水平上前所未有的核心推理能力,其成功为我们在医学数据和临床决策支持的研究提供了新的启发。我们会简要回顾大语言模型在医疗领域的研究现状,解析为什么“链式推理”在临床场景中至关重要,并深入探讨DeepSeek R1 所采用的强化学习与长链推理机制。随后我们会讨论这种新范式会如何帮助AI模型更准确地理解并整合电子病历、影像数据、检测结果以及其他来源的信息。并结合DeepSeek R1的群体相对策略优化训练方式,讨论通过多轮的自我进化来持续优化AI诊断建议与治疗方案的可能性。
个人简介: 李响教授是哈佛大学医学院和麻省总医院放射科的助理教授。他领导了多个医学影像、文本分析和多模态融合项目,专注于开发医疗健康领域的人工智能(AI)解决方案。李响教授的研究主要聚焦在人工通用智能(AGI)在医学数据的开发和应用上,以应对在复杂临床环境中的实际挑战,包括多机构数据的异质性、模型的可扩展性和计算限制,以及临床工作流程的系统集成。他在医学影像和文本分析方法、人工智能进行疾病诊断和检测,生成式人工智能,以及医疗大数据的计算架构设计等主题上于Nature Medicine,TPAMI,ICML,ACL等期刊和会议上发表了130多篇文章,引用超过8000,h-index指数43。担任包括IEEE Transactions on Medical Imaging, IEEE Transactions on Artificial Intelligence等期刊编委,并于2019年起创办了International Workshop on Multiscale Multimodal Medical Imaging会议。其在医学大语言模型,多模态医学数据融合,以及生成式人工智能辅助筛查等多项研究获得来自美国国立卫生研究院(NIH)的资助,并获得包括Google Scholar Program Award,Thrall Innovation Grants Award,NVIDIA Global Impact Award,以及多个期刊和会议的Best Paper Award在内的多项奖项。
张晓凡 (上海人工智能实验室、上海交通大学)
报告题目:Think Like o1&R1: Inference-time Scaling for Medical Reasoning
报告摘要:OpenAI o1 and DeepSeek R1 have shown their amazing abilities in complex reasoning tasks. Building upon our previous investigations of O1 replication (Part 1: Journey Learning [Qin et al., 2024] and Part 2: Distillation [Huang et al., 2024]), this work explores the potential of inference-time scaling in large language models (LLMs) for medical reasoning tasks, ranging from diagnostic decision-making to treatment planning. Through extensive experiments on medical benchmarks of varying complexity (MedQA, Medbullets, and JAMA Clinical Challenges), our investigation reveals several key insights: (1) Increasing inference time does lead to improved performance. With a modest training set of 500 samples, our model yields substantial performance improvements of 6%-11%. (2) Task complexity directly correlates with the required length of reasoning chains, confirming the necessity of extended thought processes for challenging problems. (3) The differential diagnoses generated by our model adhere to the principles of the hypothetico-deductive method, producing a list of potential conditions that may explain a patient’s symptoms and systematically narrowing these possibilities by evaluating the evidence. These findings demonstrate the promising synergy between inference-time scaling and journey learning in advancing LLMs’ real-world clinical reasoning capabilities.
个人简介: 张晓凡,现任上海交通大学电院清源研究院长聘教轨副教授,博士生导师。北京航空航天大学学士,美国北卡罗莱纳大学夏洛特分校博士学位。曾任京东硅谷研究院计算机视觉研究员、商汤科技北美智慧医疗实验室高级研究员。2021年6月加入上海交通大学清源研究院。研究领域:医学图像、文本分析,多模态决策。在国际顶级期刊及会议如 MedIA、TMI、CVPR、ACL、MICCAI 等发表多篇论文。Google Scholar 近五年引用千余次。申报美国专利3项。
孙善辉(联影智能)
报告题目:从 DeepSeek-V3 到 R1:技术演进与启示
报告摘要:近年来,大规模语言模型(LLM)和大规模推理模型(Large Reasoning Model, LRM)的技术进步持续推动人工智能在多个领域的深入应用。从 DeepSeek-V3 到 R1,模型在 架构优化、训练效率提升、显存管理、推理能力增强 等方面取得了重要突破,使其在实际应用中展现出更强的 实用性与泛化能力。本次报告将深入探讨 DeepSeek-V3 到 R1 的核心技术演进,涵盖 Mixture-of-Experts(MoE)架构、显存优化、Multi-Token 预测、并行机器学习优化 等关键技术,并分析监督微调(SFT)、基于用户反馈的强化学习、基于规则的强化学习等方法如何提升大模型的对齐性和智能推理能力。此外,我们将结合医疗AI领域的应用需求,探讨其推动医疗智能化的发展,以及说明其在应用落地中的潜力以及可能的挑战,并提出一种可行的解决思路。
个人简介:孙善辉, 美国爱荷华大学博士,现任联影智能高级研发总监。在计算机视觉、人工智能、医学图像处理等领域内国际期刊和学术会议上发表40余篇学术论文,并拥有80余项美国发明专利。他的研究方向涵盖生成式 AI、深度学习及强化学习在医学影像领域的应用,特别专注于 MRI 重建、图像质量增强、计算机辅助诊断、心脏 MRI 分析、图像引导介入成像中的智能导航、医学图像分割与配准等方向。
黄威靖(联影智能)
报告题目:从 DeepSeek-V3 到 R1:技术演进与启示
个人简介:黄威靖,北京大学计算机科学博士,现任联影智能高级研发科学家。专注于自然语言处理与大语言模型的研发与应用 ,曾在平安科技和SmartNews美国分公司工作。2019年至今主要研究方向包括中文GPT的预训练和应用、基于知识的问答、数据增强、推荐系统冷启动、代码与自然语言的跨模态表示学习、以及医疗领域大语言模型开发等。发表多篇NLP领域顶会论文(如ACL、IJCAI),并担任NLP领域知名会议EMNLP,EACL审稿人。
骆功宁(哈尔滨工业大学)
报告题目:DeepSeek与细粒度医学影像视觉语言模型
报告摘要:DeepSeek和ChatGPT等大语言模型是当今学术界的热点话题,相关技术也促进了医学影像计算领域的进步,尤其是在医学视觉语言预训练(VLP)方面的发展。利用自然配对的医学影像报告数据对于医学影像分析至关重要。然而,现有方法难以准确描述疾病关联从而导致诊断结果不准确或不完整。本报告主要展示团队提出的Med-FILIP,这是一种细粒度的VLP模型,通过对比学习引入了医学影像特定的知识,基于大型语言模型的文本处理能力解耦疾病报告中的细节,从而有效地降低文本复杂性,同时以微小的成本保留丰富的信息。在多个任务和数据集上我们的模型实现了最先进的性能。本工作代码已经开源:https://github.com/PerceptionComputingLab/MedFILIP
个人简介:骆功宁,现任哈尔滨工业大学计算机科学与技术学院副教授、博士生导师、入选哈尔滨工业大学青年拔尖人才支持计划,黑龙江省智慧医疗创新团队(龙江科技英才春雁支持计划)带头人,黑龙江省专业技术领军人才梯度后备带头人,MICCAI2022组委分委会主席和MICCAI2024&2025领域主席。以第一或通讯作者在领域权威期刊和会议Nature Communications、Medical Image Analysis、TBME、JBHI、AAAI、MICCAI等被录用或发表论文30余篇,主持国家自然科学基金项目(包括青年和面上项目)、中国博士后科学基金特别资助项目等10项。
钱 波 (南京航空航天大学)
报告题目:DeepSeek与医疗大模型发展现状与展望
报告摘要:近年来,人工智能技术在各种疾病诊断的医疗研究应用中日益增长,特别是在大模型技术和计算机硬件算力的推动下,使得数据驱动的疾病自动分析成为可能,从而为疾病诊断、进展预测和治疗干预提供了更全面的支持。通过对大量医学图像和临床文本数据进行预训练,大模型在提高诊断的准确性、效率和个性化治疗方案推荐方面具有显著优势。在此背景下,DeepSeek作为一种先进的国产大模型,在逻辑推理和实时问题解决方面表现突出,在疾病诊断分析领域也展现了较大的应用潜力。然而,尽管数据量的增加和模型持续优化增强了大模型在临床实际任务中的应用潜力,当前模型仍面临数据依赖性强、多模态数据融合和缺乏可解释性等挑战。此外,这些医疗大模型尚未在不同临床环境中进行广泛评估,这影响了其在实际应用中的可靠性和实用性。本报告回顾了包括DeepSeek在内的大模型技术的最新发展,介绍了近年来医疗领域大模型的相关研究工作,并展望了医疗大模型未来的研究方向及其面临的挑战。
个人简介:钱波,南京航空航天大学人工智能学院助理教授/讲师,当前在张道强教授团队从事人工智能、医学图像分析、医疗大模型等方向的研究。2024年博士毕业于上海交通大学计算机科学与技术专业,在JAMA Ophthalmology、Patterns、IEEE ITS、IEEE ICME、The Visual Computer等期刊和会议上发表学术论文10余篇。目前担任The Visual Computer期刊副主编,担任JAMA Ophthalmology 、IEEE TMI、Medical Image Analysis、IEEE JBHI等多个国际期刊和会议的审稿人,担任MICCAI 2022-2024、CGI 2023等多个国际人工智能与医学影像分析挑战赛领域主席/程序委员。
Panel讨论嘉宾简介
何晖光 (中国科学院自动化研究所)
个人简介:何晖光,中国科学院自动化研究所研究员,博士生导师,国家高层次人才,中国科学院大学岗位教授,上海科技大学特聘教授。先后主持多项国家自然科学基金、863项目、国家重点研发计划课题等多个重要项目。获得国家科技进步二等奖两项(排二、排三),北京市科技进步奖两项,教育部科技进步一等奖等奖项。入选北京市科技新星,中科院“卢嘉锡青年人才奖”,中科院青年创新促进会优秀会员等。其研究领域为脑-机接口、类脑智能、医学影像分析等,在Nat. Commun., IEEE TPAMI/TNNLS/TCYB/TMI,ICML,ICLR,MICCAI等发表文章200余篇。自动化学报编委,CCF/CSIG杰出会员。建国七十周年纪念章获得者。
王 乾 (上海科技大学)
个人简介:王乾现任上海科技大学生物医学工程学院研究员、副院长,从事医学图像智能计算研究。已发表论文200余篇,被引用1.2万余次,H因子50。主持和参与多个科技部、国家自然科学基金、上海市科委项目等。承担Medical Image Analysis、Pattern Recognition、Neural Networks等国内外学术期刊编辑工作,领导和参与四部国际会议论文集的编辑出版,担任MICCAI领域主席等。
倪 东 (南京医科大学、深圳大学)
个人简介:倪东,教授,南京医科大学生物医学工程与信息学院院长,深圳大学生物医学工程学院教授,人工智能医疗影像国际顶级会议MICCAI理事会成员,国家重点研发计划首席科学家,广东省超声医学工程学会副会长,深圳大学优秀学者。长期从事医学图像计算的研究、临床应用及产业转化。主持国家重点研发计划等科研项目10余项,获授权发明专利30余项,发表学术论文200余篇,包括在Nature 子刊、IEEE TMI、Medical Image Analysis及MICCAI等本领域顶级期刊和会议发表论文多篇。智能超声研究成果实施了大规模的临床应用及产业转化,获得了深圳市科技进步奖一等奖。
刘再毅 (广东省人民医院)
个人简介:医学博士,二级岗主任医师,博士生导师,国家杰青获得者,国务院特殊津贴专家,广东省丁颖科技奖获得者,广东省人民医院放射科主任,广东省医学影像智能分析与应用重点实验室主任。一直致力于医学影像组学人工智能研究。近年来,聚焦恶性肿瘤量化研究,将医学影像转化为可挖掘数据,创新性地基于影像组学构建个体化预测模型,用于肿瘤精准诊断、疗效评估和预后预测。以第一或通讯 [含共同] 作者发表SCI论文100余篇,包括临床肿瘤学顶级期刊《J Clin Oncol》、《Ann Oncol》、《Clin Cancer Res》、代谢学顶级期刊《Nature Metabolism》、医学图像处理顶级期刊《Med Img Anal》和影像学顶级期刊《Radiology》。先后获国家杰出青年科学基金、科技部重点研发计划课题(2项)、国家自然科学基金区域创新发展联合基金及面上项目等资助。担任中华放射学会常委、广东省放射学会候任主任委员、亚洲腹部放射学会执委等。多次受邀在国际学术大会做专题报告。因本人在医学影像人工智能方面的工作,积极推动了我国医学影像人工智能研究的发展,于2018年获中华放射学会“杰出青年奖”。以第一完成人获得2020年度广东省科技进步一等奖;2023年获第十七届广东省丁颖科技奖。
夏 勇 (西北工业大学)
个人简介:夏勇,西北工业大学计算机学院长聘教授、空天地海一体化大数据应用技术国家工程实验室成员,研究方向为医学影像智能计算,近5年在JAMA Network Open、Radiology、IEEE-TPAMI/TMI/TIP/TNNLS、IJCV、MedIA、NeurIPS、CVPR、ECCV、MICCAI、AAAI、IJCAI发表论文80余篇,谷歌引用1.4万余次,先后在BraTS2020、KiTS21、KiPA22、SegRap2023 、STAGE2023/2024等10余项国际学科竞赛中获得前三名;担任中国体视学学会理事、中国计算机学会数字医学分会常委、陕西省计算机学会人工智能专委会主任。个人主页:https://teacher.nwpu.edu.cn/yongxia.html
盛 斌 (上海交通大学)
个人简介:盛斌, 现为上海交通大学计算机科学与工程系教授、博士生导师,获国家“万人计划”青年拔尖人才等项目资助。ISBI2020、MICCAI2022及MICCAI2023国际眼底影像人工智能读片竞赛主席,任The Visual Computer执行编辑(Managing Editor), 任IEEE Trans. CSVT等4本人工智能领域SCI国际期刊Associate Editor。近五年以(共同)第一/通讯发表Nature Medicine, Nature Communications、IJCV、IEEE TPAMI等SCI论文69篇。获2020年度上海市科技进步特等奖,两次获世界人工智能大会SAIL AWARD榜单项目、国际图形学学会(Computer Graphics Society)杰出贡献奖等荣誉。
强 彦 (中北大学)
个人简介:强彦,工学博士,教授,博士生导师。任中北大学软件学院院长,山西省教学名师,教育部工程教育认证专家,中国计算机学会虚拟现实与可视化专委常委,教育专委执委。近年来,发表SCI论文50余篇,包括ESI全球Top前1%高被引论文1篇。先后主持国家自然科学基金9项及其他省部级基金35项。主编、参编或翻译著作教材36部,拥有国家发明专利19项。获山西省教学成果一等奖 2 项、山西省自然科学奖二等奖1项、山西省技术发明奖二等奖1项、山西省科技进步奖三等奖1项。主讲课程《面向对象编程思想概览》荣获国家级精品视频公开课称号,所讲课程《人工智能》获国家一流课程称号。曾获山西省“五一劳动奖章”,山西省“优秀教师”,山西省“十佳师德标兵”,山西省“三晋英才”拔尖骨干人才等荣誉称号。
王洪凯 (大连理工大学)
个人简介:王洪凯,大连理工大学教授,博士生导师。2009年博士毕业于清华大学生物医学工程系,2009-2014年在美国加州大学洛杉矶分校先后担任博士后和研究员,现任大连理工大学医学部副部长。主要研究方向为医学影像智能计算和数字人体建模仿真,所构建的可变形数字中国人图谱在个性化医疗、装备制造等领域取得诸多应用,技术成果被中国和美国公司产业转化,实现科技成果转化数百万元。在《IEEE Transactions on Medical Imaging》、《Medical Image Analysis》等领域顶级期刊以及Nature旗下期刊发表论文多篇,担任Medical Image Computing Seminar学会副主席、中国解剖学会断层影像解剖学分会副主任委员、中国解剖学会智慧解剖学分会副主任委员。主持国家重点研发计划课题1项、国家自然科学基金3项、参与国家自然科学基金联合重点项目、国家重点研发计划试点专项1项、国家自然科学基金重大研究计划培育计划。
雷柏英 (深圳大学)
个人简介:雷柏英,国家级青年人才,深圳大学特聘教授,西安电子科技大学客座教授,博士生导师,获新加坡南洋理工大学博士学位。主要研究方向为医学图像处理和人工智能。在IEEE TPAMI、 TMI等以第一/通讯作者 (含共同)发表SCI论文100余篇(8篇ESI高被引,1篇热点论文)。谷歌学术总引用超万次,H指数56。主持国家自然科学基金联合基金重点1项,面上2项等项目20余项(含国家级7项)。现任IEEE TNNLS、TCYB、TMI、JBHI、Medical Image Analysis等10种SCI期刊编委。IEEE BISP、BIIP、BSP等技术委员会委员,医学图像顶级学术会议MICCAI领域主席(2021-2023)。IEEE 广州分部WIE主席,人工智能A类会议AAAI、IJCAI程序委员会委员,入选美国斯坦福大学发布的“全球前2%顶尖科学家”(2020-2023)和终身影响力榜单(2023),获 “强国青年科学家”提名(2022,全国共40人),CSIG石青云女科学家奖(2022)。
王连生 (厦门大学)
个人简介:王连生,毕业于香港中文大学,现为厦门大学信息学院教授、博士生导师,厦门大学医学院消化病学系双聘教授、博士生导师,数字福建健康医疗大数据研究所副所长,厦门大学医学人工智能研究院负责人,MICS主席,福建省医学会放射学分会AI学组副组长。长期从事医学影像处理研究,主持和参与多项科研项目,包括国家自然科学基金仪器专项、科技部科技创新2030、国家重点研发项目、国家自然科学基金面上和青年项目等,发表包括Nature Machine Intelligence、Nature Communications、IEEE Transactions on Medical Imaging、Medical Image Analysis 、人工智能顶会CVPR/AAAI等相关研究论文120余篇,获得腾讯犀牛鸟科研奖、福建省科技进步二等奖、2023年厦门大学田昭武交叉学科奖一等奖,带领团队先后11次在国际医学影像比赛中获得冠军。
扫描上方二维码进入B站、视频号直播
医学图像计算青年研讨会(MICS)创立于2014,为全球华人青年学者提供交流平台。首届 MICS 在医学图像领域著名学者、北卡罗来纳大学教堂山分校沈定刚教授(现为上海科技大学生物医学工程学院创始院长)的倡议下于2014年在深圳大学举行,每年7-8月举办线下年度大会。MICS 经过2015(济南)、2016(广州)、2017(上海)、2018(南京)、2019(苏州)、2020(大连)、2021(西安)、2022(南京)、2023(太原)、2024(厦门) 的发展已经成为医学图像计算领域全球华人最具影响力的学术活动之一。2025年和2026年 MICS 年度大会将分别在慈溪和北京举行,欢迎全球同道专家和同学共聚学术盛宴!
从2022年底开始,MICS 每两周一次的线上 Webinar 聚焦如下九大专题方向开展学术活动:脑与神经影像、医学图像分析(分割与配准)、医学成像、图像引导的介入与手术、医学图像与其他模态数据融合、计算病理、机器学习、医工交叉等;同时 MICS 通过微信公众号每两周发布一次科研简讯,致力于最近发表的原创性研究成果的介绍。
MICS 学术沙龙是2022年推出的新型学术活动,按照地区划分成:华北、华东、华南、华中、西南、西北、东北、海外举办中小型的线下学术研讨,让 MICS 走进高校、医院和企业,每次活动同步在线实况播放,形成线下+线上共同交流的良好氛围。
