[#19-11] MICS在线学术讲座会后总结

北卡罗来纳大学教堂山分校张寒博士2019年07月02日MICS在线学术讲座成功举办!

[#19-11] MICS在线学术讲座:张寒

医学图像计算青年研讨会(Medical Imaging Computing Seminar,MICS)创立于2014年,其宗旨是为医学图像领域的华人青年学者提供学术交流平台,增进相互之间的了解和友谊,帮助青年学者融入学术研究大家庭。MICS聚焦于近两年内的医学图像计算领域原创研究,欢迎医学图像处理、计算机视觉、人工智能等新理论、新方法、新应用的展示,以及影像与临床医学、基础医学深度交叉的突破性进展报告。

首届MICS在医学图像领域著名学者、北卡罗来纳大学教堂山分校沈定刚教授的倡议下,于2014年12月在深圳大学举行。经过2015(济南)、2016(广州)、2017(上海)、2018(南京)的蓬勃发展,MICS从参会人数不足百人到吸引上千名专家学者参与,已迅速成为全国医学图像计算领域最具影响力的活动之一。

第六届医学图像计算青年研讨会将于2019年7月13-14日在苏州大学举办。在此,谨对本领域专家学者长期以来的大力支持表示感谢,并欢迎广大青年学者莅临苏州大学,积极参与MICS 2019,共同繁荣MICS大家庭!


利用静息态功能磁共振构建人脑功能连接网络从而进行神经科学和疾病研究是当今热点之一。然而,传统的网络构建方法(如皮尔逊相关)以及基于群体的功能网络组间比较存在局限性。


在本次报告中张寒博士重点介绍了最近提出的一系列高阶人脑功能连接网络构建和基于脑网络的个体化疾病诊断研究。这一系列研究将脑网络构建和机器学习联系在一起,从更多角度和更高阶功能连接的层面对大脑进行网络构建,所得到的结果能够有效补充传统方法,从而进一步提高疾病诊断和预测的准确性,推动网络神经科学在疾病临床研究的应用。此外,张博士主要负责开发的人脑功能网络构建和基于脑网络的疾病分类工具箱BrainNetClass(下载:https://github.com/zzstefan/BrainNetClass,介绍:http://arxiv.org/abs/1906.09908)也隆重上线,提供一整套标准且严谨的基于脑网络的疾病个体分类和诊断方法,最终会给出丰富的结果报告和模型评分,方便神经科学、临床医生或者其他领域的研究者使用。最后,张博士回答了在线观众所提出的相关问题,并在会后对所有问题进行了更为细致的回答。

问答环节

  • 问题1:时间窗动态功能连接在国际上争议很大,你有什么建议?
    张寒:虽然有一些争议,但不可否认的是,基于时间窗的动态功能连接依然是主要方法和主流,我认为至少几年内可能继续出现在大部分研究中。时间窗的优点在于简单,便于理解(动态功能连接某种程度上等同于短时功能连接,这种“短时”体现在可以使用少数几十个时间点来估计功能连接上)。目前已经有一些任务态的fMRI研究证明了滑动时间窗得到的动态功能连接具有生理意义,能够反映人脑的moment-to-moment适应性。当然,该技术也有自身的问题,比如窗长难以确定,窗长和步长等参数对结果影响较大,对于噪声严重(比如头动)的fMRI数据可能更多得到artificial的功能连接的“改变”。我们要辩证的看待它。将来,我们可以将滑动时间窗技术作为一种动态功能连接的“预处理”手段,并发展更好的后处理技术(比如进一步滤波,比如采用多层网络分析【multi-layer network analysis】)来降低噪声对于动态功能连接估计的影响。
  • 问题2:目前基于功能磁共振的分类识别系统对于不同中心数据的鲁棒性如何?建议提供一个多中心分类研究选项,比如采用leave-center-out cross validation?
    张寒:这是很好的建议。目前很多数据集为了增加样本量,都采用多中心共同采集。即使是同一中心,也可能为了尽可能多纳入被试,采用了不同参数采集到的数据。一个方法在不同中心数据上具有鲁棒性我个人认为是一个挑战,这不仅仅是对于机器学习是挑战,对于任何其他的fMRI方法和研究都一样是不确定的因素。之前的对于基于多中心数据的脑网络分类的做法有很多,并没有避而不谈。比如,采用一个中心数据(可能更多样本)训练,用另一个中心的“独立采集”到的(相对小样本)数据验证。也比如预先把“中心”的效应从feature中回归掉,用回归掉中心效应的更新后的features继续做分类。在机器学习里还有专门的“迁移学习(transfer learning或者adaptive learning)”来解决这类问题。从数据层面,我们可以尽可能用同样扫描参数,采取更严格质控(比如不同中心采取同一水模验证信噪比,如ADNI数据集),采取data harmonization的方法使得数据同质化。我们目前的测试中,软件对多中心数据的表现不错,多中心对分类结果不太有影响。我们会在将来提供一个中心cross validation的选项,leave the whole data from one center out 同时利用其他中心数据做training (leave-center-out cross validation)。
  • 问题3:您提到的个体化是在前处理病人功能核磁配准个体的mri结构像,还是标准结构模板?
    张寒:个体化是指个体化诊断。这个我没有讲太清楚。这里补充一下。我说的个体化诊断是individualized diagnosis,是相比于传统的 (基于统计的) group-wise comparison而言的。在临床研究中,往往需要对某一个被试或患者进行诊断,这就是个体化诊断。比如,给一个脑肿瘤病人的MRI影像,影像科大夫需要据此给出判断,如该患者是否是脑膜瘤还是胶质瘤,是高级别还是低级别胶质瘤。医生依赖自己的经验和之前的案例做出自己的判断,这和机器学习的目标是一致的。在基于脑网络的疾病分类中,分类器根据测试数据预先训练好,新来的测试样本直接通过这个已经训练好的分类器得到分类和诊断结果。相比而言,传统的基于统计的组间比较必须要收集两组人才能给出一个统计检验的结果(如p值),这就不是个体化诊断。您提到的前处理(预处理)阶段采用功能fMRI配准个体MRI结构像的步骤并不是个体化的意思。这一预处理步骤是必须的,因为个体结构像还需要和标准结构模板做配准。有些fMRI研究或者fMRI预处理软件在做预处理的时候可以先计算metric map,比如静息态fMRI的种子点功能连接map,然后再把这个map配准到标准空间进行逐体素分析,或者把标准空间的atlas反变换到个体空间提取ROI的feature,这类方法和我说的个体化诊断不是一个层面的概念。
  • 问题4:请问软件包得到的高阶脑网络可以作为中间结果输出吗?能不能拿这个脑网络去结合自己的机器学习模型去做分类?
    张寒:我们已经决定在v1.1版本(今日会公布)中体现“灵活的分析 (flexibility in analysis)”这一概念。比如,我们会将所有参数组合下每一个被试的脑网络自动的存储下来,方便研究者采用其他后处理方法或者其他软件分析这些脑网络。再比如我们会提供命令行接口,将用户自己分析得到的脑网络或者脑特征输入BrainNetClass软件里进行后续的特征提取,特征选择,分类,模型验证,结果输出。
  • 问题5:脑网络的ground truth不知道,如何评价其好坏?
    张寒:没金标准验证是脑网络研究的问题之一。但是,我们仍然能通过很多方法来验证我们构建的脑网络是不是“好”。评价这个“好”的指标有很多,比如test-retest reliability(重测可测信度),比如reproducibility(在一个数据上能用,在另一个数据上也可以么),再比如它的结构更符合一些生理假设(如稀疏性,模块化)。此外,也有一些经常使用的评价方法,比如在基于脑网络的疾病诊断中,能够得到更好的分类效果,分类正确率更高,这样的脑网络就比较好。
  • 问题6:关于滑动窗的大小如何选取,依据标准是什么?
    张寒:滑动窗长度目前有用1分钟以内(即30-60秒)的,也有用超过1分钟的(如100秒)。窗长太长则导致得到的动态功能连接不“动态”,太短则导致噪声影响过大。综合来说,之前有NeuroImage文章讨论过这个问题,我说的1分钟也是他们定出来的。但要注意,这些文章基本上根据模拟数据来确定的,但是实际上fMRI数据没有所谓窗长金标准。具体问题应该具体分析,对我来说,我认为不同数据甚至可以采用不同的窗长。我们的dHOFC重测信度研究发现,窗长选择20,40,50个时间点(即当TR=2秒时40,80,100秒长度)时,20个时间点信度最好 (Zhang, H., Chen, X., Zhang, Y., Shen, D., 2017. Test-retest reliability of “high-order” functional connectivity in young healthy adults. Frontiers in Neuroscience, 11:439)。然而,如果以分类正确率作为评判指标,我们使用70个时间点(ADNI数据,TR=3s,见Chen, X., Zhang, H., Gao, Y., Wee, C.Y., Li, G., Shen, D., Alzheimer’s Disease Neuroimaging, I., 2016. High-order resting-state functional connectivity network for MCI classification. Hum Brain Mapp 37, 3282-3296)。综上,我认为应当具体问题具体分析。此外,还可以设置不同的窗长,分别构建不同的网络,然后将其合并用于分类,从而规避使用单一窗长的问题。
  • 问题7:病态的话往往功能连接低值更受到关注,可是讲座提到的方法被稀疏掉了,连接系数为0了,令人质疑工具在诊断疾病中的作用,如何解释?
    张寒:应该说,病人的功能连接有所变化,但不一定是变低,也有变高的可能性。而且,病人和正常人有差异的功能连接不一定是微弱的功能连接,有可能某一连接正常人很强而病人变弱了(但仍然很强)。另外,基于稀疏表征的网络构建方法不一定会把弱的功能连接置0。从我们给出的例子看出有很多连接是微弱的但不是0。即使是我们一般认为稀疏表征会带来很多0,这也是我们认为稀疏表征的缺点之一。我们采用更加符合生理假设的基于稀疏表征的网络构建方法,通过修改约束项,使得生成的网络具有符合生理假设。比如在满足稀疏性的同时,具有结构化特征(模块化属性)。具体应用表明,BrainNetClass对于疾病诊断来说还是很成功的。但是,也不是说任何研究都必须使用基于稀疏表征的网络构建。在讲课中,我提到如果数据噪声比较大,我们可以使用于稀疏表征的网络,这是因为它能够去噪。我也说了如果我们认为保持更多的连接(不那么稀疏)对于当前问题更重要,我推荐使用pairwise的方法,比如tHOFC,aHOFC和dHOFC。
  • 问题8:在磁共振分析中基于相位的连接是不是不常用?
    张寒:目前软件不支持这种分析方法。但是如果你用这种方法构建了网络(比如coherence-based FC),也可以用基于命令行的模式采用BrainNetClass进行分类。但是目前来说用基于相位的连接构建网络的文章不是特别多。
  • 问题9:在实验中correlation of correlation与sparse correlation的performance哪种会更好?
    张寒:这个问题很重要。一句话来说,没有固定的推荐。不同的问题,不同的数据应该使用不同方法。比如,基于correlation of correlation的高阶网络可能更好的补充传统的低阶网络,如果低阶网络做不出好的结果,不妨尝试用高阶网络来做。基于dHOFC的网络比较适用于精神疾病研究或者两组之前没有很强的静态功能连接的差异的研究。而所有的高阶网络研究都可以生成比较密的网络,如果基于稀疏的网络忽略了太多连接,不妨用高阶网络。当数据比较噪或者人和人之间差异很大时,可以用sparse representation的方法构建网络。具体的方法推荐,请看我们的文章(Zhou, Z., Chen, X., Zhang, Y., Qiao, L., Yu, R., Pan, G., Zhang, H., Shen, D., 2019. Brain network construction and classification toolbox (BrainNetClass). arXiv:1906.09908)中讨论部分的一个小节:Algorithm choosing determination。
  • 问题10:这么多方法,能否举例其中一个,说明当时产生这个方法的思路?
    张寒:请到我们的软件主页上看附录的参考文献。每个方法的提出,实际上都是有其特别的考量。比如,基于拓扑结构的高阶网络(tHOFC)的提出,就是因为传统的基于BOLD信号的功能连接在有些疾病的研究上不能得到很好的结果,需要我们重新定义什么是功能连接。功能连接可以是两个脑区时间活动的一致性,也可以是两个脑区其他方面属性的一致性。至于其他方面的属性,我们可以用一个脑区到其他所有脑区之间的功能连接特征来定义。比如,基于动态功能连接的高阶网络(dHOFC)的提出,就是因为传统的基于动态功能连接的方法大部分只能找出少数几个“状态”,以及状态有关的少数指标如“出现频率”,这些特征对于分类来说远远不够,而且太多信息在这一计算过程中被扔掉了。我们认为动态功能连接可能是大脑的一些adaptation或者是动态的control,两个脑区之间这种动态的关系很可能和其他两个脑区之间的动态关系有联系,这种联系可以用类似BOLD信号相关的方法刻画,即计算dynamic FC time series的信号相关。又比如,基于稀疏表达的方法往往得到过于稀疏的网络,以致只有少数脑区有连接,很多强连接,因为重复表达了,所以变为了0。这种情况是我们不想要的。我们想要的结果是脑网络既能稀疏,又能保持强和consistent的连接,所以,我们提出了基于相关系数加权的稀疏网络构建(WSR)。
  • 问题11:请问一下这款Brainnet Class主要是为临床服务的吗?
    张寒:BrainNetClass的提出是为了解决目前临床医生手中有大量数据并且希望能够训练分类器进行个体化诊断,但是他们对机器学习和编程又不太熟悉这一矛盾。此外,临床医生对于训练好的模型可能更能够从临床和生理的角度给予解释和理解,这对于脑网络在临床研究中的应用具有重要价值。基于计算机辅助的分类研究其实不仅仅能给出一些数字化的评价结果如正确率,敏感度,特异度等,我们更需要的是,怎么样去理解这个分类模型,什么样的特征能够对分类有帮助等等。该工具箱提供了一整套标准而又严谨的基于脑网络的疾病个体分类和诊断方法,在特征提取、选择和降维,交叉验证,模型评估等多个步骤提供标准的,被大部分研究者所接受的解决方案并允许高阶用户进行个性化定制。软件最终会给出丰富的结果报告和模型评分(包括ROC曲线,参数敏感度测试,模型鲁棒性测试,有用特征报告等)。方便神经科学、临床医生或者其他领域的研究者使用,研究者不需要太多机器学习的背景知识也能轻松掌握。
  • 问题12:有没有关于这个方向的相关的论文打包?方便开放吗?
    张寒:在软件主页(https://github.com/zzstefan/BrainNetClass)和软件文章(http://arxiv.org/abs/1906.09908)中有详细的相关论文介绍。感兴趣的研究者可以通过这两个网站的reference list下载相应的文章。
  • 问题13:这个软件适用小样本被试吗?小样本规模一般多大?
    张寒:适用小样本。一般来说如果能有30-50每组即可。当然,样本量越大越好。机器学习对于样本量要求是比较高的,样本量越高,结果可重复性和推广性越好。BrainNetClass使用SVM分类器,对于小样本问题也还是很鲁棒的。如果是小样本,推荐用留一法交叉验证。
  • 问题14:最佳的时间窗是如何确定的?
    张寒:根据前人经验,用TR结合预处理滤波参数来定。对于BrainNetClass,根据cross validation的准确率来定。时间窗是一个可以进行优化的参数,在计算的过程中自动优化。
  • 问题15:稀疏表示的网络是对称的吗?
    张寒:不是对称的。可以在后期处理时对称化:(W + W’) / 2.
  • 问题16:稀疏表示是不是偏相关的一种?本质上说用稀疏表示构建偏相关网络?这样的特征表示是一个优的表示法吗?
    张寒:是的。稀疏表示可以理解成一种偏相关。实际上,self-representation是一种解偏相关的方法。偏相关是一种综合衡量多个脑区关系的方法,它在两个脑区计算相关的基础上,排除了其他脑区的影响。加入L1norm以后,这个问题就变成了sparse representation(稀疏表示)了。具体的motivation可以参考文章Qiao, L., Zhang, H., Kim, M., Teng, S., Zhang, L., Shen, D., 2016. Estimating functional brain networks by incorporating a modularity prior. NeuroImage 141, 399-407(在“Partial correlation and sparse representation”小节)。至于偏相关是否可以很好表达脑网络,已经有很多文章证明了这一点(如有文章表明偏相关结果更像是结构连接网络)。

张寒老师报告的slides链接:
http://ddl.escience.cn/f/Su0P

特别鸣谢本次Webinar主要组织者:刘勇(中国科学院自动化所)


活动须知

  1. MICS在线学术讲座依托在线直播平台进行,观众请点击每期直播链接参加活动,支持安装Windows系统的电脑、MAC电脑、手机等设备,手机客户端也可直接扫描二维码进入直播;
  2. 活动开始前5分钟左右,讲者会开启直播,活动时讲者会上传PPT或共享屏幕,观众可以看到Slides,听到讲者的语音,并通过聊天功能与讲者交互;
  3. 活动过程中,请不要说无关话语,以免影响活动正常进行;活动过程中,如出现听不到或看不到视频等问题,建议退出再重新进入,一般都能解决问题;建议通过速度较快的网络参加活动,优先采用有线网络连接;活动过程中,请不要说无关话语,以免影响活动正常进行;
  4. 后续每期讲座信息,会通过MICS微信公众号“医学图像计算青年研讨会”(扫描下方二维码关注MICS微信公众号)或MICS QQ群(群号:641894878)进行通知(注:申请加入MICS QQ群时需验证姓名、单位和身份,缺一不可;入群后,请实名,姓名身份单位;身份:学校及科研单位人员T,企业研发I,博士D,硕士M)。

“医学图像计算青年研讨会”微信公众号

MICS在线学术讲座的模式和组织方式借鉴了很多VALSE的经验, 从VALSE得到了很多的启发,在此对VALSE组委会表示衷心的感谢,也祝愿MICS和VALSE越办越好!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注