阿兹海默症(Alzheimer's disease)被视为造成失智最常见的原因,以深度学习和基於MATLAB影像处理应用的Spine Tool,可以协助将计算流程自动化,进而评估阿兹海默症治疗标的。
阿兹海默症(Alzheimer's disease;AD)被认为是造成失智最常见的原因,其特徵为类淀粉蛋白斑块(amyloid plaques)的堆积而导致脑部的变化。根据研究显示,这些坚硬、无法溶解的beta类淀粉蛋白质堆积物与树突棘(dendritic spines)的流失有密切关联。树突棘为神经元树突上的微米大小突起,负责接收其他神经元的输入。这些研究促使Genentech和其他阿兹海默症研究人员来临床评估可以在类淀粉蛋白斑块出现时减少棘突流失(spine loss)的化合物。
为了界定棘突流失,我们检查老鼠脑部组织的显微影像,计算树突上个别的棘突数目,并且计算棘突密度(举例来说,每100微米的树突上的棘突数目)。此过程若是以人工执行,需要耗费极大的劳力。
在大约10年前,我们的团队开发了Spine Tool,它是一个MATLAB影像处理应用程式,可以协助将棘突的辨识和棘突密度的计算流程自动化(图1)。虽然原始版本的Spine Tool已经适用於试管(vitro)样本,但是遇到像是影像品质较低的情况,在活体(ex vivo)脑部样本仍会产生大量的伪阳性和伪阴性。
图1 : 基於MATLAB的Spine Tool,用来将树突棘的侦测、注记和分析自动化。 |
|
为了改善Spine Tool的准确性,我们与MathWorks顾问团队合作,在这项工具加入深度学习(deep learning)。我们使用一组包含了超过9,000张已以原始Spine Tool标记的图片资料集,用来训练一个卷积神经网路(convolutional neural network;CNN),经过训练的CNN可以将棘突流失极小化的治疗法的评估流程更进一步地自动化。
棘突密度基础
为了研究的进行,我们使用正常老鼠(wild-type或WT mice)和往往会发展成为类淀粉斑块、有beta类淀粉蛋白表现的老鼠(PS2APP mice)。使用老鼠脑部组织显微切片的数位影像,沿着出现和未出现可见斑块的个别树突将棘突辨识出来,并计算数量。
如图2所示,出现在PS2APP老鼠的斑块可对应附近棘突数量明显减少。这项特定的研究还包含第三组老鼠,它们的补体3基因(complement 3 gene,C3KO)被移除;而这些老鼠的棘突流失明显减少[1]。
图2 : 老鼠身上带有棘突的树突。由左至右:正常老鼠(WT)、C3基因(C3KO)不全的老鼠、PS2APP老鼠(有远离和靠近斑块的树突)、以及PS2APP与C3KO老鼠(有远离和靠近斑块的树突)。Adapted from [1]。 |
|
我们汇整来自几百个样本的棘突密度来制作一张可以用来比较不同老鼠基因型之间密度差异的长条图(图3),从图中可看出,在统计上C3KO老鼠的斑块附近棘突密度显着降低,棘突密度的恢复显着。根据这些研究结果,降低补体的活性有可能是一种有效的治疗策略。
图3 : 图表呈现各种基因型的平均棘突密度。Adapted from [1]。 |
|
传统影像处理与深度学习的结合
较早期版本的Spine Tool是透过边界侦测(threshold detection)、分割(segmentation)、和形态(morphological)影像处理技巧来辨识树突棘,以及为侦测特定神经科学的形态学进行客制化作业(图4)。
图4 : 以早期版本的Spine Tool处理的树突影像。左侧黄色方框代表棘突最大的宽度叁数。 |
|
segmentation 分割
Shaft detection 轴检测
spine detection 脊柱检测
为了将深度学习合并到Spine Tool,我们评估了几种预先定义的网路架构,包含Deeplab、SegNet,以及U-Net,它是一个开发来进行生医影像分割的网路。我们选择U-Net因为它在多重解析度有不错的表现。
为了缩短训练时间,我们决定使用2D版本的U-Net,而不选择更复杂的3D版本。虽然采用的资料具有三个维度,但三个方向度量并不对等:其体积的深度大约只有几个切片深,树突棘在Z轴也很少延伸至超过一或两个切片的程度。以执行薄3D切片的最大强度投影来建立2D资料集。在装配NVIDIAR GeForce RTX 2080 Ti GPUs的工作站使用Parallel Computing Toolbox (平行运算工具箱)执行训练来省下额外的时间。
从经过训练的网路取得的分类结果已经相当不错,不过仍然有伪阴性的存在,以网路辨识到的棘突数量比可以眼见的还要少。这是分类不平衡的问题造成:棘突相较於树突和背景非常微小,我们调整整个网路的分类的权重,并且评估几种损失函数来改善预测的准确度,选择设定权重来使灵敏度最大化。
更新的网路几??可侦测到图片上全部的棘突,但是也出现更多的伪阳性。我们对於侦测结果进行後处理来排除这些伪阳性。举例来说,对被侦测到的棘突采用长度和体积的??值,剔除任何太大或太小而不会是真正棘突的结果。
至目前为止,我们的深度学习模型在节省时间方面的表现比起准确度的增加具有更大的前景。使用经过後处理的模型来预测不同基因型条件的棘突密度比率,结果与我们使用传统影像处理在真实Spine Tool资料集的计算结果相当类似(图5),还可以节省高达50%的人工修正时间。
图5 : 透过影像处理(左)和深度学习(右)产生的棘突密度比率。 |
|
Spine Tool的改善和检验
目前我们正在着手後处理的步骤优化,以确保由网路侦测到的相邻棘突可以被正确地分割和计算。最终,透过深度学习侦测的棘突将有可能会比人工检测还要准确,虽然这项能力并不是我们衡量成功与否的主要标准。我们的目标是要验证:若是治疗效果可以透过人类侦测,则它也能够透过深度学习网路来侦测。
在接下来几个月,我们要来使用Spine Tool的新深度学习功能来处理真正研究使用的影像,也会同步使用现有的工作流程来处理影像,并且比较两者结果。若是如同我们预期,由两种途径产生的直条图呈现相近的平均棘突密度,则将证实未来的棘突密度研究可以可靠地透过新工具执行而且具降低50%人工作业的潜力。
(本文由??思科技提供;作者Justin Elstrott任职於Genentech公司生物医学影像部)
叁考文献
[1] Wu, T. et al. “Complement C3 Is Activated in Human AD Brain and Is Required for Neurodegeneration in Mouse Models of Amyloidosis and Tauopathy.” Cell Reports 28, 2111-2123.e6 (2019).