Research progress and application status of artificial intelligence in fundus image analysis

来源期刊: 眼科学报 | 2022年3月 第37卷 第3期
artificial intelligence fundus images deep learning ophthalmology
近年来,眼科人工智能(artificial intelligence,AI)迅猛发展,眼底影像因易获取及其丰富的生物信息成为研究热点,眼底影像的AI分析在眼底影像分析中的应用不断深入、拓展。目前,关于糖尿病性视网膜病变(diabetic retinopathy,DR)、年龄相关性黄斑变性(age-related macular degeneration,AMD)、青光眼等常见眼底疾病的临床筛查、诊断和预测已有较多AI研究,相关成果已逐步应用于临床实践。除眼科疾病以外,探究眼底特征与全身各种疾病之间的关系并据此研发AI诊断系统已经成为当下的又一热门研究领域。AI应用于眼底影像分析将改善医疗资源紧缺、诊断效率低下的情况,为多种疾病的筛查和诊断开辟“新赛道”。未来眼底影像AI分析的研究应着眼于多种眼底疾病的智能性、全面性诊断,对复杂性疾病进行综合性的辅助诊断;注重整合标准化、高质量的数据资源,提高算法性能、设计贴合临床的研究方案。
In recent years, artificial intelligence (AI) in ophthalmology has developed rapidly. Fundus image has become a research hotspot due to its easy access and rich biological information. The application of AI analysis in fundus image is under continuous development and exploration. At present, there have been many AI studies on clinical screening, diagnosis and prediction of common fundus diseases such as diabetic retinopathy (DR), age-related macular degeneration (AMD), and glaucoma, and related achievements have been gradually applied in clinical practice. In addition to ophthalmic diseases, exploring the relationship between fundus features and various diseases and developing AI diagnostic systems based on this has become another popular research field. The application of AI in fundus image analysis will improve the shortage of medical resources and low diagnostic efficiency, and open up a “new track” for screening and diagnosis of various diseases. In the future, research on AI analysis of fundus image should focus on the intelligent and comprehensive diagnosis of multiple fundus diseases, and comprehensive auxiliary diagnosis of complex diseases, and lays emphasis on the integration of standardized and high-quality data resources, improve algorithm performance, and design clinically appropriate research program.
    根据世界卫生组织2019年10月发布的世界视觉报告[1],全球至少有22亿人存在视力障碍或失明。其中,糖尿病性视网膜病变(diabetic retinopathy,DR)、年龄相关性黄斑变性(age-related macular degeneration,AMD)和青光眼是导致全球范围内不可逆性视力损伤的三大原因。由于这些眼部病变在早期往往没有明显症状而容易被患者忽略,导致患者因眼部症状来就诊时一般已经出现不同程度的不可逆视力损伤。因此,眼底疾病的常规筛查和早期诊断至关重要。此外,随着人口老龄化加速和人们生活方式的改变,DR、AMD和青光眼等眼病患者大幅增加,而现有的医疗资源分布不均,专业的眼科医生数量有限,无法实现大规模的人工筛查。同时,眼底影像生物信息丰富,可反映其他组织器官或系统的情况,有望应用于各种非眼科疾病的辅助诊断。因此,人工智能(artificial intelligence,AI)技术在眼底影像分类、识别和语义分割等方面的应用,有望实现眼底疾病的大范围筛查和早期诊断,一定程度上改善医疗资源缺乏的困境。

1 AI概述

    AI是研究和开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学,其概念于1956年由Mccarthy等在美国达特茅斯会议上首次提出[2]。AI是一种多维技术,具有多种组件,包括高级算法、机器学习(machine learning,ML)和深度学习(deep learning,DL),其中ML和DL在医学AI领域得到了广泛的应用。ML是AI技术的一个子领域,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。在计算机系统中,“经验”以“数据”形式存在,因此,ML的主要研究内容是关于在计算机上从数据中产生“模型”的算法,即“学习算法”。它的程序由机器编写,允许计算机在没有人工干预或帮助的情况下自动学习并分析数据集中的数据和信息之间潜在的相互关系,随后对验证数据集进行分类和输出。随着云计算、大数据时代的到来,计算能力的大幅提高可缓解训练低效性,训练数据的大幅增加则可降低过拟合风险,因此,以DL为代表的复杂模型开始受到人们的关注。DL是ML的子域,它不仅可以作为分类器,还可以利用神经网络来学习数据中的潜在特征[3]。典型的DL模型就是很深层的神经网络,神经网络将刺激输入到多层神经元中,对于不同的刺激,每一层神经元以不同的权重学习不同的特征,并逐渐形成一个个复杂的特征检测器,能直接从原始数据中提取相关的高阶特征,避免人工对数据的预处理[4]。换言之,通过多层处理,逐渐将初始的“低层”特征表示转换为“高层”特征表示后,用“简单模型”即可完成复杂的分类等学习任务,由此DL也可被理解为“特征学习”或“表示学习”。以往在ML用于现实任务时,描述样本的特征通常由人类专家来设计,这称为“特征工程”。特征的好坏对泛化性能有至关重要的影响,人类专家设计出好特征也并非易事,DL通过ML技术自身来产生好特征,使ML向“全自动数据分析”又前进了一步。
    DL在眼底图像中的大多数应用可以粗略地分为分类、分割和合成任务。分类任务主要是诊断和分级,VGG-Net(visual geometry group-network)、InceptionNet[经典的卷积神经网络(convolutional neural network,CNN)]、ResNet(残差神经网络)和DenseNet(密集卷积网络)是使用最广泛的分类骨干网络。分割任务中识别病变和生物标志物在疾病诊断中具有重要意义。除了上述用于分类的网络外,其他广泛用于眼底图像分割的网络还包括全卷积网络(fully convolution network,FCN)、SegNet(图像语义分割网络)、U-Net(使用FCN进行语义分割的算法)、MaskRCNN(实例分割模型)和DeeplabV3+(语义分割模型)。在眼底图像合成领域,生成对抗性网络(generative adversarial nets,GANs)占主导地位[5]

2 眼底影像AI分析在眼科疾病诊疗的应用

2.1 糖尿病性视网膜病变(DR)

    糖尿病(diabetes mellitus,DM)是目前全球范围内威胁人类健康最为严重的非传染性疾病之一,据国际DM联盟统计,2030年全球DM患者人数将达到5.5亿[6]。2017年中国大陆成人(20~79岁)DM患病人数约有1.144亿,位于全球第一,预计到2045年,这个数据将达到1.198亿[7]。DR是DM性微血管病变中最重要的表现,是一种具有特异性改变的眼底病变,也是DM的严重并发症之一,主要表现为微动脉瘤、出血点、静脉串珠样改变、棉绒斑、硬性渗出异常和黄斑水肿等。广泛缺血还会引起视网膜或视盘新生血管、视网膜前出血及牵拉性视网膜脱离,造成患者严重的视力障碍甚至失明。
    2016年,Gulshan等[8]提出利用DL的AI系统识别眼底图像以诊断DR。研究证明DL算法对于检测可参考的DR具有很高的灵敏度和特异性,但该算法应用于真实临床环境的可行性和准确性有待进一步研究。2017年,Gargeya等[9]也利用DL技术对75 137例DM患者的眼底彩照进行识别来诊断DR,并可以自主识别判断哪些病例应该转诊给眼科医生进行评估和治疗。同年ElTanboly等[10]提出利用多级深度融合分类网络的AI算法分割光学相干断层扫描(optical coherence tomography,OCT)图像来提取像素方向的曲率、反射率和厚度3个量化特征,并分析这些特征的累积分布函数,以确定受试者是否患有DR。2018年,美国食品和药品管理局批准了世界上第1款用于DR筛查的AI设备——IDx-DR的使用[11],该设备可在没有医生帮助的情况下自动诊断DR分期,实现DR智能化诊断,从而扩大DR筛查的覆盖范围,用于DR患者的初级保健。2019年,Ratanapakorn等[12]利用MATLAB编程开发了一款DR自动筛查软件,与眼科医生的诊断结果比较,该软件对DR的诊断准确率为96.25%。2020年,Wang等[13]对基于CNN的AI DR筛查模型进行诊断试验准确性的系统评价和荟萃分析,结果表明该模型可以正确检测出91.9%的DR患者,排除91.3%的非DR患者。同年8月,上海鹰瞳医疗科技有限公司(Airdoc)的创新产品“糖尿病视网膜病变分析软件”经国家药品监督管理局审查成功获批注册。这是在我国首次获批的基于DL技术的眼底病变辅助诊断软件。该产品通过获取眼底相机拍摄的患者眼底彩照,利用CNN技术对图像进行计算、分析,得出对于DR的辅助诊断建议,作为眼科医生的诊断参考[14]。此外,在新冠肺炎流行期间,跨国光学零售商Grupo Devlyn将AI DR筛查和远程医疗技术融合以实现DR的线上诊断和预防,从而有效避免了人群聚集[15]

2.2 年龄相关性黄斑变性(AMD)


2.3 青光眼

    青光眼是仅次于白内障的全球第二大致盲性眼病[24],主要病理改变为特征性视神经损害和视野缺损。全球7 000万青光眼患者中约500~700万患者失明[25]。在其出现明显的视野缺损之前,视网膜神经纤维层(retinal nerve fiber layer,RNFL)会出现不同程度的损害[26]。因此,青光眼的早期诊断和及时治疗在保护视神经功能方面显得极为重要。在早期诊断方面,借助OCT技术定量检测RNFL厚度是目前常用的检查方法[25]。此外,AI技术还可以通过检测视野及杯盘比(cup-disc ratio,CDR)等来实现青光眼的诊断。
    2017年,Kim等[27]利用OCT图像中RNFL厚度和视野等数据,对应用于青光眼领域的多种 AI算法分类器进行详细的对比,得出支持向量机(support vector machine,SVM)和随机森林(random forest,RF)算法模型在诊断青光眼疾病领域具有更好的性能。2019年,Asaoka等[28]构建了一个DL模型,通过频域OCT图像来诊断早期青光眼,其结果表明基于频域OCT的青光眼DL模型的诊断性能得到显著提高。同年,An等[29]建立一个ML分类模型,通过结合黄斑和视盘区域的眼底彩照和OCT数据实现对青光眼和健康眼的客观分类。该模型从OCT数据中单独或联合提取量化图像,在青光眼诊断的早期阶段具有高敏感性。同年,Diaz-Pinto等[30]使用CNN从原始像素强度中学习高度区分性的特征,摆脱了以往大多数算法都依赖于手工分割的缺点。此外,Mvoulana等[31]开发出一种高效率算法,准确率达98%,能够在移动设备上实现青光眼诊断,有望应用于医疗资源有限的地区。
    目前,青光眼的诊断、分级任务主要涉及视盘/视杯(optic disc/optic cup,OD/OC)分割任务和CDR估计,然而很少有研究关注其他影响因素如年龄、种族和家族史等。

2.4 早产儿视网膜病变(ROP)

    早产儿视网膜病变(retinopathy of prematurity,ROP)是指在孕36周以下、低出生体重、高浓度吸氧史的早产儿,其未血管化的视网膜发生纤维血管瘤增生、收缩,并进一步引起牵拉性视网膜脱离和失明。ROP是全世界儿童失明的主要原因[32]。专业医生的缺乏及检查设备的落后是ROP诊疗的短板。因此,AI在ROP的应用有望解决该医疗痛点。
    2018年,Brown等[32]使用5 511张RetCam照相机拍摄的新生儿眼底图像来训练基于CNN的AI系统。结果显示,该系统在诊断ROP中附加病变的准确性与人类专家相当或更高。因此,该系统对有ROP风险婴儿的疾病检测、监测和预后方面具有潜在的应用价值。2021年,Huang等[33]利用CNN对ROP早期进行自动检测和分类,通过5倍交叉验证对模型进行训练,结果表明该系统能够准确区分ROP的早期阶段,有望为眼科医生对ROP的诊断和早期分类提供参考。

2.5 视网膜静脉阻塞(RVO)

    视网膜静脉阻塞(retinal vein occlusions,RVO)是较为常见的眼底血管病,病因复杂,与全身疾病关系密切,可分为视网膜分支静脉阻塞(branch retinal vein occlusion,BRVO)、半视网膜静脉阻塞(hemiretinal vein occlusion,HRVO)和视网膜中央静脉阻塞(central retinal vein occlusion,CRVO)[34]。RVO病理表现为视网膜血液瘀滞、静脉迂曲扩张、视网膜出血和水肿,可导致视力严重下降,甚至失明,多见于老年人,发病率随年龄增大而升高。
    2019年,Nagasato等[35]使用基于超广角眼底镜的DL分类器检测BRVO,结果显示相比于SVM模型,DL模型和超广角眼底镜相结合可以很好地区分健康眼和BRVO眼,该组合可用于自动诊断居住在没有优质眼科医疗资源地区的BRVO患者。同年,他们再次提出使用基于深度神经网络的超宽视野眼底镜检测CRVO的方法[36],同样评估了DL和SVM算法在超广角眼底图像中检测CRVO的性能,在所有评价指标中,DL模型均优于SVM,该DL模型也有利于改善偏远地区的医疗服务。2019年,他们又提出了基于DL的光学相干断层扫描血管成像(optical coherence tomography angiography,OCTA)图像中RVO引起的无灌注区(nonperfusion area, NPA)的自动检测方法,评估了DL和SVM在OCTA中检测RVO引起的NPA的能力,其结果表明DL和OCTA图像相结合对NPA的检测具有较高的准确性,在临床实践中有一定的应用价值[37]

2.6 多种眼底疾病

    上述AI算法均针对单一疾病的分析诊断,而现实中患者可能同时患有多种眼科疾病。对患有多种眼底疾病患者的智能性、全面性诊断,是AI应用于眼底图像分析的重要挑战。2017年,Ting等[38]使用CNN同时进行DR、青光眼和AMD诊断,结果显示AI同时诊断DR、青光眼和AMD具有较高的敏感性和特异性。2019年,Wang等[39]提出了一种创新性的基于DL的方法,通过多任务识别模型识别36种不同的视网膜疾病。2020年,Li等[40]利用密集相关网络(dense correlation network,DCNet)对眼底彩照进行自动多标签眼病检测,实验表明该DCNet具有较好的性能,且不受CNN主干架构的影响。2021年,Li等[41]建立了基于眼底彩照的多发性眼底病变DL模型,该模型可以诊断12种主要眼底疾病,包括DR、病理性近视性视网膜变性、RVO、视网膜色素变性、视网膜脱离、湿性或干性老年性黄斑变性、视网膜前膜、黄斑裂孔、可能的青光眼视神经病变、视乳头水肿和视神经萎缩。同年,Lin等[42]研发了眼底疾病综合智能诊断专家(Comprehensive AI Retinal Expert,CARE),可识别正常眼底图像和14种常见眼底病变,包括2种系统性疾病的眼部表现(DM和高血压)以及12种眼底异常(青光眼视神经病变、病理性近视眼底改变、RVO、视网膜脱离、黄斑裂孔、黄斑水肿、中心性浆液性脉络膜视网膜病变、视网膜前膜、视网膜色素变性、大玻璃膜疣、黄斑新生血管和地图状萎缩)。CARE适用于不同医疗场景、不同种族、不同眼底照相仪器的临床真实世界环境,且准确率媲美眼底专科医生。研究团队已经获得系列技术专利且获得国家药品监督管理局颁发的第一个眼科AI软件III类医疗器械产品注册证,是医学AI研究迈向临床实际应用的一大步。

3 眼底影像AI分析在其他非眼科疾病的应用

3.1 心血管疾病风险因素


3.2 阿尔茨海默病(AD)

    阿尔茨海默病(Alzheimer’s disease,AD)是一种起病隐匿的进行性发展的神经系统退行性疾病。临床上以记忆障碍、失语、失用、失认、视空间技能损害、执行功能障碍以及人格和行为改变等全面性痴呆表现为特征。发病机制尚未明确。目前全球至少有5 000万痴呆患者,到2050年,这个数字预计将达到1.52亿,其中有约60%~70%为AD患者。AD与脑毛细血管内淀粉样蛋白和胶原沉积有关,导致细胞凋亡和血管脱落。由于视网膜和脑血管在解剖学和生理学上是同源的,视网膜血管在AD进展中也可能受到类似的影响[44]。2017年,Golzan等[45]发现视网膜静脉搏动幅度与新皮质Aβ评分呈负相关,视网膜动脉搏动幅度与新皮质Aβ评分呈正相关,AD患者视网膜神经节细胞层厚度明显减小。2018年,O’Bryhim等[44]研究表明,生物标志物阳性的临床前AD患者的视网膜血管和结构改变可能在临床可检测到的认知症状出现之前就已经明显。研究者观察到,在生物标志物阳性组中,黄斑中心凹内的血管系统丢失,导致中心凹无血管区增大。2021年,Tian等[46]利用ML技术识别视网膜血管系统和AD之间潜在联系,通过采用多阶段架构,包括3个级联步骤:图像质量选择、血管地图生成和基于SVM的分类器,结果显示该技术的平均分类准确率达到82.44%。同时,该研究通过显著性分析证实了小血管比大血管对AD分类的贡献更大。这表明AI技术有望通过眼底照片进行视网膜血管系统分析来对AD进行早期筛查和诊断。

3.3 肾功能障碍

    研究[47]表明视网膜血管系统的改变与肾功能障碍和肾小球滤过率降低有关。2020年,Kang等[48]建立了一个DL模型来检测视网膜眼底图像中的早期肾功能损害,其结果表明该模型具有可行性,也为后续的使用眼底影像分析检测早期肾功能的AI模型研发提供经验。同年,Sabanayagam等[49]开发了一种AI DL算法来从视网膜图像中检测慢性肾脏疾病,结果表明该算法在临床应用中具有一定的可能性。

3.4 贫血


3.5 肝胆疾病


3.6 系统性生物标志物


4 结语



    本文适用于知识共享许可协议 (Creative Commons),允许第三方用户按照署名(BY)-非商业性使用(NC)-禁止演绎(ND)(CC BY-NC-ND)的方式共享,即允许第三方对本刊发表的文章进行复制、发行、展览、表演、放映、广播或通过信息网络向公众传播,但在这些过程中必须保留作者署名、仅限于非商业性目的、不得进行演绎创作。详情请访问:https://creativecommons.org/licenses/by-nc-nd/4.0/

本科教学质量工程项目[教务(2021)93号]。
