B体育人工智能(artificial intelligence,AI) 是基于计算机科学来模拟人脑学习知识、储存知识、思考规划的思维过程的一种技术,人工智能包括一系列操作:机器学习(ML),深度学习(DL),自然语言处理(NLP),认知计算,计算机视觉和机器人等。近年来,人工智能技术发展突飞猛进,自动驾驶、人脸识别、文本处理等已经出现在我们的生活领域。然而,与金融技术、信息技术和航空航天等其他行业相比,人工智能在医疗领域的应用速度相对缓慢。目前,人工智能在心脏病学中的应用主要包括两个方面,一是基于电子健康记录和医学图像等来源的ML/DL、NLP和认知计算等,另一个代表是介入机器人。
AI是可执行一般性人类智能任务的计算机程序。它也可视为机器或者仪器基于所收集数据自动做出决策的能力。而机器学习(machine learning,ML)是目前AI的主要亚类,它包括了监督学习,非监督学习及深入学习(deep learning,DL)等。监督学习中目前最常用的算法是人工神经网络(artificial neural network,ANN)和支持向量机。非监督学习包括了聚类算法和关联规则算法等。而DL包括了循环神经网络、卷积神经网络(convolutional neural networks,CNN)以及深度神经网络(deep neural networks,DNN)
机器学习在心血管精准医疗中的应用机器学习是AI技术分支之一,可分为3种类型:监督、非监督和增强学习,其中增强学习被视为监督学习和非监督学习二者的结合体,目的在于最大化运算的准确性。
(一)监督学习:监督学习是利用人工标记的数据集预测临床转归,适用于解决分类性及回归性问题,但所需数据量大,人工标记耗时多。监督学习算法主要包括:人工神经网络(ANN)、支持向量机(SVM)、决策树、随机森林、朴素贝叶斯分类器、模糊逻辑以及K⁃最近邻算法(KNN)。在心血管领域,应用于处理电子病历文本分类、心电图的结果判读、检测心律失常、心肌梗死心电信号分类、超声心动图的图像识别、缺血性心肌病影像数据分析、冠状动脉CT图像数据处理、药物治疗剂量、心血管疾病风险分层、疾病生存预测、临床决策系统等。监督学习的局限性:需要较大数据集训练模型,并且通过其他数据集进行验证;如果训练集存在偏倚,将会影响测试集的准确性。另外,监督学习需要手动标记训练集,预测已知的输出结果。尽管监督学习能够通过多种方式与给定的训练集匹配,自动选择“最好”的假设来匹配数据,但可能导致因学习算法更倾向于某种假设而带来偏倚。
(二)非监督学习:非监督学习是识别隐藏在数据中新的疾病机制、基因型或者表型。与监督学习侧重依据标记病例预测临床转归不同,非监督学习是寻找未被标记的、隐藏在数据中的模式。非监督学习常常用于深度学习。可用于心电图和心脏影像的自动分类、构建左心室腔自动分割参数,寻找心力衰竭、冠心病疾病亚型,指导临床对不同亚型采取个体化治疗。非监督学习的局限性:主要在于对初始聚类模式的识别存在困难,因此,非监督学习模型需要在多个队列中进行验证。除此之外,其需要手工去除噪音数据,并且需要人工标记数据选择合适的算法。因此,为了获得最佳效果,往往需要非监督学习和监督学习的联合应用。
(三)深度学习:深度学习是使用多层ANN模拟人脑的运行,根据输入的数据自动做出预测。应用ANN的深度学习包括:循环神经网络(RNN)、卷积神经网络(CNN)以及深度神经网络(DNN)。深度学习具有强大的图像识别和处理噪声能力,以更高时空分辨率处理人工实时心血管图像,通过整合斑点追踪超声心动图数据,有研究证实机器学习算法能够帮助识别运动员的生理性和病理性心肌肥厚、提高单光子发射计算机断层成像术心肌灌注成像预测阻塞性心脏病发生的能力,自动分析静息状态下冠状动脉CT血管造影下的左心室心肌图像,避免患者经历有创心脏血流储备分数的检测,对川崎病的冠状动脉光学相干断层成像图像的自动分类,心电图异常的检测等。2.深度学习的局限性:其过度拟合可能导致预测效果欠佳。深度学习需要大量的训练数据集,需要各科室与电子病历系统链接之间的紧密联系。此外,深度学习需要具有深度学习能力的设备。另外,多层面深度学习可能增加训练时间,而且建立神经网络同样费时。
随着ML方法的成熟,包括卷积神经网络用于图像分类,临床超声心动图数据的累积量增加,给超声心动图人工智能平台的研发提供了充足的机会。在这方面的创新可以通过自动测量、病理特征(瓣膜疾病、局部室壁运动异常、心肌病)的识别在治疗中快速应用,可以改进和标准化目前流程。超声心动图人工智能研究的优势和前景在于识别可能提示亚临床疾病或预后的细微或未被识别的影像学特征。
尽管人工智能模型的性能持续改善,但重要的是要承认,人工智能必须克服一些重要的挑战,才能安全地应用于临床实践。与任何模型一样,研发数据的质量和临床特征是必须的参考因素。超声心动图相关的数据数量大且复杂,一个强大的超声心动图人工智能平台将需要对大量研究进行培训和验证,这些研究包括广泛的临床特征、病理特征、超声机器供应商和图像质量等。目前关于超声心动图人工智能的研究通常存在样本规模小、受机构、地理因素、超声心动图机器品牌限制,这就可能存在过度融合和限制平台通用性的风险。此外,目前超声心动图研究很大程度上依赖于人的解释,人在解释和测量方面存在内在的差异性。
超声心动图人工智能代表了一个激动人心的机会,它将彻底改变临床实践。经过验证的超声心动人工智能模型将有能力提高质量,进行即时医疗决策,并促进公平获得诊断评价。预计超声心动图人工智能将影响患者诊治,期待相关改善临床结果和成本效益的临床研究B体育。
与心脏病学的其他学科不同B体育,人工智能技术已经被纳入心脏核医学的一些常规操作。人工智能算法已被应用于图像处理,允许进行完全自动的单光子发射计算机断层扫描(SPECT)、心肌灌注成像(MPI)运动校正、重建、量化和高水平分析。
商业化和美国食品药物管理局批准的图像软件已经纳入正常心肌灌注分布的数据库,为专家读者提供计算机辅助诊断工具,用于识别低灌注心肌。这些类型的自动化,以及机器学习的数字图像数据,以及人工智能算法的SPECT MPI数据B体育,单独使用或者结合临床特点,进一步提高了冠心病诊断的预后判断价值,为是否血运重建提供合理的临床决策依据。
在一项单中心研究中,ML算法包含成像变量(通过定量软件进行的静息和压力SPECT的灌注缺失、缺血变化和射血分数变化)在总体患者诊断准确性方面优于单个定量成像参数(86% vs 81%;P<0.01)。ML算法检测阻塞性CAD的曲线下总面积(AUC) ( 0.92 ± 0.01)也显著高于两个人工读片者(0.87±0.01和0.88 ±0.01; P<0. 05)。使用不同的数据集,同一组人创建了集成临床和成像变量(由自动化软件生成的总灌注不足[TPD])的人工智能算法。研究证明ML(87.3%±2.1%)的准确性高于一个或者两个专家读片者 (82.1% ±2.2%)或自动TPD (82.8% ±2.2%)。在检测检测阻塞性CAD方面有更高的敏感性。一项1638名参与多中心研究显示:无已知CAD的患者使用SPECT扫描仪也发现与传统相比,深度学习(DL)利用原始和定量的MPI极地图的AUC值均更高。基于这些研究,人工智能算法在预测梗阻性CAD方面比目前的临床方法提高了大约2.5%。其他研究发现一致,与专家医师视觉分析相比,训练有素的神经网络在识别特定冠状动脉狭窄病变引起的低灌注分布方面具有类似的良好性能。
在首次MPI扫描后90天内进行相关侵入性血管造影的713例SPECT MPI研究中,人工智能方法也被用于预测疑似CAD患者的早期血运重建。通过ML算法对几个自动衍生的影像学变量和临床参数进行整合,包括性别、高血压和糖尿病史、基线心电图ST段压低、运动心电图和临床变化 (总共33个变量),以预测血运重建事件。ML预测血流量重建的AUC(0.81±0.02)与单个医生的AUC(0.81±0.02)相近,优于另一个医生的AUC (0.72+0.02; P<0. 05)。因此,在本研究中,ML在预测MPI后早期血运重建方面与有经验的医生相当或更好。在预后方面,Betancur等人研究了2619例SPECT MPI患者,并将28个临床、17个压力测试和25个成像变量(包括TPD)整合到人工智能算法中来预测主要心脏事件。在超过3.2+0.6年的随访中,他们比较了AUC对以下结果的预测:(1)ML与所有可用数据(ML combined), (2) ML与仅影像学数据(ML-imaging),(3) 5分制诊断(内科诊断),(4)自动化定量成像分析(负荷TPD和缺血性TPD)。他们发现,ML联合组的MACE预测显著高于ML成像组(AUC, 0.81 vs 0.78; P<0.01)。ML组合模型的预测精度也高于内科诊断、自动压力TPD和自动缺血TPD (AUC,分别为0.81 vs 0.65、0.73和0.71; P<0.01)。与医生的诊断相比,联合治疗的风险重分类为26% (P<0.01)。基于他们的研究结果,建议人工智能可以整合临床和影像数据,对接受SPECT MPI的患者进行个性化MACE风险计算。
人工智能驱动的结构化报告CDS。人工智能驱动的算法也被纳入了第一个也是唯一一个获得美国食品和药物管理局批准的核成像软件,使用CDS工具和自然语言自动生成报告。该系统集成了超过230条规则、可逆性、功能和患者人口学特征,包括俯卧位与仰卧位、衰减校正与未衰减校正的图像结果以及质量控制数据等额外信息。一项对1000名患者的研究验证了这种人工智能驱动的报告系统检测CAD,结果显示人工智能驱动的结构化报告与9名专家对CAD缺血印象之间一致性没有显著差异。
定量工具已经在核心脏病学的实践中常规使用,但结合多种特征和临床数据的更高水平的工具还不普遍。最近的研究表明,在临床实践中有很高的应用潜力。除了精炼和构建研究以提高诊断和预后,即将到来的人工智能在核心脏病学的重点应该包括开发人工智能驱动算法,以帮助临床决策的适宜性测试、选择测试、调度、工作流优先级、协议、报告、和患者管理。这些发展不会取代医生和其他卫生保健专业人员的角色,但将为他们提供高度精确的工具,以更一致的方式检测疾病,风险分层,并优化针对患者的管理。
在电生理学中集成AI的几个重要机会包括数据管理(即,如何允许管理大量患者数据)、数据解释(即,如何复杂数据专家解释的大众化),以及多种模式获取的数据的实时集成。此外,使用人工智能增强的、经济效益获得的电生理学数据(如ECG)的不断发展的发现表明,筛查通常与心电图无关的疾病的能力可能为改善人口健康提供可扩展的机会。
目前电生理学的主要争论之一是如何将动态获得的心电图纳入临床实践。一些工具,包括可植入记录仪和面向消费者的智能手机或支持智能手表的心电图设备,在许多情况下,在他们被确定为已知的心血管疾病患者之前,允许对人群进行更具成本效益的筛查。例如,个人可以通过互联网购买自己的心电图设备,记录自己的心电图,然后需要对这些数据进行准确的解释。尽管能够准确和自动解释这些心电图的系统已经得到了改进,但仍然存在假阳性或假阴性的风险。阅读心电图的专业知识被下放到基层医疗机构,使得ECG在获得变得更加方便,初步数据表明,人工智能技术可能进一步改善这些心电图的解读,并为那些需要看医生(包括心脏病专家或电生理学家)的人提供合适的分流。然而,目前还无法在人口水平上评价计算的需要和效力。
电生理学的另一个当前问题是如何更好地促进复杂的电生理学数据的解释。例如,QT间期的测量对于识别那些有猝死风险或抗心律失常药物毒性风险的人很重要,但已经发现其变异性大,即使在心脏病学专家和一些电生理专家中评价一致性也存在。初步数据表明,DL人工智能技术可能有助于仅从心电图图像识别特定QT间期带来的风险。此外,利用专家级QT解释来训练神经网络可能有潜力提高非电生理学家和非心脏病学家的解释准确性。这些原则适用于其他电生理数据,如心律失常心腔图的解释。
当前电生理学的另一个主要机遇是如何整合通常多种不同的互补但单独获得的数据,以促进对特定患者的治疗的正确解释和优化。在心律失常患者接受侵入性电生理检查和消融术,术前影像的组合(例如,磁共振成像评估疤痕分布、心电图评估心律失常的起源)和术中成像(如心脏内的超声心动图、透视)可用来优化治疗。然而,由于这些数据都是在通过不同技术不同时间点获得的。最近的数据表明,人工智能技术可以促进数据集成,这反过来可以帮助医生更有效率,或者更有效地识别和定位与患者病情有关的部位。
最后,将人工智能技术应用于电生理数据的一个主要机会不仅是大众化、规模化和促进数据的准确解释和合成的能力,而且是通过非人类可解释的见解来改善人口健康的能力。这一原则的关键在于心电图可能包含一些人类无法轻易理解的微妙之处。举个例子,有研究显示,仅使用心电图来识别低EF的可能,并且有高精确度。又有几个其他条件可能同样从心电图识别,从而提高风险分层人口水平可伸缩的、低成本的方式。因此,从心电图中识别诊断不足、有可能治疗的疾病的能力具有成本效益的改善人口健康问题。
急性冠脉综合征(ACS)是冠心病最危急的类型,通常根据心电图和生物标志物分为ST段抬高型心肌梗死(STEMI)、非ST段抬高型心肌梗死(NSTEMI)和不稳定型心绞痛(UA)。快速心电图评估进行诊断对STEMI的及时治疗至关重要。通过单导智能手机平台,快速诊断现已被证明是可行的。这项技术可以广泛传播,并与ML相结合,对STEMI患者进行快速分诊。加速转运到经皮冠状动脉介入治疗机构可以更及时改善治疗结果。医院外心脏骤停的研究也在进行中,其中大部分是由ACS引起的。机器学习算法已被用于分析通过智能家庭扬声器和电话的家庭录音,以识别窒息样呼吸,这是心脏骤停的典型迹象。对这类记录的准确检测可使人们发现心脏骤停,并对家中发生的大量未被目击的心脏骤停患者启动紧急措施。
在STEMI以外的ACS (即NSTEMI和UA)中,管理可能不那么明确。在这个方面早期诊治尝试用ML进行12导联心电图解释是有意义的。UA/NSTEMI的治疗主要基于风险分层,据研究ML改善了先前验证过的模型,如TIMI或GRACE风险评分。同样,对死亡率和/或治疗并发症的长期预测可以提高。对高风险和低风险患者的识别的改进将有助于提高资源的利用率和更个体化的治疗。目前研究正在努力综合多种非心脏数据,以进一步完善ACS的诊断、治疗和预后。病情稳定的CAD患者也可能通过人工智能得到改善,例如,识别可能受益于血运重建的患者,或平衡抗栓益处和出血风险,选择最合适的抗血小板策略。
上述的工作代表了人工智能在冠心病从预防到治疗广泛应用的可能性。很明显,在目前的许多情况下,通过随机对照试验进行临床验证仍需要继续进行。然而,令人鼓舞的是,即使是在ML对CAD影响的初期阶段,它也有望提供更好的预后和挖掘新的危险因素,这将进一步帮助CAD患者的治疗。
介入心脏病学传统上一直处于心血管创新的前沿。在过去的十年里,侵入性血管内成像、生理学、血流动力学、机器人技术、和杂交心血管外科手术等得到了快速发展。诊断预测、治疗策略设计、设备选择、程序优化和并发症的避免都是人工智能应用有望取得快速进展的领域。
早期应用人工智能评估冠状动脉的研究包括最近的CEREBRIA-1研究,这些研究验证了在冠状动脉病变重要生理功能评价和推荐血管重建中,ML和人工智能非劣于常规诊治。
目前各地都有很好的心血管急救系统,但在关键的早期诊断和管理决策存在相当大的差异。未来,智能算法可能会在第一次呼叫时立即审查患者的病史和危险因素,并通过一系列预测性问题在运输服务到达医院之前建立初步诊断。随着可以扫描皮肤行静脉穿刺设备的发展,无需人工干预的高分辨率计算机断层扫描仪可提供冠状动脉的解剖和生理评估。快捷的心电图可能提供明确的诊断信息,并在5到10分钟内抵达急诊室。上述步骤甚至可能不需要任何人工干预或评估,并可能导致不会首选侵入性冠状动脉造影,可以在必要时进行。基于人工智能的诊断方法已被用于分析冠状动脉病变功能学评价,迄今为止结果不一。Cho等人的一项研究表明,总的来说,血管造影功能学分析的准确性可能接近82%的FFR。
在过去的十年里,用于冠状动脉介入治疗的磁导航系统和机器人技术已经出现,但一直受到高昂成本和低效界面的阻碍。人工智能引导的血管通路和介入设备导航到病变部位将是可行的,多模式技术将实时热、超声和流量数据与机器人和以前获得的诊断计算机图像融合在一起。同样,通过人工智能引导设备进行冠状动脉血运重建或药物治疗也是可行的,心脏介入团队可以在不暴露于电离辐射的情况下监测和控制设备。能够自动导航到动脉粥样硬化区域并提供靶向治疗的纳米颗粒已经在开发中,内部和外部的磁性引导和配体连接聚集,可以进一步产生有益的效果,同时最大限度地减少对其他器官的不利影响。
瓣膜疾病、先天性和后天异常以及生命维持技术也将是人工智能应用的主要领域。将来在心导管实验室,在时间和空间上实时评估和整合患者解剖结构信息,结合自体活细胞和聚合物刚性金属复合材料,进行3D打印,可能介入心脏病学的一个重要方向。
目前心力衰竭(HF)诊治模式不成熟,诊断延迟常见,心力衰竭的许多危险因素并没有认识,治疗和控制相对较低。大多数射血分数减低和射血分数保留的心衰患者没有接受已被证明的降低死亡率和发病率的治疗或者在进行低剂量的治疗。此外,HF表型的病理生理学特征仍处于研究阶段。人工智能支持的策略有潜力解决这些问题。
临床试验证实,心衰预防可显著降低心衰发病率。心衰预防需要一种方法来识别心衰风险患者和心衰预防干预过程。心衰风险识别部分可以帮助集中干预这部分患者,从而提高可行性,降低总体成本。干预部分的效果将决定整体人群心衰防治的效益。
目前心衰危险评分应用于临床少见。Ng等人开发了监督ML算法,利用EHR数据预测突发HF。ML算法预测未来HF的AUC约为0.79,在检测即将到来(6个月)HF时更为准确。虽然AI算法可能没有比传统模型更好的预测价值, ML算法嵌入到电子健康档案可以为医生提供即时风险信息(病人),可以调整随着时间的推移风险的变化,如果危险因素变化,并整合心电图或图像分析、可穿戴设备和其他数据,风险预测算法可能会更精确的预测个体独有的风险因素。
未来人工智能心衰风险评估工具的开发,预先与有计划的干预相结合,以降低心衰发病率。这些干预措施可以包括一种新的治疗模式,一些特定的治疗药物或智能决策,以鼓励临床医生和患者治疗心衰危险因素。临床试验应该评估风险预测和干预策略,以验证采用有效的策略来降低心衰发病率。
心衰住院预防措施也需要一种方法来识别有风险的患者和住院防治监测。传统的统计模型在再入院预测方面的性能较差,而且基于人工智能的模型也受到了限制。有三项研究使用监督ML(包括大队列的DL算法)来预测心衰住院后的再入院,报告的AUC从0.63到0.71。因此,需要更多的工作来提高不同算法的预测能力,识别心衰再入院的风险。
虽然ML可能提升风险预测,但更令人烦恼的问题是,一旦认识到风险增加,如何防止再入院。医疗机构为减少再入院而采取的多种策略所产生的影响微乎其微。使用外部远程监测系统或植入设备(除颤器或起搏器)诊断的远程监测在防止入院或再入院方面是无效的,只有基于肺动脉压的远程监测策略被证明对减少心衰住院有效。最令人震惊的是,减少再入院的策略与心衰住院后短期和长期死亡率的增加相关。因此,必须在临床试验中仔细研究人工智能的住院风险预测和新的干预策略,以确保有效性和安全性。
人工智能分析可以在心力衰竭患者实时提供可操作的信息,通过识别那些确诊患者,有无按照规定GDMT或接收的最佳剂量,有无依从治疗计划,或最有可能受益于某些特定的心衰疗法。这类人工智能生成的信息可以以更新颖的、便捷、智能的方式提供给患者和医生,这些信息可能会影响患者的治疗 (为患者提供决策辅助、特定问题的医生或患者教育、支持联系,或其他区域或卫生保健系统特定的资源)。这种方法更类似于高度成功商业的人工智能分析所提供的数据,而人工智能在医疗保健领域的应用尚未达到这种成功水平。
目前,HF的广泛特征是EF和推测的病因。非监督ML分析(如聚类分析)可以识别独特的HF表型,然后使用传统统计方法或监督学习技术来确定所识别的表型是否具有不同的预后或对治疗的耐受性或反应。此类分析已在HFpEF和HFREF的HF患者中进行B体育,使用临床数据作为输入变量,确定具有不同预后的HFpEF和HFrEF表型。将来需要临床特征以外的数据比如基因组、蛋白质组数据、微生物组、新的临床数据,心电图或图像分析,来进一步诊断心衰患者的表型,可以通过新的治疗靶点或诊断/预后生物标志物识别独特的病理生理变化,并确定其精确性或新的心衰治疗方法B体育。
冠心病的研究已经产生了一些概念,这些概念被认为是现代医学的基础,包括识别和添加相关条件的风险因素到风险分层的整体模型。人工智能的定位是通过分析大量的变量,识别非线性关联,并帮助识别新的危险因素。
目前,在冠心病和动脉粥样硬化性心血管疾病的初级风险分层中最常用的工具是美国心脏病学会/美国心脏协会联合队列方程风险计算器,这是一种有价值但不精确的工具。使用相同的9个传统风险因素,ML算法能够显著地改善风险分层,包括发现13%的高风险个体和推荐25%的低风险个体的他汀类药物治疗,部分原因是非线性关系的识别。相比之下,一项单独的研究使用了每个人多达735个变量来改进队列风险计算器,并强调了包括非传统风险因素的重要性。有趣的是,与在算法中包含大量数据后的预期相反,与前面提到的仅使用标准CAD风险因素的算法相比,使用数百个变量的预测性能并没有更好。
机器学习是一种创新和强大的工具,可以将非传统和未知的危险因素纳入心血管风险分层。例如,利用生物信号如视网膜眼底图像作为生物样本库的一部分,并在没有任何其他临床特征的情况下用于预测心血管风险因素。同样,通过使用ML算法通过智能手机录音进行的语音分析揭示了与CAD相关的特征。这些例子只是许多可能有用的新数字生物标记信息中的一小部分。预测动脉粥样硬化性心血管事件的方法可能需要改变一些公认的范式,例如时间范围评估结果低于10年的随访,使用串行数据获得多个时间点,并考虑更多的无监督学习方法而不是选择变量生物合理性。
在一个医学知识不断增长和病人管理的复杂性日益增加的时代,对诊断和治疗选择,需要标准化的方案。事实上,应授权将CDS系统与电子病历相结合,向医护人员提供最新的医学知识和循证指导。直到最近,大多数部署在医疗保健中的CDS系统都仅限于访问电子病历中的结构化数据,如实验室结果。然而,非结构化临床叙述中的信息可能会被NLP提取。以前,NLP工具仅限于研究,并没有用于生成自动输入到CDS系统。重要的是,利用NLP来搜索数字电子病历的电子工具也能够为CDS程序提供自动输入,从而提供针对患者的个性化信息,以便在治疗时以患者为中心做出决定。为了实现这种情况,进行自然语言处理,以提供高性能、可扩展和实时的解决方案。梅奥诊所最近报道了这种方法对特定疾病的可行性,方法是将经过验证的基于规则的NLP算法安装到梅奥诊所EHR的大数据基础设施中,从而为外周动脉疾病患者的CDS系统生成个性化输入。还能够显示相关的实验室检测结果和外周动脉疾病患者的自动预后评估,使用结构化数据元素和自动风险计算器,这些数据来自基于社区的研究生成的模型。原则上,类似的方法将可能用于广泛的其他心血管健康疾病,建设标准化和高质量文档的医疗保健系统,最终实现将正确的信息在正确的时间为正确的病人提供正确决策。
人工智能(包括ML和DL)可应用于全基因组测序、移动设备生物识别和EHR数据处理。机器学习正在改变心血管疾病的诊断、风险预测、预防和治疗方法。这些新方法提供了可观的前景,包括快速整合大量数据,个体化的诊断和治疗,以及潜在关系的评价。然而,它们确实产生了新的方法论上的挑战。表型必须标准化,优化其可靠性,数据集成等。数据的可追溯性、有效性和再现性必须体现。在研究设计和结果解释时,必须考虑新的偏倚,包括地理、人口和社会经济地位造成的数字鸿沟和互联网接入差异等。最后,必须考虑到数据缺失和治疗方式的变化。的确,与原始数据收集不同,医疗记录数据是在给定的临床事件中收集的,直接与患者的健康状况和求医行为以及临床医生的治疗有关。因为决定观察时间的是病人和医生,而不是研究人员,所以从数据中得出的结论会有所不同。这些重要问题强调了团队科学的重要性,将临床医生、数据科学家和统计学家聚集在一起,以确立这些工具的有效性和可靠性。
目前的方法和评分系统对于有效的临床应用来说往往过于繁琐,并且在不同人群中不能很好地复制,因此在临床上必须提高病例识别和结果预测的准确性和有效性。除了电子病历的丰富数据之外,其他类型的结构化或非结构化数据也适用于ML技术。这些因素包括但不限于心电图、超声心动图和其他影像学研究的数据。使用ML进行表型分析的一个例子是HFpEF患者的特征描述和这些患者的生存预测。Shah等人使用无监督ML,在HFpEF患者中确定了3个不同的组,通过监督学习,他们检查了不同组在死亡和住院方面的差异。这些有意义的结果需要在其他队列中验证,但从两一方面说明了人工智能可以应用到EHR的丰富环境中。另一个例子是Attia等人将人工智能应用于心电图数据,以识别无症状左心室44,959例患者出现功能障碍。训练一个卷积神经网络来识别心室功能障碍患者,定义EF为35%或更少,仅使用心电图数据。在52870名患者的独立测试中,网络模型的AUC值、敏感性、特异性和准确性分别为0.93、86.3%、85.7%和85.7%。这些研究结果说明了将人工智能应用于心电图数据,可以提供一种识别心室功能障碍的筛查工具。
可穿戴传感器在健康预防和疾病管理中的应用是一个有意义的课题,而人工智能在这个新兴领域的贡献是独一无二的。一个例子是使用智能手表数据来检测房颤数据。一个深度神经网络,使用依赖于R-R间隔近似表示的启发式预训练,与参考标准心电图相比,表现出有意义的性能。在9750名参与者中进行的这项研究建立了概念证明,与标准心电图相比,智能手表可以检测心房纤颤,但灵敏度和特异性有所降低。
由于人工智能在医学上的应用似乎越来越不可避免,我们必须静心思考实施中的困难。事实上,许多最初有希望的技术在更广泛的测试中失败的例子已经出现在其他领域的新闻上。这些例子包括面部识别软件在不同人群中的失败,刑事司法系统中特别令人担忧的例子,人工智能可能在其中错误持续下去,从而使不公平一直存在,甚至还有一些可推广性差的医疗筛查测试。
当用于训练算法的数据集质量差、多样性有限,或者它们反映结果的差异或现实偏倚时,就会出现这样的问题。“垃圾进,垃圾出”同样适用于人工智能技术。例如,从随机临床试验数据中获得的模型,在应用于从计费代码或从电子病历中提取的相对不精确的数据时,可能表现不佳。类似地,检测静态图像的DL方法不能区分病理生理学的重要特征和图像采集的伪影。因此,如果图像采集类型与疾病状态相关,则与图像采集类型(像素特征)相关的特征可能虚假地与特定结果相关。这些技术甚至可以暴露系统性的偏倚,例如,如果某一特定的亚组患者更有可能被拒绝给予挽救生命措施干预(如心脏移植),那么风险预测模型可能会错误地确定他们不太可能受益。因此,我们必须意识到,执行不力的人工智能有可能误导我们,它甚至可能恶化、扩大和加剧医疗保健差距,这是在尝试开发或实施人工智能算法时,都必须考虑的一个因素。同样,无论是在医院、地区还是国家一级,在财政资源非常有限的情况下,实施人工智能很可能具有挑战性。如果提供人工智能仅限于高收入人群,这一因素可能加剧医疗保健的不平等。尽管与医疗保健专业人员的能力或判断相关的错误将仅限于特定的个人评估或治疗的患者,但如果人工智能算法得到广泛应用,可能会出现成千上万或数百万人次的错误。当解释结果和应用技术实践时,临床医生必须能够认识到这些陷阱,一个有用的方法可能是跟踪给定技术从初始到应用程序的开发。首先,我们必须检查构成培训过程基础的数据输入。数据质量高吗?它们是如何收集的?它们是否与目标应用程序数据集和人口相似? 接下来,我们应该检查模型性能。这个评估必须超出曲线下面积的区域。这些发现有多可靠?研究者是否提供了亚组分析和外部验证?接下来,我们可以检查模型是如何应用的。应用程序数据集是否类似于派生数据集?模型性能是否可以根据标准定期测试?最后,我们可以把模型的结果放在我们已知的环境中。这些发现是否与我们自己的临床直觉或使用其他方法的临床指导一致?只有采用系统的方法,我们才能对这些危害保持警惕,确保在医学中负责任地使用人工智能。
人工智能在大数据和开放科学时代蓬勃发展。研究人员现在能够将大量数据与复杂的算法结合起来,生成可以媲美甚至超过人类表现的统计模型。2009年Netflix Prize等竞赛数据的公开发布,通过昂贵的研发工作,刺激了创新,从而有机会赢得大笔奖金。医疗保健部门采取类似策略的速度较慢,部分原因是与健康相关数据的数据共享限制。这种情况引发了一个问题,在世界范围内共享电子病历中包含的丰富数据的障碍是什么?围绕共享健康职业相关数据的问题在全球各地各不相同,而且正在迅速演变。然而,一些学术期刊制定了数据共享政策,要求公开共享可能与这些规定相冲突的数据。尽管传统研究倾向于分享容易被识别的数据,但人工智能现在正在使用大量更难、甚至可能既往不可能被识别的数据。前进的道路可能是通过战略伙伴关系。如何共享,甚至是否共享数据,都需要根据具体情况来决定。此外,还有一个问题是,如果合作组织不复存在或被另一个组织机会主义地收购,会发生什么情况。当谷歌获得了DeepMind数据档案的访问权限后,人们意识到了这一点,这实际上终止了之前不公布数据的承诺。尽管如此,我们必须继续加快努力,通过协作和获取数据来促进医疗保健。
心脏病学处于人工智能在医学领域的前沿,在信号处理、图像分割和结构化数据分析方面取得了重大进展。近年来在心脏病学的几乎所有领域都取得了重大成就,在心电图分析、影像研究的自动解释和风险预测方面取得了一些具体进展。然而,人工智能很容易在解释、有效性和概括性方面出现重大错误,以及需要提前解决的安全和伦理问题。很明显,人工智能需要计算机科学家、临床研究人员、临床医生和其他用户之间的密切合作,以确定最相关的问题,并找到解决问题的最佳方法和数据来源。这项合作证明,人工智能在心脏病学和医学领域的未来是光明的。