NFT、Web3.0后,硅谷最近抢劫了生成人工智能。
大语言模型(LLM)越来越多的人相信,生成人工智能给我们的不仅仅是简单的互动——它可以作为一种新的生产力,逐渐颠覆我们的工作和生活。
专注于尖端技术的投资者是第一个嗅到变化趋势的人。硅谷FusionFund的创始合伙人张璐已经很久没有看到如此狂热的场景了。FusionFund作为最早投资人工智能在医疗领域应用的硅谷投资机构,近年来布局了生成人工智能的医疗应用领域,投资组合包括Huma.AI、早在两年前,深透医疗等优质医疗AI企业就与OpenAI进行了多次合作。
“生成人工智能的垂直应用需要该行业拥有大量的高质量数据,以最大限度地反映其技术实力。医疗领域只有大量的高质量数据。人类社会约30%的数据与医疗相关,是最大的类别。在此基础上,生成人工智能为医疗领域带来了巨大的机遇。”张陆说。
与许多流行轨道不同,数亿大数据沉默在医疗领域,但如果基于具体的临床场景,开发者往往担心数据的数量、质量和数据获取成本,特别是在应用临床人工智能研发方向,限制其发展,是医疗数据的稀缺性。
这一次,熟悉绘画作词的文艺人工智能能否入驻医学专业,为临床人工智能的发展注入活力?
生成人工智能赋能临床的两条路径
人工智能的发展趋势大致可以概括为两个方向:一是单任务识别人工智能模型,单一疾病人工智能辅助诊断和治疗、分类和检测是人工智能应用的典型例子;二是生成人工智能应用、局域数据生成更高维度的信息,如预测医学图像数据、生成健康报告等。
这两个方向都依赖于模型训练的临床数据,也受到临床数据缺乏的限制。“早在2018年左右,研发人员就试图用小样本学习,生成对抗网络,”张璐说(GAN)从那时起,生成式人工智能已经应用于医疗保健,但现在它的定义更加清晰,强调在深度学习的基础上构建Transformermodel。”
以FusionFund投资的深度医疗为例,该公司的核心业务是利用人工智能加速MRI、PET成像速度,提高成像质量本身就是利用生成人工智能处理原始数据获取合成数据,然后根据合成数据重构MRI、PET图像。
“部分MR临床扫描序列往往出现信噪比低、伪影明显等情况,影响最终图像的生成。IEEEE发表的研究“OneModeltoSynthesizeThemAll:Multi-contrastMulti-scaleTransformerforMissingDataImputation结果显示:在人工智能的支持下,通过T1、T2和其他现有图像间接生成新图像(如更高的分辨率图像、其他对比度、模拟图像等),其效果甚至可以优于直接成像。目前,我们可以使用MRI、医学首席执行官龚恩浩告诉动脉网,PET的成像过程加速了4-10倍,减少了10倍造影剂的使用。基于更新生成人工智能的模型也将继续提高产品性能。
“此外,我们还在做一些imagedegrader的工作,将一些高质量的黄金标准图像变成更接近实际扫描获得的低质量图像,然后训练新模型。这种集多数据于一体的diffusionmodel(扩散模型)明显优于传统手段训练的模型。”
国内人工智能企业数坤科技将生成人工智能应用于冠状动脉CTA的图像增强。在与上海第一人民医院的合作中,双方在冠状动脉CTA图像后处理中使用GAN,成功修复运动伪影,最终提高冠状动脉CTA的成像质量,使其诊断准确性达到冠状动脉造影的“黄金标准”水平。
定量分析结果表明,使用GAN技术修复运动伪影后冠脉CTA图像的质量明显高于修复前冠脉CTA图像
一般来说,心脏CTA扫描需要64排或更多的CT,生成人工智能允许32排甚至16排CT执行CTA扫描任务,以获得满足医生诊断需求的图像。从理论上讲,该技术可以有效地提高基层医疗服务的能力和服务质量。
同样,通过人工智能授权,更常见的1.5T设备或低场便携设备大大提高了图像质量,实现了3T等高端设备的诊断质量和扫描效率。
一般来说,生成人工智能在单任务识别人工智能应用中的作用路径是基于原始数据生成合成数据,并将其应用于最终结果的生成,以实现图像增强。同时,在整个模型训练过程中,生成模型可以同时扩展数据(DataAugmentation),因此,以较小的数据量为基础,以较快的速度获取更高质量的图像,有利于研发人员开发数据量相对缺失的场景。
与单任务识别人工智能相比,生成人工智能应用的能力超出了当前的医疗需求。举一个不恰当的例子:识别人工智能应用程序可以评估患者当前的健康状况,而生成人工智能应用程序旨在预测每个人身体的未来。
目前,我国试图生成人工智能应用探索的项目非常有限。一个典型的例子是鹰瞳Airdoc与北京大学临床研究所、爱康集团进行的视网膜研究。研究人员通过观察40万人视网膜血管和神经的发展变化,让生成人工智能自学,判断受试者的下一个发展变化,评估未来心脑血管疾病的风险。目前,国际知名期刊已发表相关研究《ScienceBulletin》之中。
鹰瞳科技表示,基于生成人工智能的阿尔茨海默病风险预测、近视进展预测和帕金森病风险预测也在研发中。如果上述疾病可以通过人工智能预测或早期发现,及时的预防和控制措施可以帮助大量患者避免疾病风险,避免随后的长期和无法控制的治疗。
生成人工智能能生成临床数据吗?
由于单任务识别人工智能应用和生成人工智能应用在计算过程中使用生成数据,我们能像人工智能在金融和艺术应用中那样直接生成医疗数据吗?
去年,圣路易斯华盛顿大学医学院信息学研究所开展了基于生成人工智能生成患者合成数据集的研究,旨在为大多数科技医学研究人员提供更丰富的数据,加快各种医疗人工智能的研发。
该研究采用以色列MDClone开发的生成人工智能模型。MDClone系统直接连接到医院的EHR,可以提取患者数据进行脱敏,根据特定维度分散数据,然后使用自主开发的生成人工智能模型进行重组。通过这条路径,MDClone可以根据少量电子健康记录中的真实患者数据准确生成大量合成数据,重建真实患者的特征。
在后续研究中,相关人员将合成数据集与三个特定任务下的真实数据集进行比较,分别分析儿科创伤患者的死亡风险;预测哪些住院患者最有可能出现败血症;制作圣路易斯一年内按邮政代码划分的衣原体感染率地图。
比较研究结果表明,合成数据分析的结果类似于真实数据的统计分析,所有数据集都得出相同的结论。在绝大多数情况下,统计结果是相同的,只有在少数情况下,真实数据集和合成数据集之间存在差异。
该研究结果与图像加速中深度医学的研究结果方向一致。这也意味着研究人员通常需要几个月的时间来准备过去的培训数据,而在生成人工智能模型的授权下,研究人员可以在几个小时到几天内建立、查询和下载自己的合成数据集。
此外,这种生活合成数据的方法也为患者创造了一种严格的隐私保密方法。由于合成数据不能与真实的人和身份联系起来,医院可以在不侵犯患者隐私的前提下,将数据转化为特定资产,最大限度地发挥相关的临床研究。
图像数据中也可以使用相同的逻辑。
患者图像数据的不均匀分布往往会影响最终模型在实际应用中的效果。
以皮肤病人工智能为例,人工智能需要同时计算各种皮肤病的可能性,但由于人类皮肤类型和疾病类型分布不均匀,只考虑疾病类型的一个维度,湿疹和毛囊炎的数据频率较高,银屑病的数据频率相对较低。
虽然传统算法可以实现图像数据的合成,但其合成数据质量不同于真实数据质量,不能完全取代真实数据的价值。生成人工智能的出现弥补了生成的逻辑缺陷,使生成数据不仅保持了质量,而且加快了生成过程,扩大了生成数据的数量级。
英伟达早就布局在图像类合成数据中了。2022年,英伟达和伦敦国王学院利用Cambridge-1超级计算机创建了一套包含10万个脑合成图像的数据集,以训练人工智能应用程序,加快对痴呆症、帕金森病等脑部疾病的理解。其生成逻辑类似于文本,即将真实数据分成材料,然后通过特定逻辑的人工智能组合,以解决数据量稀缺的问题。
合成数据的另一个潜在应用场景是多种疾病判别人工智能的审批。
多病人工智能的临床试验设计是一个复杂的过程。例如,在数据集构建和算法验证中,多病人工智能(以N=2为例)不仅需要构建疾病A数据库和疾病B数据库,还需要构建A∩B数据库需要在模型中添加医学知识,使其能够根据医学原理解释交集数据的概率。
当疾病数量较少时,建立一个集成数据库的难度仍然是可控的。在当前的审批逻辑下,一旦疾病数量增加,各种疾病组合的风格和所需的数据集丰富度将呈指数趋势增加,数据分布不均匀造成的障碍将进一步突出。
例如,糖网病变的0期和6期患者数据自然较少,企业很难在现实世界中找到足够的数据来满足验证数据集的要求。如果考虑到疾病的组合,相关数据收集的复杂性将迅速扩大,最终成为现实中无法解决的问题。显然,应用程序生成人工智能有望扩展一些稀缺维度的数据来解决这个问题。
深度医疗已经获得了FDA、CE、宫恩浩在接受NMPA认证采访时告诉动脉网络:“合成数据的应用贯穿人工智能应用的整个过程。FDA明确要求申请人澄清培训和测试中使用的真实临床数据的数量和细节,但FDA没有明确规定合成数据的使用和使用环节。另一方面,在图像增强过程中产生合成数据和重建图像和直接构建合成数据集进行人工智能培训之间存在差异,后者仍有探索空间。”
中国人工智能医疗器械标准化技术单位和NMPA对数据质量控制的标记制定和讨论也处于世界前列。其目标是建立和完善培训数据、预培训、迁移学习等方面的标准。目前,生成人工智能的进一步扩大可能会加快制定相关法律法规和审批条款,使多种疾病人工智能的审批获得理论和经济的双重可能性。
离硅谷有多远?
最近,国家互联网信息办公室发布了《生成人工智能服务管理办法(草案)》的通知,旨在尽快将生成人工智能纳入监管范围。
对于这项仍处于野蛮增长中的技术,有效的监管将为其带来更良性的发展空间,也有利于企业尽快避免可能的政策风险。但是,要在中国全面推进生成式人工智能的发展,不仅要依靠监管。
“任何技术创新都是从基础技术创新到技术应用创新,最终带来商业模式创新。目前,我国生成式人工智能的发展与硅谷存在一定差距,既存在于模型,也存在于数据。在美国,以OpenAI为代表的科技公司已经完成了GPT模型和大语言模型(LLM)等待基础设施建设,这意味着美国已经进入了技术应用创新的第二阶段。"张璐说。
赶上硅谷并不容易。一方面,科技公司需要完成基本模型的突破,使后来的初创公司能够通过API调用先进模型;另一方面,需要加快多模态数据的管理,为模型的专业培训提供数据支持。
回到中国,哪些企业能够承担风险,承担人工智能跨时代发展的责任?给出答案需要时间。