当前位置 :
首页 >
最新资讯 >
实务分析和研究 >
专利
国内部 中国专利代理师
周蕾
人工智能(AI)是当前科技领域的最重要的热点之一,围绕人工智能技术的知识产权保护也是法律界以及创新主体关注的焦点。本文旨在结合实践经验,针对人工智能技术在中国申请专利给出一些建议,以期帮助创新主体更好地保护人工智能领域的技术创新。
一、人工智能技术在中国申请专利面对的主要法律规定
人工智能领域的技术方案通常涉及算法,因此在专利申请中需考虑专利法第二十五条第一款第(二)项中关于“智力活动的规则和方法”、以及专利法第二条第二款中关于发明专利的定义的要求。
此外,人工智能技术在医疗领域的应用日益广泛,利用人工智能技术进行医学数据的处理,以辅助诊断或治疗的技术方案,在申请专利时,会面临一个特殊的问题,即专利法第二十五条第一款第(三)项中关于“疾病的诊断和治疗方法”的问题。
以下笔者将结合实际案例,介绍目前中国针对以上法条的审查实践经验。
1、关于智力活动的规则和方法
在2020年2月1日开始执行的最新版中国《专利审查指南》(以下简称“审查指南”)中,针对涉及算法特征、商业规则和方法特征的专利申请的审查做出了新的、更为详细的规定。
根据审查指南第二部分第九章6.1.1以及6.1.2节的规定,权利要求中只要包含了“技术特征”,即,权利要求不仅仅是抽象的算法特征,则不应当依据专利法第二十五条第一款第(二)项排除其获得专利权的可能性。而对于一个包含了“技术特征”的权利要求,在其通过了上述第二十五条第一款第(二)项的审核后,还应继续审查其是否符合专利法第二条第二款的规定,即整体考虑权利要求中记载的全部特征,考察该项权利要求是否记载了对要解决的技术问题采用了利用自然规律的技术手段,并且由此获得符合自然规律的技术效果。
简而言之,涉及算法的权利要求必须包含“技术特征”,且符合三个“技术性”,即采用技术手段、解决技术问题、获得技术效果。
针对上述原则性的规定,审查指南以举例的方式给出了具体的判断方式,例如,如果权利要求中涉及算法的各个步骤体现出与所要解决的技术问题密切相关,如算法处理的数据是技术领域中具有确切技术含义的数据,算法的执行能直接体现出利用自然规律解决某一技术问题的过程,并且获得了技术效果,则通常该权利要求限定的解决方案属于专利法第二条第二款所述的技术方案。
针对上述规定,我们不免有类似于这样的疑问:“何为技术特征?”,“何为技术问题、技术手段、技术效果?”,“何为自然规律?”,技术与非技术之间,以及符合与不符合自然规律之间,是否有严格明确的界限呢?
遗憾的是,目前在中国的相关法规中,的确没有非常明确的关于“技术”、“自然规律”等概念的定义,关于这些规定的执行尺度更多的来自于审查实践经验的积累。因此,研究和总结典型的审查案例,对理解上述规定有很重要的意义。
以下笔者就与大家一起分享一些实践中的典型案例。
案例1
1. 一种CTR预估的方法,其特征在于,包括
原始特征训练步骤:将当前对象的原始特征处理后输入至深度神经网络的输入层,由所述深度神经网络的多个隐含层进行训练;
实时特征训练步骤:将当前对象的实时特征输入至所述深度神经网络的最后一个隐含层,与原始特征进行联合训练;
预估点击率输出步骤:通过所述深度神经网络的输出层输出当前对象的预估点击率。
本案驳回决定认为,权利要求仅仅是对神经网络的训练过程,没有应用到技术领域,因而权利要求要保护的对象仅仅是一种数学运算方法,属于人为制定和调整的算法规则,属于专利法第25条第1款(二)的智力活动的规则和方法,不能被授予专利权。
而复审决定撤销了驳回决定,并认为由于本申请应用于具体技术领域(CTR),即信息推荐领域,因此可知深度神经网络所处理的数据,如当前对象,应为所推荐的内容,因此当前对象的原始特征和当前对象的实时特征是具有技术性的并且应当理解为相关技术领域中通常具有的含义,因此,该权利要求的方案采用了对具有技术性的数据进行处理的诸如输入、训练、输出的技术手段,因此,权利要求整体而言,不属于智力活动的规则和方法,不属于专利法第25条第1款第(二)项规定的不授予专利权的情形。
案例2
1、一种保险的出险预测方法,所述方法包括:
获取待处理保险的保单信息;
将所述待处理保险的保单信息输入深度神经网络预测模型,预测得到所述待处理保险的出险数据,其中,所述深度神经网络预测模型的输入特征为保单信息,输出特征为出险数据,
其中,将所述待处理保险的保单信息输入深度神经网络预测模型,预测得到所述待处理保险的出险数据,包括:对所述待处理保险的保单信息进行预处理;将预处理后的保单信息输入深度神经网络预测模型,预测得到所述待处理保险的出险数据,
其中对所述待处理保险的保单信息进行预处理,包括:对保单信息中的被保险人数据按年龄进行离散化处理;对离散化后的被保险人数据进行独热编码;对编码后的被保险人数据进行归一化处理。
本案驳回决定认为,权利要求保护一种保险的出险预测方法,其通过离散化、独热编码、归一化等手段将其保单信息进行预处理,而这些预处理的手段实质上都是按照人为规定的方法,不构成技术手段,将预处理后的保单信息输入到深度神经网络中得出预测的出险数据,即采用基于保单信息预测出险数据的手段,解决的是如何预测保险出险数据,而基于保单信息预测出险数据不是符合自然规律的技术手段,同时解决的也不是技术问题,因此不是技术方案,不符合专利法第2条第2款的规定。
然而复审决定撤销了驳回决定,并认为,首先,对于权利要求的方案是否构成技术方案,应该从整体进行判断,不能仅因为含有“保单”或“保险”或“预测”等术语就认为不是技术手段,不构成技术方案,本申请涉及对于保单数据的处理,通过深度神经网络预测模型,对保单数据进行处理,其中采用了多种技术手段,将数据如何进行特征提取是人为设定的,但是这不影响采用相应的技术手段进行处理的技术性,本申请通过组合采用上述技术手段,可以获得出险数据,解决了人工处理保单数据耗时长,效率低的问题,不能认为得到的是出险预测数据就不符合自然规律。
案例3
1、一种深度哈希学习方法,其特征在于,所述方法应用于深度哈希神经网络,深度哈希神经网络包括分类全连接层、哈希层和聚类向量全连接层,所述方法包括:
获取训练数据、所述训练数据的语义标签、分类全连接层输出向量、哈希层输出向量和聚类向量全连接层参数向量,其中,所述训练数据为图片;
利用所述训练数据、所述训练数据的语义标签、所述分类全连接层输出向量、所述哈希层输出向量和所述聚类向量全连接层参数向量,计算一元哈希损失函数、分类损失函数和量化错误函数,其中所述一元哈希损失函数是基于所述聚类向量全连接层参数向量为聚类中心向量计算的;根据所述一元哈希损失函数、所述分类损失函数和所述量化错误函数,计算整体损失函数;将所述整体损失函数输入深度哈希神经网络中进行反向传播; 训练反向传播后的深度哈希神经网络,得到哈希函数,所述哈希函数用于生成哈希码,所述哈希码用于图像检索。
审查意见认为,权利要求解决的问题实质上属于深度哈希学习算法的进一步改进,没有应用到具体的技术领域,并不是专利法意义的技术问题,其所要达到的技术效果也不属于专利法意义的技术效果,权利要求的限定部分都是在数学意义上的神经网络算法改进过程,并非技术手段,不符合专利法第2条第2款的规定。
申请人对权利要求进行了修改,增加了划线部分,即明确了权利要求应用于具体的技术领域“图像检索”,输入、输出数据为图像,和用于图像检索的哈希码,本案在修改后获得授权。
笔者注意到,以上3个案例,体现了目前中国审查实践中针对涉及人工智能算法的案件的以下审查要点:
1. 权利要求需应用于具体的技术领域,例如案例1中的CTR、案例2中的保险出险预测、案例3中的“图像检索”;
2. 权利要求的输入、输出数据需在上述具体的技术领域中具有技术含义,例如案例1中的当前对象(所推荐的内容)、预估点击率,案例2中的保单信息、出险数据,案例3中的“图像”、“用于图像检索的哈希码”。
在笔者的实践经验中,以上两点的确是目前针对涉及算法特征的权利要求的基本要求。这与审查指南中给出的示例性的判断方式:“权利要求中涉及算法的各个步骤体现出与所要解决的技术问题密切相关,如算法处理的数据是技术领域中具有确切技术含义的数据”是一致的。
此外,案例1、2均是驳回后,经复审撤销驳回决定的案例,我们也能够看出对于这一领域,不同的审查员之间、实审与复审之间,存在着一定的审查尺度上的差异,这给专利申请能否授权带来不确定性,同时也带来了更多的尝试空间。
案例4
5、一种对用于控制、预测或诊断的分层型神经网络进行学习的判别器学习方法, 该分层型神经网络由具有节点的输入层、中间层以及输出层构成,其中,该判别器学习方法具有以下步骤:
存储分层型神经网络中的节点之间的权重; 存储学习数据; 存储训练数据;
根据存储的所述训练数据,计算分层型神经网络中的多个节点之间的权重的多个校正值,所述分层型神经网络具有根据纠错码的校验矩阵形成的疏耦合;
利用所述校正值更新所述节点之间的权重值;以及
使用更新了权重值后的分层型神经网络进行判别,求解分类问题或者回归问题,其中,在输入存储的初始化后的权重或者学习中的权重并输入存储的学习数据时,将使用所述初始化后的权重或者学习中的权重和所述学习数据的判别结果用于权重的学习,并且,在输入已学习的权重并输入判别数据时,将使用所述已学习的权重和所述判别数据的判别结果输出给外部的传输装置。”
本案驳回后,复审决定也维持了驳回决定,复审决定认为,本申请实际要解决的问题是如何实现分层型神经网络/算法数学模型高速化的问题。上述问题是一种算法数学模型计算问题,不属于专利法意义上的技术问题……上述手段并未与具体的技术领域相结合,其实际采用的手段是自定义校正值、权重值配置,属于人为规定,其中所涉及的数据不具有专利法意义上的技术性含义,而是通用的算法数学模型数据,通过通用计算机架构对上述非技术性数据执行存储、计算和更新等算法数学模型程序的过程,不属于专利法意义上的技术手段……上述分层型神经网络装置实质上是一种算法数学模型。就“用于与控制、预测或诊断”而言,是算法数学模型的功能属性,并非专利法意义上的具体的技术领域……不符合专利法第2条第2款的规定。
案例5
1、一种确定统计模型参数的方法,用于基于N个数据点确定统计模型的参数,其中N为大于或等于2的整数,其特征在于,包括:
接收包括N个数据点以及N个数据点的D个属性的数据集以组织成输入矩阵,其中D为大于或等于1的整数;
根据所述输入矩阵,设定K个聚类中心、所述参数的初始值以及后验概率矩阵 的初始值 ,其中,后验概率 表示第n个数据点在第k个聚类中心上的后验概率,其中K为大于或等于2的整数,1≤n≤N,1≤k≤K,以及根据 以及所述参数的初始值计算 ;
……
根据各数据点在各所述聚类中心的残差 ,针对所述M个数据点中的每个数据点,分别从所述K个聚类中心中选出残差 最大的L个聚类中心;
其中,N为用户数量,每个用户包括D个属性,具有所述参数的统计模型用于对用户进行聚类,以确定每一类用户的消费习惯。
本案驳回后,复审维持了驳回决定,复审决定认为,……虽然其中提到了“N为用户数量,每个用户包括D个属性,具有所属参数的统计模型用于对用户进行聚类,以确定每个用户的消费习惯”,但权利要求的方案中并未体现各个参数在该领域中的具体含义,也就是说,权利要求并未真正与确定用户消费习惯这一领域进行结合,因此权利要求并未结合任何的应用领域……上述手段的实质是算法本身……不符合第2条第2款的规定。
案例4和案例5都从反面印证了笔者针对案例1、2、3总结的经验,即“具体技术领域”和“输入、输出数据有具体技术含义”是基本要求。其中案例4的领域“用于控制、预测或诊断”太过笼统,未体现具体技术领域,输入、输出数据“训练数据、权重、判别数据”等没有具体技术含义,而案例5中,输入、输出数据“数据点、聚类中心”等没有具体的技术含义,因此两案都未能授权。
2. 关于疾病的诊断和治疗方法
根据审查指南第二部分第一章第4.3节的规定,疾病的诊断和治疗方法,是指以有生命的人体或者动物体为直接实施对象,进行识别、确定或者消除病因或病灶的过程。但是,用于实施疾病诊断和治疗方法的仪器或装置,以及在疾病诊断和治疗方法中使用的物质或材料属于可被授予专利权的客体。
审查指南4.3.1.2还规定,以下几类方法是不属于诊断方法的例子:
(2)直接目的不是获得诊断结果或健康状况,而只是从活的人体或动物体获取作为中间结果的信息的方法,或处理该信息(形体参数、生理参数或其他参数) 的方法;
(3)直接目的不是获得诊断结果或健康状况,而只是对已经脱离人体或动物体的组织、体液或排泄物进行处理或检测以获取作为中间结果的信息的方法,或处理该信息的方法。
对上述(2) 和(3) 项需要说明的是,只有当根据现有技术中的医学知识和该专利申请公开的内容从所获得的信息本身不能够直接得出疾病的诊断结果或健康状况时,这些信息才能被认为是中间结果。
关于疾病的诊断和治疗方法,审查指南主要从“直接实施对象”(有生命的人体或动物体)和“直接目的”(诊断或治疗)两方面进行规定。而对于输出结果为“中间结果”的方法,则要求“根据现有技术中的医学知识和该专利申请公开的内容从所获得的信息本身不能够直接得出疾病的诊断结果或健康状况”。
然而,笔者注意到,从一些案例也可以反映出,在目前的审查实践中,对“疾病的诊断及治疗方法”的审查标准可能比指南的规定更为严格。以下是两个比较典型的案例。
案例6
1、一种面部毛孔检测方法,其特征在于,所述方法包括:
获取待检测皮肤的皮肤图像;
利用训练好的卷积神经网络模型对所述皮肤图像中的毛孔图像进行识别;
对识别出的毛孔图像进行图像处理,得到毛孔的量化指标,所述量化指标包括毛孔色差量化指标、毛孔面积量化指标和毛孔密度量化指标中的任一种或任意组合。
本案驳回决定认为,权利要求请求保护一种面部毛孔检测方法,所用到的“皮肤图像”是直接以有生命的人为对象而获取的,以检测出有生命的人体不同的皮肤状态等级为直接目的,根据其说明书记载可知:“皮肤状态,包括根据毛孔量化指标、毛孔粗大的程度,划分为正常皮肤、精度毛孔粗大皮肤、中度毛孔粗大皮肤等不同的皮肤状态等级;也包括根据毛孔粗大的医学诊断结果,划分为单纯性毛孔粗大、皮肤溢出型毛孔粗大等皮肤状态”,也就是说,根据该方法,可以直接获得毛孔粗大的医学诊断结果,属于疾病诊断的目的。因而其属于专利法第25条第1款第(三)项所述的疾病的诊断和治疗方法的范围,因此不能授予专利权。
该案例的权利要求中,方法的直接实施对象实际是“皮肤图像”,并非人体皮肤本身,方法的直接目的是得到“皮肤量化指标”,而并非直接的皮肤疾病的诊断结果。但是驳回决定认为,“皮肤图像是直接以有生命的人为对象而获得的”,这相当于扩大了指南规定中“对象”的范围。并且,说明书中有关于根据皮肤量化指标能够得到诊断结果的描述,因此不符合指南中所规定的“只有当根据现有技术中的医学知识和该专利申请公开的内容从所获得的信息本身不能够直接得出疾病的诊断结果或健康状况时,这些信息才能被认为是中间结果”的规定,导致该案最终无法授权。
案例7
9、一种穿刺路径规划方法,其特征在于,所述方法应用于穿刺路径规划装置,所述方法包括:
获取被测对象的预设区域的超声图像;
根据所述超声图像上被测对象体内的目标区域的定位点的定位位置、所述定位位置与被测对象体表之间的第一距离以及被测对象体内的目标点的定位区域,规划到达目标点的第一穿刺路径,其中,所述第一穿刺路径包括针对被测对象体表的第一穿刺点位置、第一穿刺夹角以及第一穿刺距离;
显示所述超声图像以及所述第一穿刺路径。
本案审查意见认为,权利要求涉及一种穿刺路径规划方法,其中限定了根据获取到的被测对象体内的超声图像信息,对穿刺部件的穿刺路径进行规划等步骤,并根据路径规划结果,对医生在实施手术过程中的穿刺操作进行指导。由此可知,该穿刺路径规划方法的实施对象实质上是有生命的人体,其是一种为实施外科手术治疗方法而采用的辅助手段,属于疾病的治疗方法,因此,权利要求属于专利法第25条第一款第(三)项规定的疾病的诊断和治疗方法的范围,不能授予专利权,本案权利要求中,方法的直接实施对象为“超声图像”,所得到的结果为“第一穿刺路径”,方法本身是一个“从数据到数据”的数据处理过程,并没有涉及治疗或介入人体的操作。但是审查意见认为该方法“是一种为实施外科手术治疗方法而采用的辅助手段,属于疾病的治疗方法”,不予授权。从该案可以看出,目前的审查实践对疾病的治疗方法的审查标准,比指南中的“直接实施对象”和“直接目的”的标准更为严格,如果方法的结果是为了辅助治疗(例如辅助外科手术),那么尽管方法本身没有以有生命的人体或动物体为直接实施对象、没有以治疗为直接目的、也没有介入生命体的步骤,仍然有可能以“疾病的治疗方法”为理由不予授权。
二、专利申请文件撰写建议
基于以上法律规定以及案例,笔者针对涉及人工智能算法的技术方案在中国申请专利,给出如下的专利申请文件撰写建议,供读者们参考。
(1)由于训练过程不易取证,建议尽可能部署应用过程的权利要求。
(2)针对客体问题,我们建议权利要求中必须体现算法所应用的具体技术领域,例如图像识别、出险评估等。如果权利要求中仅限定算法应用于比较笼统的技术领域,例如“控制”、“分类”等,则有一定的驳回风险。
权利要求中算法要与具体技术领域紧密结合,即,至少算法的输入、输出数据应在该具体技术领域中有技术含义。如果算法的输入、输出数据是没有技术含义的数据,例如“样本”、“训练数据”、“聚类结果”等,则有一定的驳回风险。
说明书中应从技术角度写明技术问题和技术效果,尽量避免以数学意义上的效果、或用户主观体验等作为直接甚至唯一效果。
建议说明书中给出算法在具体技术领域的应用场景中如何执行的示例,并配以应用场景的示意图。
这里要特别注意的是,根据当前审查指南的规定,如果权利要求的本质是抽象的算法,那么即便在权利要求中加入处理器、存储器等通用硬件,并限定算法由这些硬件执行,仍然难以降低因客体问题而被驳回的风险。
(3)对于与医疗相关的方案,权利要求中方法的输出结果,不应是“根据现有技术中的医学知识和该专利申请公开的内容”能够直接得出疾病的诊断结果或健康状况的信息,说明书中也建议不要体现出该输出结果能够直接得出疾病的诊断结果或健康状况。
权利要求不应涉及与辅助治疗、介入人体等有关的步骤,特别建议也不要出现相关敏感词汇,例如“穿刺”、“切割”等。
说明书中,建议不要以诊断或治疗(包括辅助治疗)作为直接要解决的问题或直接实现的效果,可改为“提高图像识别精度”、“提高路径规划效率”等非医疗目的问题或效果。
此外,对于涉及医疗的人工智能算法方案,建议部署装置权利要求,包括与方法对应的程序模块架构权利要求,以规避疾病的诊断和治疗方法问题。
以上为笔者结合实践经验和法律规定给出的一些建议,希望对大家有所帮助,也期待与大家共同探讨。