前沿科技
从“白盒获取”到“黑盒逆向”:算法与模型保护机制的挑战与应对
前言在数字经济浪潮中,算法与模型被视为互联网企业的“灵魂”与核心商业资产。随着生成式人工智能(AIGC)的快速发展,算法或模型保护的着力点已经从过去的底层代码、结构和参数的“白盒获取”向算法功能的“黑盒逆向”甚至“模型蒸馏”演进。从互联网业态来看,不同互联网产品之间的交互和碰撞也从流量和数据的争夺向算法和模型所支撑的竞争利益的保护转变。若行为人并未直接获得底层代码、结构和参数,则难以套用著作权和商业秘密的“接触+实质性近似”的框架进行分析。《反不正当竞争法》第二条的原则条款提供了免“接触”要件的解决方向,但仍需对行为和后果进行综合分析,在激励创新的同时避免对行业的“寒蝉效应”。本文所讨论的司法案例揭示了算法和模型侵权模式的演变,也为我们思考人工智能大模型时代下的“黑盒逆向”甚至“模型蒸馏”行为提供了重要的现实启发。01传统算法和模型保护的行为导向:以违法使用他人智力成果为核心在计算机科学领域,算法是指特定的计算步骤和逻辑,一般表现为计算机程序代码。模型则是基于算法和数据训练得到的产物,具体表现为特定的结构和参数。对于算法和模型的法律保护,往往遵循著作权法或商业秘密中保护智力成果的一般逻辑,即采用“接触可能性+实质性相似(−合法来源)[1]”的判定框架。在商业秘密和著作权保护之外,在先案例(2023)京73民终3802号案(以下简称“3802号案”)已开创了援引《反不正当竞争法》第二条保护模型的结构和参数的先例。该案整体论述逻辑也沿袭了“接触可能性+实质性相似(−合法来源)”这一路径,即:法院审查的重点在于行为人是否直接获取并抄袭了权利人的模型结构和参数。3802号案属于典型的“白盒获取”情形。在3802号案中,原告为研发“变身漫画”特效模型投入了巨大的商业成本。证据显示,原告聘请了10名专业手绘师,历时11个月手工绘制了50,696张漫画图用于模型训练,实际支付费用达171万元。相比之下,被告推出的同类特效,其模型结构和参数与原告高度重合(司法鉴定显示相似比例高达91.7%)。法院认定,由于特效模型随APP发放至用户终端本地运行,技术人员可以通过技术手段提取,因此被告具备接触可能性。在被告无法证明合法来源且在短时间内打破原告技术壁垒的情况下,法院依据《反不正当竞争法》第二条,认定这种直接利用他人智力成果(即模型的结构和参数)的行为破坏了公平竞争秩序。在对算法或模型的“白盒获取”的情形中,无论是基于工程师事先定义的传统算法(一般以海量行数的代码为载体),还是基于算法和数据训练得到的模型(主要以大模型结构和参数为载体),权利人均可以作为商业秘密或著作权进行保护。如果不具备商业秘密保护的条件(如缺乏保密措施或可以反向破解)或著作权保护的条件(模型参数一般不构成著作权),则可以将被直接获取的智力成果部分作为反法下的竞争优势进行保护。无论是商业秘密、著作权还是反法,判断侵权的前提通常是被告可能获取了企业的内部代码或解密了本地运行的模型参数,这种情形可以采用“接触可能性+实质性相似(−合法来源)”框架的判定标准进行分析。02人工智能时代的新挑战:从“白盒窃取”到“黑盒逆向”的技术演变传统的算法和模型保护高度依赖于对源代码或模型参数等物理载体的控制。然而,生成式人工智能的崛起,使得竞争从代码层面的窃取转向了更高层级逻辑层面的“模拟”。如果采取上述传统行为导向的审查思路,由于反向推导是基于公开数据的观察,行为人完全可以辩称其从未接触过原告的保密代码或模型结构和参数。这使得传统的判定标准在逻辑上难以为继,亟需探索其他法律进路来有效规制“黑盒逆向”行为。与3802号案中对算法模型“白盒”结构的直接获取不同,(2025)浙01民终3998号案(以下简称“3998号案”)揭示了不依赖“接触”保密载体而获取或影响算法逻辑的可能性。在该案中,法院认定的原告平台的核心竞争力在于“真实、可靠”的种草文案和经验分享,平台为此制定了严格的规范以维护内容生态。而被告开发的AI工具,设置了针对原告平台的定向模块,为用户生成用于原告平台的“虚构”种草文案。法院认定被告所运营的AI工具将冲击原告平台“真实、可靠”的种草内容生态和经营管理秩序,该行为违反了《反不正当竞争法》第二条的规定。从本案的事实背景出发并结合人工智能发展,我们不难设想通过大规模观察平台的公开输出(如热门推荐位、高流量笔记、爆款内容分布),可能利用人工智能的分析能力进行“黑盒测试”,从而获取算法逻辑,这就是所谓的“黑盒逆向”行为。从技术角度看,“黑盒逆向”近似反向智能(Reverse-engineering AI),其核心是通过逆向思维对人工智能模型进行解析,将以“黑盒”形式部署的模型内部细节(如结构、参数、功能逻辑)进行推演。反向勾勒出算法的“偏好”,从而实现对算法效果一定程度的“复制”。为了反向破解推荐算法,攻击者可以训练一个与目标模型(如推荐系统)具有相同功能的“克隆模型”。推荐系统通常以黑盒形式对外提供服务(输入用户行为,输出推荐内容);攻击者可以发起大量查询,获取“输入-输出”对,从而构建训练克隆模型所需的数据集[2]。图1:反向机器学习流程图[3]通过“知识蒸馏”等多维度数据拟合技术(自动分析爆款内容的关键词密度、文本结构等共同点),克隆模型可以学习到目标模型的决策边界,从而精准模拟其推荐偏好。这种提供从数据还原到模型克隆的完整工具链,使得竞争者能够将黑盒化的推荐算法实质上“白盒化”,这正是AI时代企业算法保护面临的底层技术挑战。03规制“黑盒逆向”新进路:《反不正当竞争法》第二条下“实质性替代”的旧题新解面对传统商业秘密或著作权保护的局限,《反不正当竞争法》第二条原则条款为算法和模型的保护提供了一条切实可行的破局进路。适用该路径,需要跳出对物理层面代码或参数比对的执念,转而考察“黑盒逆向”行为人的整体活动是否符合诚实信用原则和公认的商业惯例。在这一进路的探索上,“北京某讯科技有限公司与上海某涛信息咨询有限公司不正当竞争纠纷案”((2016)沪73民终242号,“大众点评案”)早已提供了极具价值的裁判思路。该案法院创造性地保护了企业基于长期经营所获取的信息及由此衍生的竞争优势,并明确指出《反法》一般条款的适用需要综合考量劳动成果与竞争优势的“实质性替代”、公认的商业道德和诚实信用原则以及对产业生态与创新秩序的影响。借鉴该案的分析框架,我们可以着重从以下维度评估“黑盒逆向”行为法律定性:第一,劳动成果与竞争优势的实质性替代。大众点评案判决指出,擅自大量使用他人付出巨资收集、整理的信息,实质上替代了权利人向用户提供的服务,必然使得权利人的利益受到损害。同理,“黑盒逆向”虽然没有直接照搬代码、结构或参数,但如果其生成的克隆模型在功能和市场定位上对原模型构成了实质性替代,实质攫取了原权利人通过巨额算力和数据投入所形成的算法竞争优势,则具有不正当性。但应当注意的是,在无法获知模型结构和参数的情况下,评价模型之间功能的“实质性替代”的难度会更高,可能需要进行大量测试以及“输入-输出”的比对。第二,是否违背公认的商业道德与诚实信用原则。法院在大众点评案判决中强调,在没有对信息作出实质性贡献的情况下,大量使用他人的核心竞争资源,具有明显的“搭便车”和“不劳而获”特点,违背商业道德。对于“黑盒逆向”而言,如果行为人系统性地利用API或公开接口榨取目标模型的输出以训练竞品,这种行为可能偏离了正当的技术创新轨迹。第三,对产业生态与创新秩序的长期影响。大众点评案判决指出,如果不加节制地允许市场主体任意使用他人通过巨大投入获取的信息,将使得市场主体不愿再进行投入,破坏正常的产业生态,最终损害消费者和社会整体的利益。在人工智能领域,若放任无底线的“黑盒逆向”,将严重打击底层大模型厂商研发基础算法和积累优质训练数据的积极性,对技术的长远创新造成反噬。人工智能大模型的广泛应用使得获取他人高度保密算法的方式变得更加隐蔽和多样。在传统“接触+实质性相似”标准难以有效覆盖的盲区,通过《反不正当竞争法》第二条,综合评估行为对竞争秩序、创新投入以及商业道德的影响,将成为规制“黑盒逆向”这一类行为的重要且有效的法律进路。04展望与思考:“模型蒸馏”的争议“黑盒逆向”行为与近期引起广泛争议的“模型蒸馏”(Model Distillation)在技术上具有高度的相似性。两者皆在不接触目标模型保密载体(如权重、参数、源代码)的情况下,利用目标模型的“输入-输出”数据,去“复制”或“逼近”其所承载的算法逻辑与决策边界。面对这一技术变局,对“模型蒸馏”行为的正当性评估不应一概而论,而需在保护前期投入与鼓励技术迭代之间寻求动态平衡:首先,坚守技术中立原则与“模仿自由”的底层逻辑。从技术本质来看,“模型蒸馏”是一项旨在实现模型压缩、效率提升和知识迁移的中性技术。在知识产权与竞争法的基本法理中,“模仿自由”以及使用不受法定权利绝对垄断的信息,是一切技术和商业模式创新的基础。正如传统商业秘密保护体系允许合法的“反向工程”一样,在不突破技术保护措施、未接触保密源代码或原始权重的前提下,利用目标模型的公开输出接口获取“输入-输出”对来训练自有模型,本身具有促进技术扩散和打破大模型技术垄断的积极意义,不宜直接作否定性评价。其次,注意《反不正当竞争法》视域下的利益平衡与边界划定。当“模型蒸馏”的规制落入《反不正当竞争法》第二条的审查框架时,核心在于判断信息的使用是否超出了合理的边界。参照“大众点评案”的裁判逻辑,需要综合考量信息获取者、使用者及公众三方利益、实质性替代与投入产出失衡等因素。如果实施“模型蒸馏”的一方,其目的并非是为了研发垂直领域的创新应用或进行学术评测,而是利用极低的成本,系统性地“榨取”目标模型经过巨额算力投入训练出的决策边界,从而在相同的目标市场推出高度同质化的“克隆模型”。这种导致原权利人丧失交易机会的“实质性替代”行为,才可能因超出必要限度而具有不正当性。最后,防范对技术创新的“寒蝉效应”。在规制“模型蒸馏”等类反向工程行为时,必须配以审慎的司法态度。如果过分强调以竞争优势的损害结果为中心,而忽视对损害结果与违法行为之间因果关系的严格审查,极易将正常的市场优胜劣汰误判为不正当竞争,可能会对人工智能领域基于开源生态和API调用的二次创新造成严重的“寒蝉效应”。综上所述,对“模型蒸馏”行为的法律评估,应当回归到对行为正当性的精细化考量:既要制止那些纯粹旨在摧毁他人商业模式的恶意“搭便车”行为,又要为基于合法途径获取公开数据、致力于提升模型效能的正当研发活动留足合法的生存与发展空间。脚注:[1]著作权法下的“合法来源”抗辩一般仅指侵犯发行权和出租权的抗辩。[2]李长升,汪诗烨,李延铭,张成喆,袁野,王国仁.人工智能的逆向工程——反向智能研究综述.软件学报,2023,34(2):712-732[3]见上。
2小时前
2