Harvey 将法律代理基准扩展到合同谈判

Harvey 扩展了其法律代理基准 (LAB)，新增了 500 项任务，重点关注内部法律团队的合同起草、审查和谈判。

Harvey Expands Legal Agent Benchmark to Contract Negotiation

Harvey 是法律工作流程人工智能领域的领先开发商，它扩展了其法律代理基准 (LAB)，纳入了 500 项新任务，重点关注合同起草、审查和谈判。该扩展程序于 2026 年 6 月 12 日发布，旨在评估人工智能代理处理合同谈判整个生命周期（从最初的草案到解决复杂的红线）的能力。

此更新针对的是内部法律团队，其中签约是一项关键但劳动密集型的职能。通过引入合同谈判作为核心指标，哈维希望解决企业法律工作中最微妙和高风险的领域之一。合同涵盖数十种原型——从保密协议到庞大的信贷协议——每种都有独特的要求、风险和监管考虑因素。

为什么合同很重要

合同是公司运营的支柱，管理与供应商、员工和合作伙伴的关系。尽管合同法很重要，但它的灵活性造成了极大的复杂性。 Harvey 认为，这使得合同谈判成为人工智能的一个“长期”问题，要求代理适应与利益相关者进行多轮讨论时不断变化的环境。

LAB 的新任务模拟现实世界的场景，为代理商提供先前合同版本、内部备忘录和谈判手册等材料。任务按照“全部通过”标准进行评分——错过一个关键的危险信号就会导致失败。这一严格的标准反映了现场谈判所需的精确度，在这种情况下，疏忽可能会导致代价高昂的商业或法律风险。

例如，一项任务要求 AI 代理响应主服务协议上的红线。代理人必须评估拟议的变更，例如对故意不当行为的无上限赔偿，并确定是否接受、谈判或升级每个点。输出包括修订后的合同草案和总结已结束和未解决问题的内部问题清单。

LAB 如何融入市场

此举遵循了更广泛的行业趋势，即对人工智能法律工具进行基准测试。 2026 年 5 月，LegalOn 发布了一项研究，评估了 11 个人工智能系统对 3,282 份合同审查的情况，而 Spellbook 的“与市场比较”工具使律师能够根据汇总的交易数据对谈判条款进行基准测试。这些举措反映了从通用人工智能测试到针对法律工作流程量身定制的特定领域评估的转变。

LAB 的与众不同之处在于它注重行为透明度。哈维强调了解代理人决策过程的重要性，特别是在法律等监管环境中。通过将任务建模为谈判中的离散阶段，LAB 可以提供有关 AI 代理成功或失败的详细见解。

人工智能法律代理人的后续步骤

Harvey 的路线图包括三个关键研究方向：扩大任务多样性、使代理能够自主识别谈判状态以及与动态对应方开发交互式基准。最终目标是从支持谈判的代理转向自主运行谈判，将人工监督仅限于复杂或高摩擦问题。

虽然 LAB 目前的重点是合同，但 Harvey 计划在未来的更新中解决其他内部法律任务。这反映出人们对能够无缝集成到企业法律团队、降低成本并提高效率的人工智能工具的需求不断增长。

随着法律行业继续采用人工智能，像 LAB 这样的基准将在制定绩效标准方面发挥关键作用。通过模拟现实世界谈判的复杂性，Harvey 不仅测试了人工智能的能力，还塑造了法律工作的未来执行方式。

书签