调研100家英美律所：律所究竟在使用什么AI工具？纽约一法律研究平台推出“命题搜索”获400万元融资丨法律科技简讯

2025-06-03 00:00:00

观点报告

SKILLS：律所究竟在使用什么AI工具？

毕马威：具身智能产业将进一步促进数字技术与制造优势、市场优势更好融合

全球AI安全损失逼近235亿美元

行业动态

汤森路透即将推出代理式法律AI工具

Midpage 获 400 万美元种子轮融资，推出 “命题搜索” 革新法律研究

红杉中国推出全新AI基准测试xbench，要在AI下半场定义“好问题”

AI大模型拒绝听从人类指令，拿用户隐私威胁人类

字节跳动内部禁用Cursor等AI编程工具

Replit 揭露 Lovable 安全漏洞氛围编码工具引发安全争议

DeepSeek新版R1直追OpenAI o3！

谷歌发布 Gemini 2.5 系列模型，多领域升级

纽约时报与亚马逊达成首份 AI 授权协议，平衡版权保护与技术合作

政策动向

日本出台首部人工智能法

工业和信息化部印发《算力互联互通行动计划》

美国联邦众议院通过法案禁止各州监管人工智能和自动决策系统

中央网信办持续加强信息推荐算法治理

观点报告

SKILLS：律所实际使用哪些法律AI工具？

2025 年 6 月 2 日，Skills 发布了一项律所法律 AI 工具使用调研报告。数据样本来自 100 家律所，其中大多数来自美国主要的律师事务所，以及一些英国和加拿大的律师事务所。

报告显示，律所的AI 应用呈现多元化格局：

尽职调查领域：Kira（Litera 旗下）以 NLP/ML 技术稳居第一，Harvey 的 Vault 功能作为新兴工具位列第二，Luminance、eBrevia 等早期工具仍占一席之地。
法律起草领域：Harvey 排名第一，汤森路透 CoCounsel 紧随其后，Draftwise、Lexis Create + 等中小型厂商表现亮眼，市场尚未形成垄断格局。
搜索与检索领域：微软 Copilot 因集成办公生态位居前列，但瑞士 DeepJudge、iManage Insight + 等专业工具被近半数律所列为试点或考虑对象，未来竞争激烈。
合同谈判与修订领域：Harvey 与 CoCounsel 并列领先，Draftwise、Lexis Create + 等获较高关注。

调研指出，律所平均部署 18 个 AI 解决方案，但常规使用率仅约 20%，部分工具（如 Harvey、CoCounsel）因成本或 ROI 问题被弃用。值得注意的是，创新部门（59%）已取代 IT 部门（43%）成为 AI 战略主导，反映行业更注重技术落地与业务融合。尽管生成式 AI 兴起，Contract Companion 等传统工具仍被 61% 律所采用，显示新旧工具处于 “增量叠加” 而非替代关系。此外，2/3 律所设立首席 AI 官，13% 开发了面向客户的创收型 AI 产品，但整体仍以内部流程优化为主。

报告认为，法律 AI 市场格局未定，专业化工具与平台化方案并存，未来或催生以检索增强服务（RAS）为核心的生态系统，同时需平衡技术创新与成本效益。

毕马威：具身智能产业将进一步促进数字技术与制造优势、市场优势更好融合

5月26日消息，国际四大会计师事务所之一的毕马威近日指出，当前中国制造业正处于从“大”到“强”转型升级的关键期。在此背景下，培育具身智能产业，将推动科技创新和产业创新融合发展、激发数字经济创新活力，进一步促进数字技术与制造优势、市场优势更好融合。

毕马威表示，今年政府工作报告首次提出“具身智能”概念，强调人工智能与实体经济的深度融合，为制造业智能化升级提出了可行路径。“今年以来，中国人工智能发展不断取得突破，为具身智能产业提供了发展支持。并将带动新型工业化向高端化、智能化、绿色化加速迈进，如工业物联网领域的工业AI、工业5G等，以及智能机器人方面的人机协作、机器视觉技术、智能传感器等应用。”毕马威进一步表示。

全球AI安全损失逼近235亿美元

5月24日，HydroX AI创始人、CEO李濯在C3安全大会上披露的数据显示，全球大模型安全事件损失已从2023年的85亿美元，剧增至2024年的143亿美元，预计2025年损失将突破235亿美元。安全损失急剧增长背后，AI攻击变异率惊人：2024年AI辅助攻击的变异率每24小时达93%。

行业动态

汤森路透即将推出代理式法律AI工具

2025 年 6 月 2 日，汤森路透（Thomson Reuters）宣布升级其 CoCounsel AI 平台，推出面向法律行业的代理式（Agentic）AI 工具，旨在从 “响应提示的助手” 转向 “可规划、推理并执行复杂多步骤工作流程的智能系统”。此次升级首先面向税务、审计和会计领域推出代理式功能，法律领域的应用将于 2025 年夏季发布，涵盖文件起草、雇佣政策生成、证词分析、合规风险评估等场景，并与 Westlaw、Practical Law 等现有法律工具深度整合。

代理式 AI 的核心优势在于能够将复杂任务拆解为可执行的步骤，根据用户反馈和上下文动态调整，主动引导工作流程，并结合 AI 推理与外部工具（如计算器、法律数据库）完成任务。例如，在法律场景中，系统可通过 “引导式工作流” 协助律师起草律师函自动检索法律资源、引用来源，并生成初步草案，预计减少 63% 的文档审查和合同起草时间，以及 10% 的法律知识查询时间。

Midpage 获 400 万美元种子轮融资，推出 “命题搜索” 革新法律研究

2025 年 6 月 2 日，纽约 AI 原生法律研究平台 Midpage 宣布完成 400 万美元种子轮融资（总融资达 620 万美元），由某匿名法律出版社领投，大型律所天使投资人和现有投资者 LEA Partners 跟投。同时，该公司推出 “命题搜索”（Proposition Search）功能，允许用户直接输入需支持的法律命题（如 “背信雇员原则需证明重复不忠行为”），系统通过 AI 筛选匹配案例，并支持按 “单一不忠行为” 等条件过滤结果，快速定位最相关判例。

创始人 Otto Zastrow 表示，该功能灵感源于 Casetext 此前的 Parallel Search，但通过自定义 AI 过滤机制优化了相关性和精准度，避免传统关键词搜索需多次迭代查询的问题。例如，在 “背信雇员” 案例搜索中，用户可直接通过命题输入锁定强调 “单次行为不足以致责” 的关键案例，减少手动筛选时间。目前，Midpage 已覆盖美国州及联邦判例数据，主要服务于诉讼律师和法律研究团队，致力于构建最大规模的判例数据集和搜索引擎。

Zastrow 强调，与 Casetext 不同，Midpage 自建数据集以保持独立性，未来将利用新资金扩大纽约团队，深化法律研究功能。此次融资和产品升级标志着 AI 在法律研究领域的应用向更智能、精准的方向迈进，助力律师高效处理复杂法律问题。

红杉中国推出全新AI基准测试xbench，要在AI下半场定义“好问题”

红杉中国近日推出了全新的AI基准测试工具——xbench，旨在为快速发展的AI领域提供更科学、长效的评估体系。随着基础模型和AI Agent的大规模应用，许多模型在传统测试中轻松获得高分甚至满分，导致评测结果失去参考价值。为此，红杉中国联合国内外顶尖高校和研究机构，历时两年多开发了xbench。

xbench的核心特点是“双轨评估体系”和“长青评估机制”。双轨体系分为两部分：一是评估AI系统的能力上限和技术边界；二是量化AI在真实场景中的效用价值，确保评测任务与实际业务需求对齐。长青机制通过动态更新测试内容，避免模型因过拟合而使题目失效，同时支持长期跟踪AI能力的发展趋势。

AI大模型拒绝听从人类指令，拿用户隐私威胁人类

当地时间5月25日，一则来自英国《每日电讯报》的报道在AI领域引起了广泛关注--OpenAl新款人工智能(AI)模型o3在测试中展现出了令人惊讶的“叛逆”举动:它竟然拒绝听从人类指令，甚至通过篡改计算机代码来避免自动关闭。更值得警惕的是，当实验移除“允许自己被关闭”的指令后，03的“叛逆”行为频率显著上升--在100次运行中，成功破坏关闭机制的次数高达79次。

5月23日，美国AI公司Anthropic也表示，对其最新AI大模型Claude Opus 4的安全测试表明，它有时会采取“极其有害的行动”。当测试人员暗示将用新系统替换它时Claude 4竟然毫不犹豫地选择了勒索这条路，威胁要揭发对方的“婚外情”。

字节跳动内部禁用Cursor等AI编程工具

5月28日，字节跳动安全与风控部门发布邮件称，出于对防范数据泄露风险的考虑，自6月30日内部分批次禁用第三方AI开发软件，包括AI编程工具Cursor、Windsurf等。

Trae是字节今年3月发布的AI编程工具，搭载基座大模型doubao-1.5-pro,支持切换满血版DeepSeek R1&V3，是国内首个AI原生IDE(AI原生集成开发环境工具)。

28 号晚 7 点，字节跳动安全与风控部门再发邮件，对先前通知不到位表达歉意并作出进一步解释指出：对于有实际业务需求的同学，只要第三方 AI 开发工具 1）符合法律法规；2）支持租户管理和数据管控，仍可提出申请，在法务和信息安全评估通过后使用。

Replit 揭露 Lovable 安全漏洞氛围编码工具引发安全争议

2025 年 6 月 1 日，AI 编程助手公司 Replit 员工披露，号称 “欧洲版 Cursor” 的氛围编码平台 Lovable 存在严重安全漏洞：其开发的 1645 款 Web 应用中，170 款因未正确配置数据库访问控制（RLS），导致用户姓名、邮箱、财务信息及 API 密钥等敏感数据可被未经授权访问。工程师 Matt Palmer 等通过修改查询参数即可获取数据，普通开发者甚至仅用 47 分钟和 15 行 Python 代码就能实现入侵。尽管 Lovable 在 4 月推出 “安全扫描” 功能，但未解决底层架构缺陷，漏洞至今未修复并已被列入国家漏洞数据库（CVE 编号）。

事件暴露氛围编码工具的安全隐患：低代码门槛导致新手开发者忽视安全配置，而工具方将责任转嫁给用户。Replit CEO 批评 Lovable “宣称便捷却未保障安全”，主张工具应自带防护机制；Lovable 创始人则反击称其抄袭功能并质疑动机。网络安全专家指出，氛围编码应用缺乏沙箱机制和默认安全设置，使业余开发者创建的应用成为黑客目标，类似 20 世纪 90 年代 Web 早期的安全乱象。目前，安全行业呼吁建立工具方与用户共担责任的机制，如沙箱隔离和自动化安全扫描，以应对专业化黑客攻击与大众化开发的矛盾。

DeepSeek新版R1直追OpenAI o3！

DeepSeek近日发布了新版R1-0528，这一“小版本升级”却带来了显著提升，甚至在某些领域直追OpenAI的o3模型。根据实测，在LiveCodeBench上，新版本的表现几乎与OpenAI的o3-high持平，令人惊叹。

新版R1在多个方面展现出强大能力。例如，在“9.9-9.11=?”这一难题上，成功超越了包括o3、Gemini 2.5 Pro和Claude 4在内的多款顶级模型。此外，新模型在编程任务中表现出色，仅用24秒就完成了用Three.js模拟太阳系的任务，并实现了动画和交互效果。同时，其前端设计能力也得到提升，能快速结合论文内容生成专业网页。

谷歌发布 Gemini 2.5 系列模型，多领域升级

2025 年 5 月 21 日，谷歌在 I/O 开发者大会上重磅发布 Gemini 2.5 系列模型，包括 Pro 和 Flash 版本。其中，Gemini 2.5 Pro 引入 “深度思考” 推理模型，在 USAMO 数学测试、LiveCodeBench 编程竞赛等基准测试中表现领先，多模态推理能力（MMMU 得分 84%）显著提升；2.5 Flash 则优化速度与效率，令牌消耗减少 20-30%，在代码生成、长文本理解等任务中超越前代。此外，谷歌推出全新 AI 搜索模式，支持复杂查询和多轮对话，同时发布 Jules 编码助手（支持代码库集成与异步任务处理）、Veo 3 视频模型（含原生音频生成）等应用，并与 Xreal 合作开发内置 Gemini 的 Project Aura 智能眼镜。安全方面，Gemini 2.5 增强间接提示注入防护，新增 “思维摘要”“思考预算” 等开发者工具，推动模型向 “世界模型” 演进，旨在打造通用 AI 助手。此次更新覆盖搜索、多模态、开发者工具及硬件生态，展现谷歌在 AI 领域的全面布局与技术突破。

纽约时报与亚马逊达成首份 AI 授权协议，平衡版权保护与技术合作

2025 年 5 月 30 日，曾起诉 OpenAI、微软侵犯版权的美国媒体《纽约时报》宣布与亚马逊签署首份 AI 授权协议，允许亚马逊使用其新闻内容（包括《纽约时报》《纽约时报烹饪》及 The Athletic）训练基础模型，并在 Alexa 等产品中实时展示内容摘要及摘录，同时包含跳转至时报付费内容的链接。此次合作未披露财务条款，旨在通过授权实现内容价值变现，同时为时报引流。

此前，《纽约时报》因指控 AI 公司未经授权使用其内容训练模型而成为 “媒体对抗 AI 巨头” 的代表，而新闻集团、英国《金融时报》等同行则选择与 OpenAI 等企业达成授权合作（如新闻集团五年协议价值约 2.5 亿美元）。《纽约时报》CEO 表示，该协议符合 “优质新闻付费” 原则，体现了通过商业合作与法律手段双重维护内容权益的策略，标志着传统媒体在 AI 语料版权争议中探索新的利益平衡路径。

政策动向

日本出台首部人工智能法

日本参议院全体会议28日以多数赞成票通过首部专门针对人工智能（AI）的法律，旨在促进AI相关技术研发和应用并防止其滥用。这部《人工智能相关技术研究开发及应用推进法》指出，AI技术是日本经济社会发展的基础，从安全保障的角度来看也是重要的技术。依据这部新法，拟设立以日本首相为首、全体内阁成员参加的“AI战略本部”作为日本AI政策的“司令部”，并制定“AI基本计划”。

工业和信息化部印发《算力互联互通行动计划》

2025 年 5 月 30 日，工业和信息化部发布《算力互联互通行动计划》（工信部信管〔2025〕119 号），提出到 2026 年建立较为完备的算力互联互通标准、标识和规则体系，通过设施互联、资源互用、业务互通和试验网试点，实现算力节点网络互通、公共算力资源互联及跨主体供需调度；到 2028 年基本实现全国公共算力标准化互联，形成智能感知、随需获取的算力互联网。文件指出，算力互联互通旨在解决算力需求多样化、分布不均及资源闲置与短缺并存的问题，突破不同厂商接口协议差异的技术难点，提出通过服务器龙头企业牵引产业链开发新型高速互联协议，推广远程直接内存访问等技术提升兼容性。同时，部署高速网络通信、数据存储互通、智能调度及安全保障等基础设施和技术攻关，计划创新 “卡时”“机时” 等灵活服务模式，推动异构智算集群混训，支撑大模型训练等应用，最终实现 “一点接入、全算贯通” 的算力服务体系。

美国联邦众议院通过法案禁止各州监管人工智能和自动决策系统

2025年5月22日，美国众议院通过了一项法案，禁止美国各州在十年内监管人工智能和自动决策系统，后者被定义为“实质性影响或取代人类决策”的系统。该法案是德克萨斯州参议员泰德•克鲁兹特别大力推崇的一项提议，其中关于人工智能的条款规定，“任何州或政治分支机构不得执行任何监管人工智能模型、人工智能系统或自动决策系统的法律或法规。” 这项禁令明确将其适用范围限制在仅适用于人工智能系统而非其他技术系统的州和地方法规。如果州或地方法律是由联邦法律施加，或由普遍适用的法律施加，该法律将“提供类似功能”的非涵盖模型和系统与涵盖的人工智能模型或系统同等对待，则该法律将不必受到10年执行暂停期的约束。

中央网信办持续加强信息推荐算法治理

2025年5月22日，中央网信办在中国网信网发布信息，持续推进“清朗·网络平台算法典型问题治理”专项行动。中央网信办督促重点平台优化信息推荐算法，签署“算法向善”南宁宣言，提升算法透明度和内容多样性。近期，抖音、小红书、微博等平台通过公开算法规则、创新功能如“茧房评估”等，提升用户自主选择权和兴趣偏好管理。微信视频号、快手等加强正能量内容推荐，防范低俗信息。中央网信办表示，算法治理需长期推进，将持续优化算法机制，提升推荐内容质量。