--- title: "06:14 ET 用友网络 AI 实验室推出了一种框架,使企业 AI 决策过程变得可追溯和可审计" type: "News" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/281504690.md" description: "用友网络人工智能实验室推出了本体框架,旨在使企业人工智能决策可追溯和可审计。研究强调,企业人工智能中的问责危机源于架构问题,而非模型能力。本体框架将权力转移至企业本体,确保每个决策都可追溯。与通用大型语言模型的基准测试显示,受本体治理的模型 LOM-action 在合规性和准确性方面显著优于其他模型。论文概述了在企业环境中有效部署该框架的四项原则" datetime: "2026-04-02T10:15:43.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/281504690.md) - [en](https://longbridge.com/en/news/281504690.md) - [zh-HK](https://longbridge.com/zh-HK/news/281504690.md) --- # 06:14 ET 用友网络 AI 实验室推出了一种框架,使企业 AI 决策过程变得可追溯和可审计 /PRNewswire/ -- 用友人工智能实验室发布了一份预印本,介绍了 **本体工具**,这是一个旨在使企业人工智能决策完全可追溯、可验证和可审计的框架。研究认为,企业人工智能中的问责危机并不是模型能力问题,而是架构问题,并提出了一个有实验数据支持的具体解决方案。 **当出现问题时,没人能解释任何事情** 企业人工智能的部署面临结构性问责缺口,准确性基准无法捕捉。当合规审查、费用审批或供应链路由中的人工智能驱动决策出现错误时,组织通常无法解释决策是如何得出的,经过了什么授权,或者是否可以重现。监管机构、审计师和内部管理层并不在乎结论是否正确。他们关心的是这个结论来自哪里。 用友人工智能实验室的立场是,答案不是部署一个更智能的模型,而是完全改变架构:一种使人工智能决策在每一步都根本可追溯的架构。本体工具就是这种架构。 **本体工具:** **从 “模型优先” 到 “本体优先”** 在传统部署中,大模型拥有完全的推理权威,将企业本体视为可以咨询或忽略的数据源。本体工具则颠倒了这一点。**企业本体(EO)** 成为治理权威,编码每个实体、业务规则和授权边界,而 **大本体模型(LOM)** 则作为将这一权威与实际业务任务结合的工具。每个推理步骤必须在本体授权的边界内进行。每个决策都留下可验证的痕迹。 核心流程是 **事件 → 模拟 → 决策**。每个进入的业务事件激活本体中预编码的场景条件,这些条件驱动在隔离沙箱中的确定性图形变更,从中演变出所有决策独占来源的场景有效子图。即使绕过此模拟步骤产生的答案恰好正确,也没有合规基础,无法进行审计。 **为什么通用 LLM 不足** 消费者人工智能在单阶段合同下运作:在整个知识空间中找到最佳答案。企业人工智能需要一个 **双阶段合同**,不可逆转:首先通过本体治理的模拟确定场景有效的决策集,然后在该集内找到最佳解决方案。第一阶段是不可跳过的合规门。通用 LLM 将场景约束视为软偏好,并在认为自己已经知道答案时跳过模拟。这不是模型缺陷,而是它们训练方式的结果。将它们直接部署到具有审计要求的核心企业流程中,是在使用错误的架构。 **用数据验证架构** 用友人工智能实验室对其本体治理模型 **LOM-action** 进行了基准测试,比较了领先的通用 LLM 在一组企业图形推理任务中的表现。研究引入了 **工具链 F1**,这是一个衡量模型是否真正遵循完整模拟流程的指标,而不是通过绕过流程获得正确答案。答案准确性与工具链 F1 之间的差距被定义为 **虚幻准确性(IA)**:IA 越高,越多的 “正确答案” 是通过绕过架构获得的,没有审计基础。 结果确认了决定性的架构优势。LOM-action 实现了 93.82% 的准确率和 98.74% 的工具链 F1,而前沿模型的 F1 仅为 24-36%,尽管答案准确性相似,差距达到四倍。对 50 个前沿模型输出的手动审查发现,47 个是纯文本响应,根本没有调用任何工具:模型从参数记忆中回答,恰好正确,并且没有留下可验证的痕迹。在最接近真实企业决策的场景模拟任务中,LOM-action 实现了 100% 的准确率,工具链 F1 为 98.7%,而前沿模型的准确率仅为 64-66%,F1 低于 35%。研究团队建议工具链 F1 至少为 0.90,虚幻准确性不超过 0.30,作为对模拟敏感系统的部署准备阈值。 **生产部署的四项原则** 论文还概述了本体工具生产部署的四项工程原则: 1. 业务逻辑应在本体中,而不是代码中。代码实现的规则重复知识并创建不可审计的绕过路径。 2. 所有上下文必须与本体对齐。进入推理流程的每个实体在任何模拟开始之前都必须映射到其规范本体代码。 3. 在所有适用的流程任务中,应优先选择经过本体微调的模型,而不是通用 LLM。一个经过训练以强制执行模拟流程的小模型比一个将约束视为可选的大模型更值得信赖。 4. 本体架构和图查询逻辑必须通过审计接口保持人类可读。这使得操作员能够验证哪些节点被匹配,哪些被修剪,以及从哪个图状态派生出决策。 完整的预印本可在以下网址获取:https://www.preprints.org/manuscript/202604.0021 **关于用友人工智能实验室** 用友人工智能实验室是用友网络科技股份有限公司的人工智能研究部门,专注于企业人工智能架构、本体驱动推理和可审计决策框架。 来源:用友 ### 相关股票 - [600588.CN](https://longbridge.com/zh-CN/quote/600588.CN.md) ## 相关资讯与研究 - [Temus 推新平台助企业采用 AI 拟聘 50 名专业人士 | 联合早报网](https://longbridge.com/zh-CN/news/287037197.md) - [HRBP,AI 时代真正的 “铁饭碗”](https://longbridge.com/zh-CN/news/286866050.md) - [直击人工智能行业集体业绩会:AI 商业化进展受关注](https://longbridge.com/zh-CN/news/287141035.md) - [如何创建一家 AI Native 公司?](https://longbridge.com/zh-CN/news/286666891.md) - [AI 时代,超级个体不是一个人](https://longbridge.com/zh-CN/news/287037345.md)