我之前写过一篇[《就着本体论,再谈语义层》,试图跳出概念本身,来讲一讲对语义建模的一点看法。但我发现由于那篇文章本身就是被“本论论”、“语义层”这些概念所束缚的,所以并不能独立地表达我的想法,因此我想借这篇文章来相对独立地分享一些我的思考和看法,希望能够对客户对行业有帮助。
最近大家关注和讨论“本体论”和“语义层”,更多是被 AI 的热度带动,最主要的出发点是如何让 Agent 在企业落地。因此我想先从 Agent 作为企业数字员工这一价值出发,看看 Agent 的体系构成和语义层在其中的定位和价值。
我们先试着思考一个问题“一个工作 5 年的老员工,跟一个刚上岗的新员工有什么区别?”,是老员工变得更聪明了,效率更高了,还是更懂事了?
我认为老员工相比新员工的主要差别可以概括成以下 5 点:
企业落到 Agent 上,自然也是同一个判断标准,要求 Agent 要像老员工一样可以独立完成工作,这个对应关系如下:
| 员工能力 | 本质 | Agent 能力 | 说明 |
|---|---|---|---|
| 会思考 | 基础素养 | 大模型 | 思考推理能力,沟通表达能力 |
| 懂业务 | 企业认知 | 语义层 | 每个企业自己的“世界模型”,让 Agent 理解企业 |
| 有经验 | 处理模式 | Skills | 稳定处理问题的最佳实践和方法 |
| 会协作 | 组织协同 | Tools/环境 | A2A、MCP、CLI、API 等 |
| 有记忆 | 工作记忆 | 记忆层 | 企业历史、长期上下文等 |
| 有价值观 | 企业治理 | 控制层 | 安全、权限、审计、回滚等 |
可以发现这样的分析和映射并没有突破一个典型的 Agent 框架,而这也正是我恰恰想要表达的:
衍生出来,可以推导出的几个判断:
这是从 Agent 视角来推导语义层里会没有什么,那么语义层里应该有什么?从语义层的视角,Agent 的挑战又在哪里?
从语义建模的视角,通常企业语义可以分成不同层次,以下是一个四层分层模型:
从四层语义模型出发,Aloudata CAN 基于实体和维度建模的方法,主要覆盖的是第一层、第二层和第三层的一部分。Palantir 的“本体论”( Ontology )主要覆盖的是第三层和第四层,它的 Foundry 平台通过数据工程的方法来获取数据和指标,算是覆盖了第一层和第二层。
结合上文,这里产生了两个冲突点:
Palantir 的“本体论”诞生在前 AI 时代,那个时代没有 LLM,没有 Agent,系统的用户是人类,主要是 Palantir 自己的 FDE。“本体论”的核心价值是为 FDE 现场实施提供平台能力配套。
Palantir 的 FDE 一方面整理和定义第三层和第四层的语义模型,另一方面又以 Logic 的方式封装业务逻辑,并最后完成业务场景的工程化确定性交付。
到这里,我们又会面临两个问题:
我们现在正处于 AI 时代,AI 能力在快速提升,Agent 架构实践日新月异,这里面至少存在两个新的价值变量:
那么,Agent 的价值履约是否一定必须依赖“本体论”这种重平台、重建模、重实施的方法才可以实现?这种依赖会不会极大地限制了 AI 在企业的普及率?
如果消除模型幻觉的方法不是助力大模型,而是“阉割”大模型的能力,这种方法本身会不会被大模型进化和新的 Agent 实践吞噬掉?
我必须承认,Agent 进入企业实际业务场景的过程会产生哪些挑战,比如 Agent 在任务推理时如何保证操作的确定性,是将架构目标放在如何保证一次做对上(依赖强的行动语义),还是放在 Skills 和 Tools 操作的幂等性上,还是两者要兼顾,我们并没有先验知识,更说不好哪天我们突破了语义自动建模,现有的重建模方式变得不再是问题了呢。
此外,现实中,企业内部有大量场景并不会要求回写业务数据,比如数据分析场景,需要回写数据的部分场景存在灰度空间,比如调补货场景。在这些场景上,Agent 上岗更容易,企业是否可以先行先试呢。
在不确定性的世界中寻找确定性,有一点是确定的,那就是“认知要从实践中来”。在这个认知以周以月迭代的时代,我们更加需要避免“本本主义”,要保持独立思考,清楚意识到认知要从实践中来,只能实践、认识、再实践、再认识才是 AI 时代企业语义层最务实的进化方式。
说不定 Palantir 自己就在 AIP 的实践中也在完成“本体论”的进化呢?!
Aloudata CAN 作为国内领先的语义层产品,获得了很多行业头部客户的认可,比如麦当劳中国、平安证券、名创优品、顺丰、Lululemon 等。这批客户都深度认同语义层的价值,从而几乎 100%都有过尝试自研指标管理平台,其中有 20% 的客户尝试重度自研过“管研用”一体化的指标平台。
那么客户为什么会放弃自研而选择我们呢?
每家企业都会有指标口径管理的需求,为此研发指标管理平台。但因为只能做数据口径的登记维护,无法自动生成指标代码和灵活维度分析,导致业务没有动力使用,技术无法持续口径保鲜,自然就荒废用不起来。
不难发现,语义层建设一开始就要坚持“以用促治”,边用边治。
我们拿最容易理解的电商场景举个例子说明一下这个问题。
在电商业务场景下,企业通常会对商品、门店、订单、会员、物流、库存等做运营管理:
如果语义平台一开始就没有为这种业务深度使用做好架构设计、技术预演和团队储备,那么自然就会在业务使用的过程中遇到无法响应业务需求的情况,造成“吃力不讨好”的局面。
而一个好的语义平台,需要满足以下 3 点:
在真实的企业环境里,要实现上述 3 点,通常会带来这些衍生要求,而这些衍生要求往往在起初会被忽视:
要实现上述语义平台的能力,通常需要这个团队具备:
很荣幸(成就感很强),也很不幸(过程太苦了),Aloudata 就是这样的团队,我们遇到了足够多对的客户,陪我们走过了“产能爬坡”的过程,……(此处省略 1000 字)。
今天,我们处在“AI 刚进入企业”的早期阶段,
有人相信前人实践,有人相信前沿方向;
有人强调 workflow 的确定性,有人强调 Agent 的自主性;
有人相信后发先至,有人相信先发制人;
……。
今天,行业开始认同语义层作为“企业世界模型”的价值,但对语义层的边界、与 Agent 的协同方案等没有标准答案。
今天,我跟大家分享我对语义层、本体论和 Agent 的思考,我已经有自己的判断,期待我们实践之后再跟大家分享我们的新认知。
微信公众号
浙公网安备 33010602011980 号