产品解决方案客户案例资源中心合作伙伴关于我们立即咨询

117全部术语

5全部主题

2026更新版

Glossary

Aloudata 数据技术词典

探索 NoETL 语义编织的关键术语和概念

按话题浏览

AI 数据智能

探索 AI 数据智能的落地应用——从语义编织到 Data Agent 驱动的分析、归因与决策。我们提供基于语义层和 Agentic Harness 框架的智能问数产品，助您构建更懂业务、更可信的 AI 时代智能数据分析能力。

16 条探索AI 数据智能

指标管理与数据分析

探索指标管理与数据分析的底层框架——从指标口径统一、指标体系建设到业务分析与决策支撑。我们提供 NoETL 自动化指标平台，助您建立一致、可追溯、面向业务增长的分析体系，驱动经营管理提效增质。

19 条探索指标管理与数据分析

数据编织与逻辑集成

探索数据编织与逻辑集成的核心方法——从逻辑数仓创建到多源异构数据集成、跨云跨系统数据“不出域访问”、安全合规保障。我们提供面向企业级的 DataFabric 产品方案，助您打通数据孤岛，高效敏捷数据协同。

20 条探索数据编织与逻辑集成

元数据与数据治理

探索元数据与数据治理的关键路径——从元数据管理、数据分类分级到质量保障、合规风险管控。我们提供基于算子级血缘解析技术的主动元数据平台，助您构建高精度数据血缘图谱，实现主动数据管理。

20 条探索元数据与数据治理

数据架构与建模

探索数据架构与建模的底层逻辑 —从数据模型设计、架构选型到标准化治理。我们提供深度的实战指南与前沿趋势分析，助力您构建稳健、可扩展的数据底座，实现数据资产价值的最大化。

42 条探索数据架构与建模

所有术语

搜索

话题

展示 117 条术语

AI 数据智能

16 条

Agentic AI

Agentic AI 是一种能够自主感知、规划、决策并执行复杂任务以实现预定目标的 AI 系统范式。它超越了被动响应式 AI，通过多智能体协作、工具调用、状态记忆和迭代执行，将 AI 从辅助工具升级为可独立完成端到端工作流的“数字同事”。

Agentic Analysis

Agentic Analysis 是一种由 AI 驱动的数据分析范式，其核心在于 AI 智能体能够自主地理解分析目标、规划并执行多步骤的分析任务（如数据查询、归因、洞察生成），最终以人类可理解的方式呈现结果，而无需在每个环节都依赖人工指令。它代表了数据分析从“工具辅助”到“智能体协作”的演进。

Agentic Harness

Agentic Harness 是一种用于构建、部署和管理 AI 智能体的运行时环境与框架，它提供了一套标准化的工具、策略和基础设施，以承载智能体的意图理解、任务规划、工具调度、记忆管理、状态持久化及反馈迭代等核心能力，确保智能体在复杂、动态的环境中能够可靠、安全且高效地执行多步骤任务。

上下文治理

上下文治理是确保数据分析智能体（AI Agent）在生成、推理和决策过程中，所使用的数据定义、业务规则、权限约束及知识来源保持一致、准确且可控的一系列策略、流程和技术手段。其核心目标是防止智能体因“上下文漂移”或信息失真而产生错误或不可信的分析结果。

可解释归因

可解释归因是数据分析领域的一种高级分析方法，它旨在通过清晰、透明、可追溯的模型或算法，识别并量化影响某个核心指标（如销售额、用户增长率）变化的关键因素及其贡献度，使分析结论不仅揭示“是什么”，更能阐明“为什么”。

思维链

思维链是一种提示工程技术，通过引导大语言模型在生成最终答案前，先输出一系列中间推理步骤，从而显著提升其在复杂推理任务（如数学问题、逻辑推理、规划任务）上的准确性和可解释性。它模拟了人类“逐步思考”的过程，是增强大模型复杂问题解决能力的关键技术。

检索增强生成

检索增强生成是一种将信息检索技术与大语言模型生成能力相结合的架构范式。它通过从外部知识库中实时检索相关、权威的信息，并将其作为上下文提供给大模型，以提升生成内容的准确性、时效性和可追溯性，解决大模型的“幻觉”问题。

AI 幻觉

AI 幻觉是指大语言模型（LLM）在生成文本、代码或回答问题时，产生看似合理但事实上不准确、虚构的或与输入信息相悖、具有误导性内容的现象。在数据分析领域，这通常表现为模型生成错误的 SQL 查询、虚构不存在的指标或数据，或对数据口径做出错误解释，导致分析结果失真。

Chat BI

Chat BI 是一种新兴的数据分析交互方式，即用户通过自然语言对话的方式，直接向数据系统提问、探索数据并获得洞察。其核心在于将复杂的查询语言和报表构建过程，转化为类似与智能助手聊天的直观体验，降低数据分析的技术门槛，提升业务人员的自助分析和洞察能力。

Agentic Workflow

Agentic Workflow 是一种由多个智能体（Agent）通过自主规划、工具调用、协作与反思等机制，完成复杂任务的自动化工作流。它通过将任务分解为可执行的步骤序列，并动态调整执行路径，实现对目标导向的、开放式、多步骤业务问题的端到端智能处理。

多智能体协作

多智能体协作是一种人工智能系统架构范式，指多个具备特定能力、知识或目标的智能体（Agent）通过通信、协商、任务分解与组合等方式协同工作，以解决单个智能体难以处理的复杂问题。它旨在模拟人类团队协作，通过分工与协同实现超越个体能力的集体智能，以解决开放、动态环境下的复杂问题，确保更高的任务完成度、鲁棒性和效率。

数据智能体

数据智能体是一种基于人工智能和大语言模型构建的智能问数软件实体，它能够自主或半自主地理解、规划并执行复杂的数据查询和分析任务。它通过自然语言交互的方式，感知数据环境、理解用户意图、调用工具并生成洞察或行动建设，降低数据查询和分析技术门槛，告别 ETL 依赖，推动“数据民主化”。

Aloudata Agent

Aloudata Agent 是 Aloudata 自主研发的企业级分析决策智能体，旨在通过自然语言交互，让业务人员能够自主、可信、深度地进行数据查询和分析。它基于统一的指标语义层和创新的 NL2MQL2SQL 技术路径，将自然语言问题转化为指标查询语言（MQL），再由指标语义引擎自动生成 SQL 语句，帮助企业实现从“智能问数”到“智能归因”再到“决策建议”的智能分析闭环。

NL2MQL2SQL

NL2MQL2SQL 是由 Aloudata 独创的、用于企业级数据分析智能体建设的技术路径。相较于 NL2SQL 技术路径，其通过引入统一指标语义层作为“中间语言”，能够将自然语言问题先转换为精确的指标语言查询（MQL），再生成可执行的 100% 准确的 SQL 语句，从而确保分析意图的准确传递与业务口径的一致性，避免“数据幻觉”，解决语义理解偏差、口径不一致和结果可信度低等问题。

NL2SQL

NL2SQL 是一种技术路径，通过利用大语言模型将用户的自然语言问题自动转换为数据库查询语言 SQL，让非技术用户也能够通过对话方式高效自助查询数据，降低数据获取门槛，提升数据查询和分析效率，是推动“数据民主化”的关键技术路径之一。

语义层

语义层是数据架构中位于物理存储与业务应用之间的抽象层，它通过统一的业务术语、计算规则和关系定义，将底层复杂的技术数据映射为业务人员可理解、可信任的“业务事实”，是实现数据业务化与自助分析的关键。

指标管理与数据分析

19 条

事实表

事实表是维度建模中的核心表，用于存储可度量的业务事实（如销售额、交易笔数、库存量），这些事实通常与多个维度（如时间、产品、门店）相关联，是进行定量分析的基础。它也被称为度量表。

维度表

维度表是数据仓库和商业智能领域中，用于描述业务实体属性、提供分析上下文和筛选条件的静态或缓慢变化的数据表。它通常包含描述性字段（如名称、分类、层级），是维度建模中的关键组成部分，与分析主题的事实表通过外键关联，共同支撑多维度的数据查询与分析。

商业智能

商业智能（BI）是一套技术、应用和流程的集合，通过收集、整合、分析和呈现企业内外部数据，将原始数据转化为可操作的洞察，以支持更有效的业务决策。其核心在于通过数据可视化、报告和在线分析处理等工具，帮助业务人员理解业务现状、发现趋势并预测未来。

原子指标

原子指标是数据指标体系中最基础、不可再分的业务度量单元，它基于单一业务过程，通过明确的统计口径（如聚合函数、统计维度）和计算逻辑定义，是构建所有复合指标和派生指标的基石，旨在确保企业内数据口径的绝对一致性与可追溯性。

数据域

数据域是数据治理与数据架构设计中的核心概念，指按照业务领域（如销售、客户、财务）或主题（如订单、产品、库存）对数据进行逻辑划分和归类的单元。它旨在将分散、异构的数据资产组织成边界清晰、语义一致、权责明确的业务模块，是构建企业级数据模型、实现数据标准化和推动数据驱动决策的基础。

维度层级

维度层级是数据分析中，用于描述同一维度内不同粒度或级别的有序分类结构。它定义了数据从宏观到微观、从汇总到明细的钻取路径，是支持多维分析和时间序列分析的核心基础。常见的维度层级包括时间维度（年-季-月-日）、地理维度（国家-省-市）和组织维度（集团-事业部-部门）等。

一致维度

一致维度是数据仓库和商业智能领域的一个核心建模概念，指在不同的事实表或数据域中，具有相同含义、相同结构、相同键值（如 ID）和相同属性的维度表。它确保了跨业务过程或跨主题域的分析能够使用统一的业务视角，是实现数据集成、保证分析结果可比性的基石。

复合指标

复合指标，也称为组合指标或复杂指标，是指通过两个或更多基础指标（或度量）进行数学运算（如加、减、乘、除、比率、加权平均等）而派生出的新指标。它用于衡量更复杂的业务绩效，通常反映了业务逻辑的深层关系，例如客单价、转化率、毛利率等。

实时指标

实时指标是指能够反映业务在极短时间窗口内（通常为秒级或分钟级）最新状态的量化度量。它通过对持续流入的数据流进行即时计算与分析，为业务监控、风险预警、实时决策等场景提供近乎零延迟的数据洞察，是驱动业务敏捷响应与运营智能化的关键数据资产。

指标治理

指标治理是企业数据治理的核心子域，指通过一系列组织、流程、技术和标准，对业务指标的定义、生产、存储、消费、变更及下线进行全生命周期管理，旨在确保指标数据的准确性、一致性、安全性和可信赖性，从而支撑基于统一事实的业务决策。

指标价值树

指标价值树是一种用于战略目标管理和业务洞察的结构化分析框架。它将企业顶层的战略目标逐层拆解为可量化、可追踪的驱动因子和业务指标，形成一张从宏观到微观、从结果到原因的可视化“树状”逻辑图谱，揭示业务价值创造的路径与关键杠杆点，实现目标对齐、责任落地与过程监控。

指标体系

指标体系是一套系统化、结构化、相互关联的量化度量集合，用于全面、准确地衡量和评估组织、业务或项目的目标达成情况、运营状态与发展趋势。它通过将宏观战略目标逐层拆解为可执行、可监控的具体指标，构建起从战略到执行的数据化映射，是数据驱动决策的核心框架。

指标定义

指标定义是通过标准化元数据（如名称、口径、计算逻辑）来明确描述和规范业务度量的过程，旨在将模糊的业务概念转化为可量化、可计算、可复用的数据资产，是确保数据一致性和可信度的基石。Aloudata CAN指标平台通过声明式定义与NoETL语义编织技术，将指标定义升级为动态、可计算的语义资产，支撑指标自动化生产、高效分析和AI原生应用。

指标自助

指标自助是一种数据民主化的实践模式，指业务人员或数据分析师无需依赖数据工程师编写复杂 SQL 或 ETL 脚本，通过配置化的方式，自主完成指标的定义、查询、组合与分析，从而快速获取业务洞察，响应瞬息万变的市场需求。

预计算

预计算是一种通过提前计算并存储中间或最终结果，以空间换时间的数据处理策略。它旨在优化海量数据查询性能，通过在数据查询前预先执行复杂的计算逻辑，将结果物化到存储介质中，从而在发起查询请求时能够快速返回结果，实现高性能数据服务，避免实时计算开销。

智能归因分析

智能归因分析是一种基于数据与算法的自动化分析技术，旨在通过多维度下钻、相关性分析、异常检测等技术，自动识别并量化导致业务指标（如销售额下降、用户流失率上升）发生波动的关键驱动因素，从而将数据洞察从“发生了什么”推进到“为什么会发生”的深度。

指标口径

指标口径是衡量业务指标计算逻辑与数据范围的统一定义，明确了指标的计算公式、统计维度、时间周期、数据来源及业务限定条件，是确保数据一致性、准确性和可比性的基石。清晰、标准化的指标口径是数据驱动决策的前提。

Aloudata CAN

Aloudata CAN 是 Aloudata 自主研发的 NoETL 自动化指标平台，集配置化指标定义、自动化指标生产、语义化指标目录、开放化指标服务于一体，可帮助企业构建统一、可解释、可复用的指标语义层，解决指标口径混乱、开发响应慢、分析洞察浅、分析不灵活和成本高昂等痛点，并为落地企业级数据分析智能体（Data Agent）提供可信智能底座。

指标平台

指标平台是一种用于集中定义、管理、计算和交付企业关键业务指标（Metrics）的技术基础设施。它通过构建一个统一的语义层，将分散在报表、数据集和业务系统中的指标定义标准化、资产化，并提供标准化的 API 或接口，确保指标口径在企业内一致、可复用，并支持向 BI 工具、AI 应用和业务系统等多样化消费端提供可靠的数据服务。

数据编织与逻辑集成

20 条

全量加载

全量加载是数据集成与数据仓库领域的一种数据同步策略，指在数据更新周期内，将源数据表的全部记录完整地抽取并加载到目标系统的过程。它通常用于数据量较小、变更频率低或对数据一致性有严格要求的场景，是实现数据初始化和周期性刷新的基础方法。

实时同步

实时同步是一种数据集成技术，旨在将数据从源系统近乎实时地复制或更新到目标系统，以最小化数据延迟，确保下游应用和分析能够访问到最新鲜的数据。它通常通过捕获数据变更（CDC）等技术实现，是构建实时数据管道、支持业务敏捷决策的关键基础设施。

增量加载

增量加载是一种数据集成策略，指在数据同步或更新过程中，仅识别、捕获和传输自上次同步以来源系统中发生变化的数据，而非全量复制所有数据。这种方法旨在显著减少数据传输量、缩短处理时间窗口，并降低对源系统和目标系统的资源消耗，是实现数据高效、准实时同步的关键技术。

数据复制

数据复制是数据管理领域的一项基础技术，指将数据从一个数据源（源端）完整或部分地拷贝到另一个数据存储位置（目标端）的过程。其核心目标是提高可用性、支持负载均衡，或为数据分析、灾备等场景提供独立的数据副本。

缓存策略

缓存策略是一套用于管理数据缓存的规则和机制，旨在平衡数据访问速度、数据一致性、存储成本和系统资源。其核心目标是通过将高频访问的数据副本存储在更快的存储介质中，减少对原始数据源的重复访问，从而提升系统响应速度和整体性能。

多源异构集成

多源异构集成是指将来自不同技术架构、数据格式、存储位置和访问协议的数据源，通过技术手段进行逻辑或物理层面的连接与整合，以形成一个统一、可访问的数据视图或数据资产的过程。其核心目标是打破数据孤岛，实现跨系统、跨平台的数据融合与协同分析。

CDC 技术

CDC 技术（变更数据捕获）是数据库领域的一项关键技术，用于识别和捕获源数据库中数据行级别的增量变化（如 INSERT、UPDATE、DELETE 操作），并将这些变化实时或准实时地同步到下游系统，是实现数据集成、实时分析、数据同步、数据仓库更新和数据流处理的基础。

零复制技术

零复制技术是一项数据集成与处理的关键技术，其核心在于通过逻辑连接和虚拟化手段，在不物理复制或搬运原始数据的前提下，实现对分散、异构数据源的统一访问、整合与分析。它旨在解决传统数据集成模式中因数据全量复制带来的高成本、长周期、数据冗余与安全合规风险等问题。

实时数据虚拟化

实时数据虚拟化是一种数据集成与访问架构，它通过构建统一的逻辑数据视图层，在不物理复制或搬运源数据的前提下，实现对多源异构数据的实时、统一查询与访问。其核心在于提供“逻辑集中、物理分散”的数据服务能力，让业务应用能够直接、即时地获取和分析分布在各个业务系统中的最新数据。

虚拟化视图

虚拟化视图，又称逻辑视图，是一种在数据管理领域用于抽象和简化数据访问的技术概念。它通过标准化的查询定义（如 SQL）来封装底层复杂的数据结构、跨源关联和业务计算逻辑，为用户提供一个统一、简洁、语义清晰的虚拟数据表，无需物理移动或复制原始数据。

虚拟数据库

虚拟数据库是一种数据架构模式，它通过一个统一的逻辑接口，将分布在多个异构物理数据源中的数据整合起来，对外呈现为一个单一、连贯、可查询的的数据库视图。其允许用户使用标准查询语言访问和操作跨源数据，无需关心数据的物理位置、存储格式或技术差异，实现数据的逻辑集中与统一访问。

One SQL

One SQL 是一种数据架构理念与技术实现，旨在通过一个统一的 SQL 接口，屏蔽底层异构数据源如 MySQL、Oracle、Hive、ClickHouse 等在 SQL 方言、数据类型和物理位置上的差异，让用户能够像查询单一数据库一样，使用标准 SQL 语句透明地访问和整合企业全域数据，提升数据消费的敏捷性。

查询下推

查询下推是数据库和分布式查询引擎中的一项查询优化技术，其核心思想是将查询操作（如过滤、聚合、连接等）尽可能“下推”到更靠近数据存储的源头执行，从而最大限度减少跨系统或跨网络的数据传输，充分利用底层数据源的本地计算能力，提升整体查询性能和降低系统负载。

逻辑数据编织

逻辑数据编织是一种现代数据架构理念和技术路径，旨在通过数据虚拟化技术，在不物理搬运数据的前提下，实现对全域异构数据逻辑整合，从而实现跨源、实时、安全的数据访问与敏捷交付。

逻辑数仓

逻辑数仓是一种基于数据虚拟化技术构建的数据管理架构。它通过定义逻辑视图而非物理复制搬运，将多源异构的数据进行逻辑整合、建模与统一管理，为企业提供敏捷、低成本的数据集成与访问能力，以应对“数据孤岛”、数据时效性差和物理集中成本高昂等挑战。

自适应关系投影

自适应关系投影是 Aloudata 提出并在其逻辑数据编织平台 Aloudata AIR 中应用的一种智能数据物化加速技术。它通过分析全域逻辑视图定义和用户查询行为，自动构建全局算子图谱，识别并物化关键数据枢纽，以最低的存储和计算成本，为复杂、多变的跨源数据查询提供高性能、自适应的查询加速。

Aloudata AIR

Aloudata AIR 是由 Aloudata 自主研发的国内首个基于 Data Fabric 理念的逻辑数据编织平台，旨在通过数据虚拟化（Data Virtualization）技术，在不物理搬运数据的前提下，实现企业全域多源异构数据的逻辑整合、统一访问与高性能查询，以解决传统物理集中数据模式的成本高、周期长、灵活性差、回报率低等痛点，实现敏捷高效数据交付。

数据虚拟化

数据虚拟化是一种数据集成与管理技术，它通过构建一个统一的逻辑数据层，在不移动物理数据的前提下，实现对分散、异构数据源的实时、统一访问与查询，是数据编织（Data Fabric）架构的核心技术实现。

联邦查询

联邦查询是一种数据查询技术，支持用户通过统一的查询接口和语句，同时访问和整合分布在多个异构数据源中的数据，而无需将数据物理集中到一个位置，再进行复制、搬运，从而实现跨源数据的逻辑整合与统一分析。

数据编织

数据编织是一种现代化的数据管理架构理念，通过逻辑整合而非物理搬运的方式，将分散在不同位置、不同格式的异构数据源连接起来，形成一个统一、敏捷、安全的数据服务层，从而解决数据孤岛、算力重复投入、数据多层复制等问题，提升数据交付效率与业务敏捷性。

数据架构与建模

42 条

ADS 是 Application Data Service 的缩写，通常称为应用数据服务层。它是数据仓库分层架构中面向具体业务应用、报表、接口、看板和分析场景的数据服务层，用于将 DWD 明细数据、DWS 汇总数据、指标结果或语义层输出加工为可直接被业务系统和分析工具消费的数据集。

DWS

DWS 是 Data Warehouse Summary 的缩写，通常称为数据仓库汇总层。它位于 DWD 明细层之后、ADS 应用层或数据集市之前，主要用于按照业务主题、分析维度和统计周期对明细数据进行聚合、汇总和预计算，为指标分析、经营报表、BI 应用和数据集市提供可复用的数据基础。

DWD

DWD 是 Data Warehouse Detail 的缩写，通常称为数据仓库明细层。它位于 ODS 原始数据层之后、DWS 汇总层和 ADS 应用层之前，主要用于对原始或近原始数据进行清洗、去重、标准化、关联和明细建模，形成面向分析的可信明细数据基础。

ODS

ODS 是 Operational Data Store 的缩写，通常称为操作型数据存储。它是位于业务系统与数据仓库、数据湖或分析平台之间的基础数据层，用于承接来自多个业务系统的原始或轻度加工数据，为后续数据清洗、建模、指标计算、报表分析和数据应用提供统一的数据入口。

ETL

ETL 是 Extract、Transform、Load 的缩写，即数据抽取、数据转换和数据加载。它是一种典型的数据集成流程，用于将分散在业务系统、数据库、日志系统或外部数据源中的数据抽取出来，经过清洗、转换、整合和加工后，再加载到数据仓库、数据湖、数据集市或分析平台中，为报表、BI 分析、数据建模和决策支持提供统一的数据基础。

数据隐私

数据隐私是指企业在采集、存储、处理、共享和使用个人信息、敏感数据及受监管数据时，确保数据主体权益、使用目的、访问权限、处理边界和合规要求得到有效保护的一套治理原则、管理机制与技术能力。它不仅关注“谁能看到数据”，更关注“数据为什么被使用、如何被使用、是否可追踪、是否符合合规边界”。

数据合规

数据合规是企业为满足数据相关的法律法规、行业标准及内部政策要求，而建立的一系列管理、技术和运营实践的总称。其核心目标是确保在数据的全生命周期中，对个人隐私、商业机密和国家安全等关键权益进行有效保护，并规避法律与声誉风险。

数据湖

数据湖是一种企业级数据存储架构，用于以原始格式（如结构化、半结构化和非结构化数据）集中存储海量、多样化的数据。其核心设计理念是“先存储，后定义模式”，旨在打破数据孤岛，为数据探索、高级分析、机器学习和数据科学等场景提供灵活、可扩展的原始数据源。

OLAP

OLAP（联机分析处理）是一种用于支持复杂业务分析、数据探索和决策支持的计算技术。它通过对海量数据进行快速、稳定、多维度的汇总、切片、钻取和旋转等交互式查询，将数据转化为可供分析的商业信息，是数据仓库和商业智能（BI）系统的核心引擎。

维度建模

维度建模是一种用于数据仓库和商业智能系统的结构化数据设计方法，其核心是以业务用户的视角，将数据组织为“事实”和“维度”两大类，以支持高性能、直观的查询与分析。它通过星型或雪花型模式来物理实现，旨在简化复杂数据，提升分析效率。

数据集市

数据集市是一种面向特定业务主题、部门或用户群体的、规模相对较小的数据仓库子集。它通常从企业级数据仓库或业务系统中抽取、转换并装载（ETL）数据，旨在为特定分析场景提供高度聚焦、易于访问且性能优化的数据服务，以支持部门级决策和业务分析。

数据仓库

数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合，用于支持管理决策。它通过 ETL 过程，将来自多个异构操作型数据源的数据进行清洗、整合与重组，构建一个统一的分析环境，以支持复杂的查询、报表生成与数据分析。

数据管道

数据管道（Data Pipeline）是一套用于自动化数据从源头到目的地流动、转换与处理的架构与流程。它通过一系列编排好的处理步骤，将原始数据转化为可供分析、应用或存储的可用数据，是现代数据基础设施的核心组件。

批流一体

批流一体是一种现代数据处理架构理念，旨在通过统一的编程模型、计算引擎和存储层，实现对历史批量数据和实时流式数据的无缝集成与协同处理，从而简化数据栈、降低开发运维复杂度，并满足企业对数据时效性与一致性的综合需求。

流式处理

流式处理是一种计算范式，它持续不断地处理无界、持续生成的数据流，并在数据到达时立即或近乎实时地进行计算、分析并输出结果。其核心在于对数据流的连续、增量处理，而非对静态数据集的批量操作，旨在实现低延迟的实时洞察与响应。

数据共享

数据共享是指组织内部或组织之间，在遵循既定策略与安全规范的前提下，将数据资产提供给授权用户或系统进行访问、使用和协作的过程。其核心在于通过技术、流程与治理的结合，打破数据孤岛，促进数据价值的流通与复用，支撑更高效的决策与创新。

数据服务

数据服务是一种以标准化、可编程接口形式封装和交付数据资产的技术架构与产品化实践，旨在实现数据在企业内外部安全、高效、可复用地流通与消费，是构建数据驱动型业务和现代化数据架构的核心组件。

语义模型

语义模型是一种将底层复杂、技术化的数据结构（如表、列、SQL 代码）映射为业务人员可理解的、具有一致含义的业务概念（如“客户”、“收入”、“利润率”）及其关系的抽象层。它充当了数据系统与业务语言之间的“翻译器”，确保不同用户和工具在分析同一业务问题时，能基于统一的定义和逻辑获得一致的结果。

缓慢变化维

缓慢变化维是数据仓库建模中的一个核心概念，指维度表中那些属性会随时间发生缓慢、非周期性变化的数据实体。处理缓慢变化维的核心挑战在于如何设计数据模型，以准确记录和追踪这些变化的历史轨迹，确保数据分析既能反映当前状态，也能回溯任意历史时点的业务事实。

雪花模型

雪花模型是数据仓库领域一种经典的多维数据模型，其核心结构由一个中心事实表与多个通过规范化处理、形成层级关系的维度表构成，形似雪花而得名。它通过消除维度表中的数据冗余，在逻辑层面实现了更精细、更标准化的维度管理，但以增加表关联复杂度和查询性能开销为代价。

星型模型

星型模型是一种在数据仓库和商业智能领域广泛使用的维度建模结构，其核心特征是一个位于中心的事实表，通过外键与多个环绕其周围的维度表直接相连，所有维度表之间没有直接关联，其图形化表示形似一颗星星，因此得名。

物理模型

物理模型是数据建模的最终实现层，它定义了数据在特定数据库管理系统中的具体存储结构，包括表、列、索引、分区、数据类型、主外键约束等物理细节，旨在实现数据的高效存储、查询和访问。

逻辑模型

逻辑模型是数据建模过程中的一个关键抽象层，它独立于任何特定的数据库管理系统或物理存储技术，专注于定义业务实体、属性、关系以及约束规则。它作为连接业务需求与物理实现的桥梁，旨在确保数据结构能准确、一致地反映业务语义。

数据编排

数据编排是一种通过自动化、协调和管理数据在不同系统、工具和流程之间的流动、转换与处理任务，以实现数据驱动业务目标的技术架构与实践。其核心在于将分散、复杂的数据操作任务整合为一个有序、可靠且可观测的自动化工作流，从而提升数据处理的效率、可靠性与一致性。

分层架构

分层架构是一种将复杂软件系统分解为多个具有明确定义职责和接口的层次的设计范式。每一层都为其上层提供服务，并依赖于其下层，从而通过关注点分离来提升系统的可维护性、可扩展性、可测试性，并降低组件间的耦合度。

查询引擎

查询引擎是数据库或数据管理系统的核心组件，负责接收、解析、优化并执行用户或应用程序发起的查询请求（如 SQL），从底层数据源中检索、计算并返回所需的结果。它充当了用户与物理存储数据之间的智能翻译与执行层。

数据网格

数据网格是一种去中心化的、面向领域的数据架构范式和组织文化，它将数据视为由不同业务领域团队负责的、可独立管理、可发现和可消费的“数据产品”。其核心在于通过明确的数据所有权、标准化的数据产品接口和全局化的治理，在保持领域自治的同时，实现大规模、跨领域的数据协作与价值交付。

数据要素流通

数据要素流通是指数据作为新型生产要素，在确保安全合规的前提下，通过市场化配置机制，在不同主体、不同系统、不同场景之间进行有序共享、交换、交易与应用，从而实现数据价值释放和价值最大化的过程。其核心在于打破“数据孤岛”，促进数据资源的高效配置与融合创新。

现代数据栈

现代数据栈是一套基于云原生、模块化、自助服务理念构建的，旨在高效处理海量数据并赋能业务分析的数据技术集合。其核心特征包括将数据存储、转换、集成与消费层解耦，广泛采用 SaaS 化或托管服务，并强调通过声明式配置和自动化来提升数据工程与分析的敏捷性。

数据架构

数据架构是用于定义企业数据资产如何被组织、集成、存储、管理和使用的蓝图与结构化框架。它通过一系列原则、模型、策略和标准，将业务需求转化为数据系统设计，旨在确保数据的可用性、一致性、安全性和价值实现，是连接业务战略与 IT 实施的关键桥梁。

数据集成

数据集成是数据管理领域的一项核心实践，旨在将来自不同来源、格式、结构或语义的数据进行合并、转换与统一，以提供对数据的全面、一致和可信的访问视图，从而支持分析、决策和业务运营。

数据安全

数据安全是旨在通过一系列技术、流程和管理策略，保护数字信息在整个生命周期（包括存储、处理、传输和使用）中免受未经授权的访问、泄露、篡改、破坏或丢失的综合性实践体系。其核心目标是确保数据的机密性、完整性和可用性。

ETL

ETL 是数据工程领域中的核心流程，指将数据从多个异构的源系统中抽取出来，经过清洗、转换等加工处理，最终加载到目标数据存储（如数据仓库、数据湖）中的一系列操作，旨在为数据分析与决策提供高质量、统一、可用的数据基础。

数据要素

数据要素是继土地、劳动力、资本、技术之后被国家明确列为第五大生产要素的新型经济资源，指以电子形式存在、能够通过计算参与社会生产经营活动、为使用者带来经济效益或产生其他价值的数据资源。其核心在于将数据从原始信息转化为可市场化流通、可量化评估、可创造价值的战略性资产。

数据资产

数据资产是企业或组织在经营活动中产生、收集、加工、存储和管理的，能够带来未来经济利益，且其成本或价值能够可靠计量的数据资源。它强调数据的可用性、质量、安全性和经济价值，是驱动企业数字化转型和业务创新的核心生产要素。

查询加速

查询加速是一系列旨在提升数据查询响应速度的技术与策略的统称。它通过优化查询执行路径、预计算中间结果、利用高性能存储介质或智能路由等方式，在不改变原始数据逻辑的前提下，显著缩短从提交查询到获得结果的端到端时间，以应对海量数据、复杂分析场景下的性能挑战。

物化视图

物化视图是一种数据库对象，它将一个查询的结果集以物理形式（如表）持久化存储。与普通逻辑视图不同，物化视图包含了实际数据，通过预计算和存储查询结果来加速后续对相同或相似数据的访问，从而提升查询性能，尤其适用于聚合查询、多表连接等复杂且耗时的操作场景。

数据湖仓

数据湖仓是一种融合了数据湖和数据仓库优势的现代数据架构范式。它旨在通过在低成本、高可扩展性的数据湖存储之上，构建类似数据仓库的事务一致性、数据治理和高性能分析能力，以支持从数据科学、机器学习到商业智能等多种工作负载。

数据中台

数据中台是一种企业级数据架构与组织协同模式，旨在通过构建统一、可复用、服务化的数据能力中心，将分散在不同业务系统的数据资产进行整合、治理与标准化，并以 API 或服务的形式，敏捷、高效地支撑前端多变的业务应用，从而提升数据利用效率、降低数据建设成本，并赋能业务创新。

物化加速

物化加速是一种数据工程与数据管理领域的技术策略，指通过预先计算并存储（即“物化”）查询结果或中间数据，将计算密集型操作从查询时（On-Demand）转移到数据准备阶段，从而在后续相同或相似查询中直接返回预计算结果，以提升查询响应速度、降低实时计算负载并保障高并发场景下的稳定性。

语义编织

语义编织是 Aloudata 提出的、以业务语义为核心的数据组织与建模方法，它通过声明式定义业务指标和维度，在逻辑层构建统一的、可理解的数据语义网络，从而屏蔽底层数据源的物理复杂性，实现业务与技术的解耦。

NoETL

NoETL 是 Aloudata 提出的核心理念，指通过自动化、语义化、逻辑化的数据编织和语义编织技术，替代传统依赖人工 ETL 的数据开发模式，旨在实现“逻辑编织替代物理搬运”，重塑企业数据基础设施。

元数据与数据治理

20 条

数据字典

数据字典是对企业数据资产中表、字段、指标、编码、数据类型、业务含义、来源关系、口径规则和使用约束进行集中描述与管理的元数据集合。它的核心作用是帮助企业统一理解数据，让数据开发、数据治理、数据分析和业务用数建立在一致的数据认知之上。

数据质量元数据

数据质量元数据是描述数据质量属性、评估规则和监控结果的结构化信息。它作为数据质量的度量基础，记录了数据的准确性、完整性、一致性、时效性等维度的定义、测量方法和历史状态，是实现数据质量可观测、可管理、可追溯的核心。

数据契约

数据契约是数据生产者与消费者之间关于数据产品结构、语义、质量、可用性和治理规则的正式、机器可读的协议。它定义了数据产品的接口规范，旨在通过明确权责、自动化验证和变更管理，确保数据在跨团队、跨系统流动时的可靠性、一致性和可协作性。

敏感数据识别

敏感数据识别是数据安全与治理领域的一项核心能力，指通过自动化技术手段，对数据资产进行扫描、分析和分类，以发现其中包含的个人隐私信息（PII）、商业机密、财务数据等具有高价值或高风险属性的数据。它是实施数据分类分级、访问控制、数据脱敏和合规审计等后续治理措施的基础。

数据分类分级

数据分类分级是企业数据治理的核心基础工作，指根据数据的属性、内容、敏感程度、业务价值及合规要求，对数据进行类别划分和敏感等级标定的过程。其核心目标是建立统一的数据安全基线，为后续的数据访问控制、安全防护、合规审计及价值释放提供精准的策略依据。

DataOps

DataOps 是一种面向数据流水线的敏捷协作方法论，旨在通过自动化、监控和工程化实践，缩短数据从源端到消费端的交付周期，并提升数据产品的质量、可靠性和安全性。它借鉴了 DevOps 的理念，强调数据团队（开发、运维、分析、业务）间的紧密协作与持续改进。

数据质量

数据质量是衡量数据满足特定业务需求和使用目的能力的综合性指标，其核心在于评估数据的准确性、完整性、一致性、时效性、唯一性和可信度，以确保数据能够作为可靠的资产支持业务决策与运营。

ETL 血缘

ETL 血缘是数据血缘分析在 ETL 过程中的具体应用。它通过解析 ETL 任务脚本（如 SQL、存储过程、任务配置），揭示数据从源端经过多级加工处理，最终加载到目标表或数据仓库的完整依赖关系和加工逻辑，构建端到端数据链路图谱，是实现数据链路可追溯性、保障数据质量和进行影响分析的核心基础。

Schema 识别

Schema 识别是数据管理领域的一项关键技术，指系统自动或半自动地从数据源（如数据库、文件、API）中分析、推断并提取其数据结构信息的过程。这包括识别表名、字段名、数据类型、主外键约束、索引等元数据，为后续的数据集成、治理和分析提供基础框架。

列级血缘

列级血缘是数据血缘分析的一种精度，它追踪数据在加工、流转过程中，从源端到目标端字段（列）级别的依赖关系。它比表级血缘更精细，能够揭示数据在字段级别的流动路径，是理解数据加工逻辑、进行影响分析和根因定位的重要基础。

数据目录

数据目录是企业数据管理架构中的核心组件，它是一个集中化的元数据存储库，通过对技术元数据、业务元数据、操作元数据及其关联关系的系统化管理，提供数据资产的编目、发现、理解、评估和协作功能，从而提升数据资产的可见性、可发现性与可信度。

元数据知识图谱

元数据知识图谱是一种将企业内分散、异构的元数据，如数据表、字段、ETL 任务、BI 报表、业务术语等进行结构化、语义化建模，并构建成一张可推理、可查询的知识网络的数据治理技术。它通过图模型直观揭示数据资产之间的复杂关联与依赖关系，为影响分析、血缘追溯和智能治理提供统一认知基础。

数据治理

数据治理是一套由企业制定的、关于数据资产管理的政策、流程、标准、角色和职责的框架体系，旨在确保数据在其整个生命周期内的可用性、完整性、安全性、一致性和合规性，从而将数据转化为可信赖、可理解且合规的战略资产，驱动业务决策与运营。

元数据

元数据是描述数据的数据，定义了数据的结构、含义、来源、关系、质量、使用方式及生命周期等关键信息。元数据是理解、管理和有效利用数据资产的基础，构成了企业数据治理和数据管理的核心框架。

口径溯源

口径溯源是数据治理的一项关键技术，旨在自动、精确追溯和解析数据资产从最终呈现形式到原始数据源的完整加工逻辑与计算路径，将隐藏在复杂数据加工链路中的业务规则和计算逻辑“白盒化”，以解决数据可信度、合规审计与变更影响评估等问题。

变更影响分析

变更影响分析是数据治理领域的核心实践，通过在数据资产（如表、字段、ETL/ELT 任务、指标）发生变更前或变更后，系统性地评估该变更对下游数据链路、应用系统和业务流程可能产生的范围与风险，以实现主动的风险防控与高效的变更协同，保障业务连续性。

数据血缘

数据血缘，描绘了数据从源头到最终消费端全链路流转、加工与依赖关系的全过程。它通过构建数据之间的血缘图谱，清晰地揭示数据的“来龙去脉”，可以精准追溯数据来源、解析数据加工逻辑和最终应用方式，是保障数据质量、实现有效治理和满足合规审计要求的关键技术基础。

算子级血缘

算子级血缘是一种深入到 SQL 内部，解析并记录每一个数据加工操作（如 FILTER、JOIN、AGGREGATION 等）的精细化数据血缘解析技术。它超越了传统的表级或列级依赖关系，能够精确理解字段的加工逻辑，是实现数据链路白盒化、自动化治理和主动风险防控的核心基础。

Aloudata BIG

Aloudata BIG 是 Aloudata 自主研发的全球首个实现算子级血缘解析的主动元数据平台，旨在解决企业因数据资产膨胀、数据链路复杂而导致的“看不清、管不住、治不动”的治理难题，能够助力企业构建端到端、跨平台、可扩展的血缘图谱，解析精度超 99%，是企业落地 DataOps 和实现数据管理自动化的基石。

主动元数据

主动元数据是元数据管理领域的一种先进范式，它强调元数据应被自动化、智能化地采集、分析、关联和应用，从而驱动数据管理活动从被动响应转向主动预防与干预，是构建自动化、智能化数据治理体系的核心。

即刻开启可信智能之旅

我们的行业专家会第一时间联系您，帮助您了解更多

立即咨询

Aloudata 数据技术词典

热门术语

按话题浏览

AI 数据智能

指标管理与数据分析

数据编织与逻辑集成

元数据与数据治理

数据架构与建模

所有术语

AI 数据智能

Agentic AI

Agentic Analysis

Agentic Harness

上下文治理

可解释归因

思维链

检索增强生成

AI 幻觉

Chat BI

Agentic Workflow

多智能体协作

数据智能体

Aloudata Agent

NL2MQL2SQL

NL2SQL

语义层

指标管理与数据分析

事实表

维度表

商业智能

原子指标

数据域

维度层级

一致维度

复合指标

实时指标

指标治理

指标价值树

指标体系

指标定义

指标自助

预计算

智能归因分析

指标口径

Aloudata CAN

指标平台

数据编织与逻辑集成

全量加载

实时同步

增量加载

数据复制

缓存策略

多源异构集成

CDC 技术

零复制技术

实时数据虚拟化

虚拟化视图

虚拟数据库

One SQL

查询下推

逻辑数据编织

逻辑数仓

自适应关系投影

Aloudata AIR

数据虚拟化

联邦查询

数据编织

数据架构与建模

ADS

DWS

DWD

ODS

ETL

数据隐私

数据合规

数据湖

OLAP

维度建模

数据集市

数据仓库