ODS与数据仓库的区别

数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。

ODS是一个面向主题的、集成的、可变的、当前的细节数据集合,用于支持企业对于及时性的、操作性的、集成的全体信息的需求。常常被作为数据仓库的过渡,也是数据仓库项目的可选项之一。

操作型数据存储(Operational Data Store,ODS)用于战术型决策,而数据仓库支持战略型决策。操作型数据存储在某些方面具有类似于数据仓库的特点,但在另一些方面又显著不同于数据仓库:

l 像数据仓库那样,是面向主题的。

l 像数据仓库那样,其数据是完全集成的。

l 数据是当前的——或其数据处理技术允许这样,这与数据仓库存储历史数据的性质显著不同。ODS具有最少的历史数据,而尽可能接近实时地展示实体的状态。

l 数据是易失的和可更新的,这是与静态数据仓库的一个很大的区别。ODS就如同一个事务处理系统,当新的数据流进ODS时,受其影响的字段被新信息覆盖或更新。除审计数据外,不保留其他的历史内容。

l 数据几乎完全是细节数据,仅具有少量的动态聚集或汇总数据。通常将ODS设计成包含事务级的数据,即包含该主题域最低级别的数据。

l 在数据仓库中,几乎没有针对其本身的报表(报表均放到数据集市中完成);与此不同,在ODS中,业务用户频繁地直接访问ODS。

数据仓库和ODS并行架构设计:

这里写图片描述

便于扩展,ODS和数据仓库各做各的,形成优势互补!可以解决现在互联网公司遇到的快速变化、快速开发等特点!特别是对于那些刚刚创建数据团队,数据开发人员紧缺的公司,可以尝试使用这个数据架构解决问题!

发表评论

电子邮件地址不会被公开。 必填项已用*标注