什么是数据仓库体系结构?(data warehouse architecture?)

数据仓库体系结构是一种为企业环境封装数据仓库所有方面的设计。数据仓库是创建一个中心域,将复杂、分散的企业数据存储在一个逻辑单元中,该逻辑单元支持数据挖掘、商业智能和对组织内所有相关数据的全面访问。数据仓库体系结构包括所有报告要求、数据管理、安全要求、带宽要求和存储要求。...

数据仓库体系结构是一种为企业环境封装数据仓库所有方面的设计。数据仓库是创建一个中心域,将复杂、分散的企业数据存储在一个逻辑单元中,该逻辑单元支持数据挖掘、商业智能和对组织内所有相关数据的全面访问。数据仓库体系结构包括所有报告要求、数据管理、安全要求、带宽要求和存储要求。

Data warehousing is the creation of a central domain to store complex, decentralized enterprise data in a logical unit that enables data mining, business intelligence, and overall access to all relevant data within an organization.

在创建数据仓库体系结构时,重要的是将体系结构分解为特定的域,并将这些域加入到整体的最终设计中。该设计应被视为企业数据体系结构的蓝图。特别是,在考虑数据仓库体系结构时,应开发几个主要领域。这些领域包括源系统访问、暂存区流程、数据充实流程、数据体系结构、商业智能流程和存储需求。

Well-structured data warehouses can be 'mined' later for valuable insights.

数据仓库要求将源数据从事务数据库或记录数据库传输到数据仓库。这个过程被简化为术语提取转换和加载(ETL),它基本上封装了源系统访问、数据丰富和数据体系结构等领域。为了清晰起见,最好详细设计这些体系结构区域,其中概述了如何实现ETL过程。虽然需要来自源系统的一些数据,但并非所有数据都是可取的,因为这会使企业仓库负担过重。在处理源系统层时,主要关注的领域是数据访问方法、源系统所需的数据以及刷新要求。

下一个数据仓库体系结构层要考虑的是分级区域过程。由于来自源系统的大多数数据都需要验证和数据清理,因此在加载到数据仓库的业务规则层之前,为源数据创建一个驻留的登录区域非常重要。暂存区维护来自源系统的原始数据源,这些源系统通常带有时间戳,以确保数据的最新性。

数据充实或业务规则流程是清理数据以满足数据仓库预期结果的过程。这种清理方法的一个很好的例子是使用地址清理工具;如果源系统有不正确的数据,数据充实过程将把原始数据集中的地址运行到一个业务规则系统中,该系统将纠正无效的地址。这也是删除或修改不准确数据以确保数据仓库内完整性的时间。

下一层要考虑的是数据体系结构层。这是完成企业数据仓库的真正设计或模式的地方。数据仓库不是一个企业内所有数据集的组合,而是一个新定义的数据库,它的构建目的是对企业内的所有业务实体进行概述。

这需要数据体系结构回答业务部门在商业智能和数据挖掘领域提出的问题。通过以这种方式创建数据体系结构,原始数据集将转换为事实表,从而允许用户对整个企业视图而不是特定数据库执行即席报告。这也是维护原始系统数据元数据的区域,其中可能包括源系统名称或主键。

下一个要考虑的领域是商业智能和报告需求。这一层可以被认为是面向用户的数据仓库需求。通常,此区域包含固定报告、临时报告功能和企业仪表板或警报。商业智能层通常得到最多的考虑,因为它是数据仓库中唯一面向外部的组件。

考虑的最后一层是总体数据存储需求和维护。随着数据仓库的不断增长和扩展,必须严格管理和维护基于用户的数据存储。此外,在创建数据仓库体系结构时,设计人员应该对形成数据存储容量以及具有数据访问容量的频带所需的内容做出现实的估计。随着数据仓库在整个企业中的广泛应用,这些要求将变得至关重要。

  • 发表于 2021-12-13 13:14
  • 阅读 ( 98 )
  • 分类:互联网

你可能感兴趣的文章

数据库(database)和数据仓库(data warehouse)的区别

...用于在必须删除数据时删除数据。 什么是数据仓库(a data warehouse)? 数据仓库是用于分析数据的一种特殊类型的数据库。通用数据库通常用于事务处理,因此,它没有针对分析和报告进行优化。但是数据仓库是专门为分析任务而...

  • 发布于 2020-10-23 10:28
  • 阅读 ( 231 )

数据库(database)和数据仓库(data warehouse)的区别

...说,数据库有助于安排一组数据。 什么是数据仓库(data warehouse)? 商业智能有助于改善业务。它将数据转换为有用的信息,用于业务分析。它还有助于为最终用户提供业务见解。数据仓库支持商业智能过程。一个公司可以通过Ora...

  • 发布于 2021-06-30 17:27
  • 阅读 ( 305 )

片(slice)和数据仓库中的骰子(dice in data warehouse)的区别

...,Dice,OLAP,切片 什么是数据仓库中的切片(slice in data warehouse)? OLAP多维数据集是多维数据数组。数据作为一个具有层次维度的立方体有助于分析。对齐的数据更易于可视化并提高了生产效率。 Figure 1: OLAP slicing 切片为多维数...

  • 发布于 2021-07-01 02:40
  • 阅读 ( 489 )

etl公司(etl)和数据仓库(data warehouse)的区别

...多个表的内容并重新加载新数据。 什么是数据仓库(a data warehouse)? 数据仓库是一个支持商业智能过程的系统。它将数据转换为有意义的信息,以便分析业务。因此,它是一个宝贵的资源,为管理一个组织的决策。 此外,一个组...

  • 发布于 2021-07-01 03:18
  • 阅读 ( 469 )

数据集成(data integration)和etl公司(etl)的区别

...Own work (CC BY-SA 4.0) via Comm*** Wikimedia2. “Datawarehouse reference architecture” By DataZoomers –  (CC BY-SA 4.0) via Comm*** Wikimedia 

  • 发布于 2021-07-01 03:55
  • 阅读 ( 610 )

数据湖(data lake)和数据仓库(data warehouse)的区别

...有对数据进行编目和保护的机制。 什么是数据仓库(data warehouse)? A data warehouse is a system that improves the business intelligence process. It converts data into valuable information in order to ****yze the business. Thus, this helps to monitor the current status and to make...

  • 发布于 2021-07-01 08:18
  • 阅读 ( 502 )

数据仓库(data warehouse)和数据集市(data mart)的区别

...较 关键术语 数据仓库、数据集市 什么是数据仓库(data warehouse)? 数据仓库是从各种操作系统收集数据的存储库。它从数据源捕获数据以进行分析并获取业务见解。数据仓库从多个数据源获取数据。此外,这些数据源可以是Excel...

  • 发布于 2021-07-01 08:24
  • 阅读 ( 534 )

数据仓库(data warehouse)和商业智能(business intelligence)的区别

...较 关键术语 商业智能、数据仓库 什么是数据仓库(data warehouse)? 数据仓库是一个支持商业智能过程的系统。它将数据转换成有意义的信息。高级管理层使用这些信息来做出决策和分析业务。此外,组织可以根据这些信息增加客...

  • 发布于 2021-07-01 21:59
  • 阅读 ( 484 )

数据仓库(data warehouse)和数据集市(data mart)的区别

...的差别,特别是当涉及到所服务的用户时。数据仓库(data warehouse) vs. 数据集市(data mart)数据仓库和数据集市的区别在于,数据仓库是用于在整个组织级别分析数据的设置,而数据集市是数据仓库的子集,用于分析特定域/用户的数...

  • 发布于 2021-07-09 12:41
  • 阅读 ( 1513 )

数据库(database)和数据仓库(data warehouse)的区别

...管理中使用不同的技术。数据库(database) vs. 数据仓库(data warehouse)数据库和数据仓库的区别在于,数据库是用来记录数据或信息的,而数据仓库主要用于数据分析。然而,以上并不是唯一的区别。两个术语在某些参数上的比较可...

  • 发布于 2021-07-11 06:04
  • 阅读 ( 472 )
vcox2120
vcox2120

0 篇文章

相关推荐