数据仓库(data warehouse)和数据集市(data mart)的区别

数据分析是任何组织最受欢迎的需求之一。分析需求会加快速度和势头,特别是当组织在跨越多个单位和部门的一段时间内成长时。...

数据分析是任何组织最受欢迎的需求之一。分析需求会加快速度和势头,特别是当组织在跨越多个单位和部门的一段时间内成长时。

在任何时候,实体都希望评估数据,以了解和/或做出与整个部门或子部门相关的决策。数据仓库和数据集市是在这些场景中使用的最受欢迎的工具。数据仓库和数据集市执行相同的任务,即。然而,在数据分析方面,它们有细微的差别,特别是当涉及到所服务的用户时。

数据仓库(data warehouse) vs. 数据集市(data mart)

数据仓库和数据集市的区别在于,数据仓库是用于在整个组织级别分析数据的设置,而数据集市是数据仓库的子集,用于分析特定域/用户的数据。

数据仓库(data warehouse)和数据集市(data mart)的区别

然而,以上并不是唯一的区别。两个术语在某些参数上的比较可以揭示一些微妙的方面:

Parameter of Comparison Data Warehouse Data Mart
意义 用于存储、检索、管理、报告和分析大量任何类型数据的系统 数据集市是数据仓库的一个子类型或子集
目的 用于数据分析 用于分析数据,但针对特定群体或用户或为其设计
实施视角 由于复杂性和处理大数据的能力,需要更多的时间 由于只专注于特定领域,时间更短
主题领域 它不专注于任何特定领域或主题,而是作为一个整体用于整个业务 它是面向主题的,例如,与人力资源部门相关的数据分析
数据量 是的 不,因为它是特定于某些用户的
宏观还是微观 用于整个组织 仅针对特定用户,因此可以认为在微观层面上是合适的
哪一个更有用? 取决于特定的需求,但总体上可以认为更有用,因为它提供了整个业务(包括所有部门)的信息 取决于特定的需求,但总体而言,由于它仅限于某些域/用户组,因此可能被认为没有多大帮助

数据仓库与数据集市对照表(表格形式)

什么是数据仓库(data warehouse)?

数据仓库是管理海量数据的首选系统。数据仓库是分析数据的有力工具。数据仓库是一个信息系统,用于仔细检查、调查和分析繁琐而庞大的数据量,这些数据量可以是历史数据,也可以是当前数据。

数据仓库的工作原理是从许多来源或应用程序收集数据,对其进行处理,最后进行分析。此过程有助于生成大量摘要和定制报告,以供管理决策使用。数据仓库的一个有趣的特性是,当添加新数据时,存储的数据不会被擦除。

就数据分析而言,数据仓库对一个组织来说是一个福音。数据仓库主要用于对数据进行报告、压缩、分析、调查、整合和汇总,对数据进行判断和确定。数据仓库包含复杂的技术,以实现快速搜索和准确分析。

数据仓库有一些缺点,使某些组织无法实现相同的功能。一些主要缺点包括昂贵的实现和持续的维护。此外,如果涉及的数据过于复杂和庞大,处理时间可能会大大减少。

什么是数据集市(data mart)?

数据集市是数据仓库的一部分(类型)。简单来说,数据集市是数据仓库环境的访问层,用于将数据分发给特定用户。数据集市可以看作是数据仓库的一个子集(也是重要的一个子集)。

数据集市是以主题或目标为导向的,这意味着它是为满足组织内特定组或部门的需求而构建的。例如,本组织的人力资源司可能有兴趣分析留任和离职趋势的数据。在这种情况下,数据集市将帮助生成所需的结果。

数据集市简单易管理,成本更低。数据集市利用有限的数据量并快速处理相同的数据。由于数据集市只专注于某些特定的用户/部门,因此在微观层面或特定的业务线评估数据是一个福音。

数据集市有一些缺点。例如,数据集市只能从有限/很少的源中提取数据,只能存储有限数量的数据,并且会有一定的大小限制。此外,随着组织的发展,可能会有创建太多数据集市的趋势,这可能是一个复杂的过程。数据集市不能被视为数据分析解决方案的企业级平台。

数据仓库和数据集市的主要区别

  • 数据仓库是一个管理和分析海量数据的系统。数据集市是一种数据仓库。
  • 数据仓库将所有部门/业务的数据作为一个整体进行管理。数据集市专注于特定的域/用户/组。
  • 数据仓库的实现和设计是一个复杂的过程,需要时间。数据集市的设计和实现非常简单,而且花费的时间更少。
  • 数据仓库可以接收大量的数据,但需要更多的时间来处理。数据集市只需要较少的数据进行处理,但处理速度很快。
  • 数据仓库的大小范围非常大(可能超过1tb)数据集市的大小很小(仅以国标为单位)。
  • 数据仓库对于整个组织来说更有用。数据集市对于单个域/部门更有帮助。

结论

数据仓库和数据集市在数据管理能力上非常相似。两者都有多种不同的好处,但也有一些缺点。数据仓库和数据集市服务于相同的目的(即数据分析),但它们服务于不同的用户组。

数据仓库将在组织层面提供帮助,而数据集市将在部门层面提供支持。因此,在决定采用数据仓库或数据集市之前,评估这些方面以及个人/组织/部门的需求非常重要。

一个谨慎的选择是从数据仓库开始,如果有特定的主题需要的话,再转到数据集市。为了充分利用数据仓库或数据集市部署带来的好处,建议对数据管理专家进行深入的实际理解和建议。

最重要的焦点应该始终保持在正确的角度,是实施的系统是否将服务于组织的最终目的。

参考文献

  • https://go.gale.com/ps/i.do?id=gale%7ca18993844&锡德=谷歌学者;v=2.1和;it=r&Link访问=abs&issn=00010782&p=一个(&a) ;sw=w
  • https://dl.acm.org/doi/abs/10.1145/313310.313345
  • https://ieeexplore.ieee.org/abstract/document/6108446/

  • 发表于 2021-07-09 12:41
  • 阅读 ( 1503 )
  • 分类:IT

你可能感兴趣的文章

数据库(database)和数据仓库(data warehouse)的区别

...用于在必须删除数据时删除数据。 什么是数据仓库(a data warehouse)? 数据仓库是用于分析数据的一种特殊类型的数据库。通用数据库通常用于事务处理,因此,它没有针对分析和报告进行优化。但是数据仓库是专门为分析任务而...

  • 发布于 2020-10-23 10:28
  • 阅读 ( 226 )

数据仓库(data warehousing)和数据集市(data marts)的区别

数据仓库与数据集市 你应该先建立哪一个:数据仓库还是数据集市?这个问题最近一直困扰着IT经理。大多数供应商都会说,数据仓库很难做到,而且成本很高,因此不可取。他们说建立数据仓库需要很长时间。此外,他们还...

  • 发布于 2021-06-23 12:41
  • 阅读 ( 169 )

数据库(database)和数据仓库(data warehouse)的区别

...说,数据库有助于安排一组数据。 什么是数据仓库(data warehouse)? 商业智能有助于改善业务。它将数据转换为有用的信息,用于业务分析。它还有助于为最终用户提供业务见解。数据仓库支持商业智能过程。一个公司可以通过Ora...

  • 发布于 2021-06-30 17:27
  • 阅读 ( 300 )

数据挖掘(data mining)和数据仓库(data warehousing)的区别

...些是数据挖掘中使用的主要技术。 什么是数据仓库(data warehousing)? 在企业组织中,数据存在于各种数据库中。首先,从多个数据源中提取和转换数据。然后,它们被加载到一个称为数据仓库的中心位置。数据仓库是将各种数据...

  • 发布于 2021-06-30 17:39
  • 阅读 ( 507 )

片(slice)和数据仓库中的骰子(dice in data warehouse)的区别

...,Dice,OLAP,切片 什么是数据仓库中的切片(slice in data warehouse)? OLAP多维数据集是多维数据数组。数据作为一个具有层次维度的立方体有助于分析。对齐的数据更易于可视化并提高了生产效率。 Figure 1: OLAP slicing 切片为多维数...

  • 发布于 2021-07-01 02:40
  • 阅读 ( 484 )

etl公司(etl)和数据仓库(data warehouse)的区别

...多个表的内容并重新加载新数据。 什么是数据仓库(a data warehouse)? 数据仓库是一个支持商业智能过程的系统。它将数据转换为有意义的信息,以便分析业务。因此,它是一个宝贵的资源,为管理一个组织的决策。 此外,一个组...

  • 发布于 2021-07-01 03:18
  • 阅读 ( 455 )

依赖的(dependent)和独立数据集市(independent data marts)的区别

从属数据集市和独立数据集市之间的主要区别在于,从属数据集市从已创建的数据仓库获取数据,而独立数据集市直接从操作源和/或外部源获取数据。 简言之,数据仓库是一个帮助分析数据、创建报表并将其可视化以做出业务...

  • 发布于 2021-07-01 03:47
  • 阅读 ( 508 )

数据集成(data integration)和etl公司(etl)的区别

...如关系数据库、XML数据库等。 什么是etl公司(etl)? A data warehouse is a system that helps to ****yze data, create reports and visualize them. The managers, data ****ysts, business ****ysts can ****yze this data to take business decisi***. There are three steps to follow before stori...

  • 发布于 2021-07-01 03:55
  • 阅读 ( 603 )

数据湖(data lake)和数据仓库(data warehouse)的区别

...有对数据进行编目和保护的机制。 什么是数据仓库(data warehouse)? A data warehouse is a system that improves the business intelligence process. It converts data into valuable information in order to ****yze the business. Thus, this helps to monitor the current status and to make...

  • 发布于 2021-07-01 08:18
  • 阅读 ( 492 )

数据仓库(data warehouse)和商业智能(business intelligence)的区别

...较 关键术语 商业智能、数据仓库 什么是数据仓库(data warehouse)? 数据仓库是一个支持商业智能过程的系统。它将数据转换成有意义的信息。高级管理层使用这些信息来做出决策和分析业务。此外,组织可以根据这些信息增加客...

  • 发布于 2021-07-01 21:59
  • 阅读 ( 476 )
itv4362
itv4362

0 篇文章

相关推荐