数据库与数据仓库
数据库和数据仓库之间区别的基础是数据仓库是一种用于数据分析的数据库。数据库是存储在计算机系统上的有组织的数据集合。以表格方式存储的学校学生、教师和班级的信息就是数据库的一个例子。由于数据库支持大量数据、并发处理和高效操作,因此得到了广泛的应用。但是,由于数据库经常需要更新,所以不可能有一个正确的视图来进行分析。因此,必须遵循数据仓库技术来实现这一点。数据仓库是一种特殊类型的数据库,但它是为查询和分析而优化的。由于数据仓库从各种来源和报表中提取数据,因此可以通过分析来做出决策。让我们在这里更详细地看看它们以及它们之间的区别。
什么是数据库(a database)?
数据库是存储在计算机系统中的相关数据的集合。通常,数据库是有组织的,它的数据是相关的。例如,一个学校数据库将有多个表作为教师、学生和班级,其中每个表都有指定每个项目信息的记录。在这里,我们可以看到这个结构是根据一定的标准组织起来的,因为它们都属于同一个学校,所以它们之间有关系。数据库在计算机世界中有许多用途。因此,它是如此著名,在各种应用中被发现非常丰富。数据库的基本优点是,数据库可以在非常小的空间中存储大量的数据,同时对数据进行非常快速和简单的操作。
数据库通常包括一个称为数据库管理系统(DBMS)的软件系统,它负责存储和管理数据库中的数据。MySQL、Oracle、microsoftsqlserver是一些著名的数据库管理系统。在计算机上创建数据库时,第一步是根据我们对系统的描述,创建一个逻辑结构,说明如何存储、组织和操作数据。这称为数据库建模。建模技术有关系模型、网络模型、面向对象模型、层次模型等,其中最著名的是关系模型。即使是最常用的数据库管理系统之一MySQL也使用关系模型来存储其数据库。
数据库支持四个函数,这些函数由首字母缩略词CRUD给出,CRUD指的是create、read、update和delete。在SQL中,create允许向表中**数据。Read允许您查询要检索的内容,而update允许您在必要时修改数据。删除用于在必须删除数据时删除数据。
什么是数据仓库(a data warehouse)?
数据仓库是用于分析数据的一种特殊类型的数据库。通用数据库通常用于事务处理,因此,它没有针对分析和报告进行优化。但是数据仓库是专门为分析任务而设计和优化的。数据仓库通常从事务处理系统的历史中获取数据,而其他各种数据源也可以提供数据。从各种来源提取数据后,它们将以通用视图进行报告。一个事务处理系统每秒涉及大量的操作,因此数据经常会更新,这使得人们很难在某个特定的点查看和分析它,从而做出决策。数据仓库准确地实现了这一点,它提取信息并以一种整洁的方式报告它,这样人们就可以分析它来做出决定。
数据库(database)和数据仓库(data warehouse)的区别
数据库是有组织的数据集合。数据仓库是一种特殊类型的数据库,它针对查询和报告而不是事务处理进行了优化。所以下面对一个通用数据库和一个数据仓库进行了比较。
•数据库存储当前数据,而数据仓库存储历史数据。
•数据库经常因频繁更新而发生变化,因此无法用于分析或做出决策。数据仓库提取数据并报告它们以进行分析并做出决策。
•通用数据库用于在线事务处理,而数据仓库用于在线分析处理。
•数据库中的表被规范化以实现高效存储,而数据仓库通常会降低效率以实现更快的查询。
•数据仓库上的分析查询比数据库上的查询快得多。
•数据库包含高度详细的数据,而数据仓库包含汇总数据。
•数据库提供详细的关系视图,而数据仓库提供汇总的多维视图。
•数据库可以执行大量并发事务,而数据仓库不是为此类任务而设计的。
小结:
数据仓库与数据库
数据库是存储在计算机系统上的有组织的数据集合。它存储了大量的数据,并且由于各种更新而经常发生变化。因此,它不能用于分析以做出决定。因此使用了数据仓库。数据仓库从各种数据源(包括通用数据库)中提取数据,然后以方便的方式报告这些数据,以便轻松地进行分析。一个重要的区别是数据库包含当前数据,而数据仓库包含历史数据。数据库用于事务处理,而数据仓库用于分析处理。
- Collage of five types of database models by Marcel Douwe Dekker (CC BY-SA 3.0)
- Data warehouse via Wikicomm*** (Public Domain)