首页

文章

数据仓库和数据库有什么区别和联系?

发布网友 发布时间:2022-03-27 00:41

我来回答

5个回答

热心网友 时间:2022-03-27 02:10

简而言之,数据库是面向事务的设计,数据仓库是面向主题设计的。

数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。

数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计。

数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表。维是看问题的角度,比如时间,部门,维表放的就是这些东西的定义,事实表里放着要查询的数据,同时有维的ID。

单从概念上讲,有些晦涩。任何技术都是为应用服务的,结合应用可以很容易地理解。以银行业务为例。数据库是事务系统的数据平台,客户在银行做的每笔交易都会写入数据库,被记录下来,这里,可以简单地理解为用数据库记帐。数据仓库是分析系统的数据平台,它从事务系统获取数据,并做汇总、加工,为决策者提供决策的依据。比如,某银行某分行一个月发生多少交易,该分行当前存款余额是多少。如果存款又多,消费交易又多,那么该地区就有必要设立ATM了。

显然,银行的交易量是巨大的,通常以百万甚至千万次来计算。事务系统是实时的,这就要求时效性,客户存一笔钱需要几十秒是无法忍受的,这就要求数据库只能存储很短一段时间的数据。而分析系统是事后的,它要提供关注时间段内所有的有效数据。这些数据是海量的,汇总计算起来也要慢一些,但是,只要能够提供有效的分析数据就达到目的了。

数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它决不是所谓的“大型数据库”。那么,数据仓库与传统数据库比较,有哪些不同呢?让我们先看看W.H.Inmon关于数据仓库的定义:面向主题的、集成的、与时间相关且不可修改的数据集合。

“面向主题的”:传统数据库主要是为应用程序进行数据处理,未必按照同一主题存储数据;数据仓库侧重于数据分析工作,是按照主题存储的。这一点,类似于传统农贸市场与超市的区别—市场里面,白菜、萝卜、香菜会在一个摊位上,如果它们是一个小贩卖的;而超市里,白菜、萝卜、香菜则各自一块。也就是说,市场里的菜(数据)是按照小贩(应用程序)归堆(存储)的,超市里面则是按照菜的类型(同主题)归堆的。

“与时间相关”:数据库保存信息的时候,并不强调一定有时间信息。数据仓库则不同,出于决策的需要,数据仓库中的数据都要标明时间属性。决策中,时间属性很重要。同样都是累计购买过九车产品的顾客,一位是最近三个月购买九车,一位是最近一年从未买过,这对于决策者意义是不同的。

“不可修改”:数据仓库中的数据并不是最新的,而是来源于其它数据源。数据仓库反映的是历史信息,并不是很多数据库处理的那种日常事务数据(有的数据库例如电信计费数据库甚至处理实时信息)。因此,数据仓库中的数据是极少或根本不修改的;当然,向数据仓库添加数据是允许的。

数据仓库的出现,并不是要取代数据库。目前,大部分数据仓库还是用关系数据库管理系统来管理的。可以说,数据库、数据仓库相辅相成、各有千秋。

补充一下,数据仓库的方案建设的目的,是为前端查询和分析作为基础,由于有较大的冗余,所以需要的存储也较大。为了更好地为前端应用服务,数据仓库必须有如下几点优点,否则是失败的数据仓库方案。

1.效率足够高。客户要求的分析数据一般分为日、周、月、季、年等,可以看出,日为周期的数据要求的效率最高,要求24小时甚至12小时内,客户能看到昨天的数据分析。由于有的企业每日的数据量很大,设计不好的数据仓库经常会出问题,延迟1-3日才能给出数据,显然不行的。

2.数据质量。客户要看各种信息,肯定要准确的数据,但由于数据仓库流程至少分为3步,2次ETL,复杂的架构会更多层次,那么由于数据源有脏数据或者代码不严谨,都可以导致数据失真,客户看到错误的信息就可能导致分析出错误的决策,造成损失,而不是效益。

3.扩展性。之所以有的大型数据仓库系统架构设计复杂,是因为考虑到了未来3-5年的扩展性,这样的话,客户不用太快花钱去重建数据仓库系统,就能很稳定运行。主要体现在数据建模的合理性,数据仓库方案中多出一些中间层,使海量数据流有足够的缓冲,不至于数据量大很多,就运行不起来了。

参考资料:http://searchdatabase.techtarget.com.cn/tips/229/2313729.shtml

热心网友 时间:2022-03-27 03:28

由于前天听到一个说法,集团公司需要部署数据仓库及BI的相关功能,一直以来,据我了解的是,BI只有在企业信息化达到了一定的层次才开始部署的,而且部署BI主要不是以软件功能为主,而是以企业建模为主的,因此,就这个问题,我分别与A工与B顾问进行了讨论,但得出了不同的结果,使的我可是越讨论越疑惑。

其中A工为国内某知名分销软件的总经理,银行系统出身,是IT方面的技术专家,虽然我自己也是软件开发出来的,但对于他在对行业业务的了解,对于软件开发、系统架构方面的本领可也是佩服的紧的;B顾问也是为国内知名的咨询公司的顾问,博士,认识时间不长,但也是受教不浅。

现在也听听他们是如何说数据仓库与BI的吧:

我与B顾问的讨论如下:

2006-4-12

20:35:42

Drate

B顾问

*老师,晚上好。

2006-4-12

20:36:09

Drate

B顾问

今天参加了IT规划成果的展示会,对于集团的整体信息规划算是了解了一个大概

2006-4-12

20:37:07

B顾问

Drate

H经理讲得如何?

2006-4-12

20:38:07

Drate

B顾问

嗯,说实话,我感觉针对有准备的内容讲的还算可以,但对于讨论的环节似乎回答问题还不能到点上

2006-4-12

20:38:49

Drate

B顾问

当然,对于有准备的内容,似乎讲的过程缺乏一些互动吧。:$,从听众的角度说的

2006-4-12

20:39:09

B顾问

Drate

喔,前面的内容是我和他一起准备的,后面的问题没有准备,不知他怎么回答的。

2006-4-12

20:39:33

B顾问

Drate

好像业务部门的反馈还可以。

2006-4-12

20:40:00

Drate

B顾问

嗯,整体来说是不错的了,而且说了这么多,一些需要说明的内容也说清楚了

2006-4-12

20:41:29

Drate

B顾问

只不过是我们可能会更挑剔一些吧

2006-4-12

20:41:54

B顾问

Drate

是的,每个人的水平不一样,理解也不一样。

2006-4-12

20:42:11

B顾问

Drate

其实那个金字塔和季节主线以及BI是可以将得非常精彩的。

2006-4-12

20:42:55

Drate

B顾问

是的,这一部分的内容与业务结合起来讲的话,将是出彩的一个部分

2006-4-12

20:43:26

B顾问

Drate

H经理现在基本理解了我们当初所说的意思,但是还是不深刻的。

2006-4-12

20:43:52

Drate

B顾问

但其实我自己心里还是有疑问的,也正好可以请教你,一般来说,BI是在有一定的数据积累才开始做的,而在目前的情形上就先上BI的系统,这合适吗?

2006-4-12

20:44:13

B顾问

Drate

这是很多人的误区

2006-4-12

20:44:31

B顾问

Drate

也是ERP厂商给客户带来的误区。

2006-4-12

20:44:44

B顾问

Drate

害了很多人。

2006-4-12

20:44:56

Drate

B顾问

看来我也是受害者之一。

2006-4-12

20:45:47

B顾问

Drate

其实象J公司现有系统的数据已经足够多了,但是没有充分利用起来,而且高层看不到效果,这是很致命的问题。

2006-4-12

20:45:54

Drate

B顾问

但“巧妇难为无米之炊”,没有数据积累,如何进行BI的相关工作,这也说的通呀。

2006-4-12

20:46:30

Drate

B顾问

嗯,也就是说,现有的系统积累的数据虽然是片段的、但目的还是需要考虑到应用是吧。

2006-4-12

20:46:47

B顾问

Drate

怎么“无米”呢

2006-4-12

20:47:03

Drate

B顾问

嗯,这就涉及到前期的数据仓库的问题了

2006-4-12

20:47:08

B顾问

Drate

现有的系统和金蝶大量的数据就是米啊

2006-4-12

20:47:18

B顾问

Drate

否则我们怎么做报表

2006-4-12

20:47:27

B顾问

Drate

刚开始做BI,不要寄很高的期望

2006-4-12

20:48:22

B顾问

Drate

把现在手头的报表实现,然领导任意角度观察和钻探,这是很大的进步呢,然后在此基础上有些提升就非常好了。

2006-4-12

20:48:36

Drate

B顾问

这里的米就涉及到“米”中含有的“沙”的含量有多少的问题了。数据仓库,其实更多的是由咨询顾问对企业进行建模然后,需要对原有数据进行一个“数据清洗”的过程的,而原来他们这些数据是否应该会有这一个槛要过的?

2006-4-12

20:49:15

B顾问

Drate

完全没有必要担心,这是一个正反馈机制,先有后好

2006-4-12

20:49:45

B顾问

Drate

如果领导用了发现数据标准,自然会促使系统的数据更准确

2006-4-12

20:49:55

B顾问

Drate

而不是期望数据好了以后再上。

2006-4-12

20:50:40

B顾问

Drate

如果说因为数据不好,不上BI,那报表怎么办?

2006-4-12

20:50:50

B顾问

Drate

还不是从系统中来的?

2006-4-12

20:51:00

Drate

B顾问

嗯,我们原来一直的方向是,报表是直接从系统中来

2006-4-12

20:52:03

Drate

B顾问

只是我们可能把BI这一块的功能更多的上升到了一个高度,认为它是带有一些“神秘”色彩的高级玩艺。

2006-4-12

20:54:06

B顾问

Drate

一点不神秘,从技术角度比报表容易多了,从管理角度比报表灵活多了。

2006-4-12

20:56:01

Drate

B顾问

呵呵,是这样的,今天看了一下H经理的演示,感觉是非常灵活,而且管理层会比较容易接受

2006-4-12

21:32:11

B顾问

Drate

不好意思,刚才有人来了。

2006-4-12

21:32:32

B顾问

Drate

我觉得你也可以考虑用这个东西,比较便宜的。

我与A工的讨论如下:

2006-04-12 15:05:42 小虫(Drate)

呵呵,正好,今天参加集团公司的IT规划成果会议,下午他们还在继续呢

2006-04-12 15:05:56 A工

整个集团的?:)

那是大手笔了:)

2006-04-12 15:07:22 小虫(Drate)

是呀,比较夸张的

2006-04-12 15:08:16 A工

好啊

这么宏伟

我们切一小块就知足了:)

2006-04-12 15:09:32 A工

DRP VIP POS 第一阶段

ERP 第二阶段

后面的我就没什么意见了

太高了:)

2006-04-12 15:10:13 小虫(Drate)

当然,目前他们在做的是BI和数据仓库,这个你想不到吧

2006-04-12 15:10:05 A工

这个反而先做?!

2006-04-12 15:10:13 A工

不可思议

哪来数据?

2006-04-12 15:10:50 小虫(Drate)

今年他们要启动BI、数据仓库、协同办公、DRP这几个项目呢

2006-04-12 15:11:12 小虫(Drate)

用他们原来老的系统的数据吧,而且现在已经在找供应商了吧

2006-04-12 15:19:35 小虫(Drate)

他们这个蓝图说实现起来的话,要投资****万,听了有些害怕

2006-04-12 15:21:56 A工

这是他们的长处吧

我是农民

只知道稻子怎么从田里种出来

至于商人们怎么包装去忽悠顾客

说包治阳萎肾虚

那就不关我们事情了:)

2006-04-12 15:22:22 A工

drp *** 万

那就找国外的了

2006-04-12 15:22:56 A工

不知道A公司和国外哪一家合作

国内的现在他们主要是和B公司

2006-04-12 15:24:08 小虫(Drate)

呵呵,他们的话有和B公司接触,但B公司据我所知的话,做的都是小企业的了

2006-04-12 15:24:03 A工

可是B公司很会吹

2006-04-12 15:24:31 A工

他们的系统

我随意可以删掉数据库

不想公布而已

呵呵

2006-04-12 15:25:15 A工

没有必要太狠

不过他们很多时候行径太恶劣了

呵呵

2006-04-12 15:26:02 小虫(Drate)

呵呵,但这个很现实的,这么大一个系统,不是靠吹出来的,上次吃饭的时候,我和老肖觉的,如果要做分销的话,你们的和BJ的可以考虑,如果用国外的系统的话,估计难度更高,而H经理还有想法是上SAP,但自己心里没有底,估计也不知道如何做选择呢

2006-04-12 15:28:11 小虫(Drate)

关键还是没有一个主心骨吧,现在在上BI的,说实话,这个太玄了,感觉这个东西麻烦大大的

2006-04-12 15:27:55 A工

BJ也是流氓:)

我们在苏州快签下来的单子

他们一去就许诺给客户20万

还好没得逞

其它项目就不说了

他们的系统是终端仿真的

只是门店用了.net

2006-04-12 15:29:46 A工

BI主要的问题不是软件

2006-04-12 15:30:00 A工

是企业自己建模

2006-04-12 15:30:26 小虫(Drate)

呵呵,其实打单的时候,估计都会用手段。

2006-04-12 15:30:07 A工

软件都很成熟的

2006-04-12 15:30:21 A工

是的,很正常

就是造谣太厉害了

2006-04-12 15:30:44 小虫(Drate)

嗯,他们现在没有这个概念吧,他们把BI和数据仓库还是定位为软件系统

2006-04-12 15:30:34 A工

BI和数据仓库绝对不是软件

2006-04-12 15:30:46 A工

软件的成分远远低于DRP

2006-04-12 15:31:32 小虫(Drate)

但他们现在连软件都选好了,正一股脑的向上面上去呢

2006-04-12 15:31:33 A工

我都有些想退出江湖了:)

不是全退

是商业的事情不干

2006-04-12 15:32:22 小虫(Drate)

嗯?怎么个说法?找个CEO来做商务的事情?

2006-04-12 15:32:11 A工

国外帮人家上BI

主要是咨询专家

而不是软件工程师

2006-04-12 15:32:45 A工

呵呵,有合适的人就交出去了

这方面我不擅长

如果哪一天

发现技术也不擅长

那就幸福咯

2006-04-12 15:33:29 小虫(Drate)

呵呵,不过这个BI的东西主要是H集团的高层想要用吧,但也没有人提出反对

2006-04-12 15:34:34 A工

领导兴头上

下面不反对是正常的:)

2006-04-12 15:35:27 小虫(Drate)

呵呵,但至少也进行一个说明吧,有些是基本的过程总是要遵守的

2006-04-12 15:36:37 A工

到时候就说IT不好,其它部门的人是不用承担责任的

2006-04-12 15:37:49 小虫(Drate)

我今天听了一天的会下来,总之就是觉的玄!!!所以的话,这个玄的话就是高风险了

2006-04-12 15:39:32 A工

是的

后果不是钱的问题

因为实际上投入一些钱后

看不对劲

就会停下来的

麻烦的是

以后对上这类项目大家都怕了

2006-04-12 15:40:13 A工

我们现在一个客户

哈森

很大的

就有这个问题

跑到哪里

大家都说

那就看看吧

以前都失败几次了

没信心了

2006-04-12 15:41:07 小虫(Drate)

嗯,是呀,所以的话,折腾不成的话,基本上信息化到H集团的话是很难会有什么起色的了

========================

跟两位聊完,其实倒还真的是把我给聊糊涂了,呵呵,看来还是需要自力更生,需要自己再去找答案。

注:以上内容主要是为了抛出来供大家讨论用,请不要胡乱猜测,对号入坐,当然,如果当事人看到,请包含一二,以上内容以讨论为主,同时我也隐掉了关键性的名词,望海涵。

http://www.learn-it.cn/Info_9134.htm

参考资料:http://www.learn-it.cn/Info_9134.htm

热心网友 时间:2022-03-27 05:03

付费内容限时免费查看回答您好!简而言之,数据库是面向事务的设计,数据仓库是面向主题设计的。

数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。

数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计。

数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表。维是看问题的角度,比如时间,部门,维表放的就是这些东西的定义,事实表里放着要查询的数据,同时有维的ID。

热心网友 时间:2022-03-27 06:54

首先我们来了解数据仓库和数据库分别是什么:
1、数据库:是一种逻辑概念,用来存放数据的仓库,通过数据库软件来实现。数据库由很多表组成,表是二维的,一张表里面有很多字段。字段一字排开,对数据就一行一行的写入表中。数据库的表,在于能够用二维表现*的关系。如:oracle、DB2、MySQL、Sybase、MSSQL Server等。
2、数据仓库:是数据库概念的升级。从逻辑上理解,数据库和数据仓库没有区别,都是通过数据库软件实现存放数据的地方,只不过从数据量来说,数据仓库要比数据库更庞大德多。数据仓库主要用于数据挖掘和数据分析,辅助领导做决策;

区别主要总结为以下几点:

1.数据库只存放在当前值,数据仓库存放历史值;
2.数据库内数据是动态变化的,只要有业务发生,数据就会被更新,而数据仓库则是静态的历史数据,只能定期添加、刷新;
3.数据库中的数据结构比较复杂,有各种结构以适合业务处理系统的需要,而数据仓库中的数据结构则相对简单;
4.数据库中数据访问频率较高,但访问量较少,而数据仓库的访问频率低但访问量却很高;
5.数据库中数据的目标是面向业务处理人员的,为业务处理人员提供信息处理的支持,而数据仓库则是面向高层管理人员的,为其提供决策支持;
6.数据库在访问数据时要求响应速度快,其响应时间一般在几秒内,而数据仓库的响应时间则可长达数几小时

热心网友 时间:2022-03-27 09:02

一直想整理一下这块内容,既然是漫谈,就想起什么说什么吧。我一直是在互联网行业,就以互联网行业来说。先大概列一下互联网行业数据仓库、数据平台的用途:

玉米仁子饭产自哪里 中国期货交易所的交易品种有哪些? 历史要怎么读,有啥诀窍 高中历史诀窍 年终会活动策划方案 深度解析:第一财经回放,探索财经新风向 逆水寒手游庄园怎么邀请好友同住 逆水寒手游 逆水寒不同区可以一起组队吗? 逆水寒手游 逆水寒怎么进入好友世界? 逆水寒手游 逆水寒怎么去别人的庄园? 使用puppeteer实现将htmll转成pdf 内卷时代下的前端技术-使用JavaScript在浏览器中生成PDF文档 【译】将HTML转为PDF的几种实现方案 变形金刚08动画怎么样 变形金刚08动画的问题 变形金刚08动画日语版剧情介绍 高分!换显卡nvidia控制面板被我卸了,重新安装显卡驱动后没了nvidia控... 我的nvidia控制面板被卸载了 怎么找回啊 卸载后 这个画面看着很奇怪_百 ... 李卓彬工作简历 林少明工作简历 广东工业职业技术学院怎么样 郑德涛任职简历 唐新桂个人简历 土地入股的定义 ups快递客服电话24小时 贷款记录在征信保留几年? 安徽徽商城有限公司公司简介 安徽省徽商集团新能源股份有限公司基本情况 安徽省徽商集团有限公司经营理念 2019哈尔滨煤气费怎么有税? 快手删除的作品如何恢复 体育理念体育理念 有关体育的格言和理念 什么是体育理念 万里挑一算彩礼还是见面礼 绿萝扦插多少天后发芽 绿萝扦插多久发芽 扦插绿萝多久发芽 炖牛排骨的做法和配料 网络诈骗定罪标准揭秘 “流水不争先”是什么意思? mc中钻石装备怎么做 为什么我的MC里的钻石块是这样的?我想要那种。是不是版本的问题?如果是... 带“偷儿”的诗句 “君不见巴丘古城如培塿”的出处是哪里 带“奈何”的诗句大全(229句) 里翁行()拼音版、注音及读音 带“不虑”的诗句 “鲁肃当年万人守”的出处是哪里 无尘防尘棚 数据仓库的含义是什么?数据仓库和数据库的区别是什么? 数据仓库的含义,数据仓库和数据库的区别.? 数据库根数据仓库有什么区别,如何区分? 详解数据仓库和数据库的区别 数据库和数据仓库有什么区别? 数据库和数据仓库的区别在哪儿 数据库 与 数据仓库的本质区别是什么? 数据仓库与数据库的主要区别有 如何区别数据库、数据中台、数据湖? 数据库和数据仓库的区别是什么? 数据库与数据仓库的本质区别是什么? 数据库与数据仓库的区别 数据湖和数据仓库的区别是什么? JAVA程序员面试总结,高手整整理加强版 JVM的运行机制是什么 java两年经验面试都会问什么问题 描述一下JVM加载class文件 的原理机制? 面试java要写熟悉jvm? 为什么面试中总会被问到Java虚拟机 jvm是怎样的一种机制,java程序如何运行 数据仓库跟数据库有什么异同点 数据库,数据仓库和数据挖掘技术之间的区别 数据库和大数据的区别? 我提前几天在美团上订购了酒店,入住时还需提前电话通知商家吗? 美团订酒店怎么维权? 美团的号码保护 商家怎么联系我 美团怎么联系商家帮他要赞挣佣金 为什么美团总是订房又马上取消了 美团订房商家一直不确认订单怎么办? 之前消费的美团商家怎么找不到了 美团酒店商家差评怎么找到客户联系方式 美团订房商家不给退款怎么办 华为荣耀V30怎么样? 荣耀v30pro后盖是什么材质的? 荣耀V30性价比怎么样 值得买啵? 荣耀v30好不好了? 华为v30后盖是什么材质的玻璃? 荣耀V30值不值的买 性价比怎样? 华为荣耀v30的3.10版本好不好 nike苹果手表能单独使用吗
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com