16.大数据与数据集市

日期: 2022-09-29 17:38:19
来源: 十堰政府网

一节学习了数据仓库,这一节学习数据集市。数据仓库与数据集市是什么关系呢?不同的专家有不同的认识和争论。严谨说,我们放弃争论,求同存异。他比喻说,数据仓库就像商超的仓库,数据集市就像商超的分类柜台。前一个包罗万象,后一个按需索取。

什么是数据集市?数据集市也叫数据市场,是满足特定的部门或者用户的需求,按照多维的方式进行存储,生成面向分析需求的数据立方体。

多数情况下,可以理解为,数据集市是数据仓库的分类“店铺”。数据集市比数据仓库小得多,它可以容纳几十千兆,数据仓库却可以存储几百千兆到PB级数据。

从数据集市与数据仓库的关系来看,数据集市可分为两大类型:

一是独立型数据集市。数据来自于操作型数据库。它的开发周期较短,具有灵活性,但是脱离了数据仓库,独立建立的数据集市可能会导致信息孤岛。

二是从属型数据集市。数据来自于数据仓库,这就导致开发周期长,但是它比独立型数据集市更稳定,可以提高数据分析质量,保证数据的一致性。

著名专家恩门说:不可能将大海里的小鱼堆在一起来构成一头大鲸鱼。从长远角度看,从属型数据集市更加统一和稳定,是未来建设的主要方向。

责任编辑: 周珍
方针政策权威发布,网上问政快速回应,最新资讯随时掌握。
十堰发布
  • 欢迎关注十堰政府网官方微信“十堰发布”
  • ① 打开微信——发现——扫一扫,扫描左侧的微信二维码关注。
  • ② 打开微信——通讯录——右上角“添加”,搜索“十堰发布”“syfb0719”关注。