什么是大数据时代(大数据的主要特征是什么)( 四 )
数据仓库的输入方是各种各样的数据源 , 最终的输出用于企业的数据分析、数据挖掘、数据报表等方向 。
14.什么是数据集市?数据仓库是面向整个企业的 , 而数据集市是面向部门的 , 因此规模更小 , 由业务部门设计、开发、管理、维护 , 可以理解为是数据库的子集 。
数据集市就像宜家楼上的家居展厅 , 正如其名字”集市”一样 , 是一个面向最终顾客的数据市场 。在这里 , 数据(家具)以一种更加容易被顾客接受的方式组合在一起 。顾客的需求是分场景的 , 比如客厅、书房、卧室、厨房等 , 因此我们需要创建多个数据集市(展厅) 。
文章图片
15.什么是数据湖?数据湖至今仍然没有一个特别标准的概念 , 比较统一的是数据湖存储的是未经加工的原始数据 , 包含结构化和非结构化的各类数据 。数据湖就是一个存储了企业所有原始数据的存储 , 对于这些原始数据的管理则更加复杂 。
以宜家家居为例 , 数据湖的原始数据就相当于拆散的零部件 , 顾客可以根据实际需要挑选零部件后自行组装 。
16.什么是数据挖掘?数据挖掘就是从大量的实际应用数据中 , 提取隐藏在其中的有价值的信息的过程 。
一般而言 , 数据挖掘分为两类:一类是监督学习 , 另一类是无监督学习 。监督学习是对目标需求的概念进行学习 , 通过建立模型来实现从观察变量到目标需求的有效解释 。无监督学习没有明确的标识变量来表达目标需求 , 主要任务是探索数据之间的内在联系和结构 。
数据挖掘融合了多学科领域的知识 , 常用的算法有分类、聚类分析、关联分析、趋势与演化分析、特征分析、异常分析等 。
17.什么是数据可视化?数据可视化就是借助图形化的手段 , 清晰有效地传达与沟通信息 。
利用人类对形状、颜色的敏感 , 有效地传递信息 , 帮助用户从数据中发现关系、规律和趋势 。常用的数据可视化图表有柱状图、条形图、饼图、雷达图、折线图、堆积图、散点图等 。
文章图片
18.什么是商业智能?商业智能(BI , Business Intelligence)是对商业信息的搜集、管理和分析过程 , 目的是使企业决策者获得洞察力 , 做出对企业更有利的决策 。
从技术层面上讲 , 商业智能不是什么新技术 , 它只是数据仓库、联机分析处理、数据挖掘、数据备份和恢复等技术的综合应用 。
文章图片
19.结语【什么是大数据时代(大数据的主要特征是什么)】
- 私人影院|私人影院是自己选电影吗
- 私人影院|私人影院按人数算还是房间算
- 影院|私人影院有摄像头监控犯法吗
- 春天|2022春天还要冷多久
- 上半年|2022年上半年雨水多不多
- 春天|2022年春天会不会干旱
- 春天|2022年春天是暖春还是冷春
- 春天|2022年春天为什么这么冷
- 春天|2022年春天是几月到几月
- 武汉|武汉樱花在哪个大学