什么是大数据时代(大数据的主要特征是什么)

什么是大数据时代(大数据的主要特征是什么)
文章图片

01.什么是大数据?数据是对客观事实进行记录的一种符号 , 可以是数字、文字 , 也可以是图片、音频、视频 。大数据是指无法在一定时间范围内用常规软件进行捕捉、管理和数据的数据集合 。
大数据具有”5V”特点 , 即数据量大、数据多样性、价值密度低、增长速度快、数据质量低 。
大数据时代强调数据的全部 , 而不是局部的样本数据 。由于大数据的价值密度低 , 我们要接受这种模糊和不精确性 。通过对数据的研究 , 发现以前不曾发现的联系 , 而不是像小数据时代 , 先通过假设 , 然后再用数据来验证 。也就是说 , 在大数据时代 , 对相关性的重视程度要强于因果性 。
02.什么是结构化和非结构化数据?结构化数据是适合用二维表格展现的数据 。每一行是一条记录 , 每一列是不同的字段 。
以电商网站为例 , 用户信息就可以用结构化数据来存储 。每位用户就是一条记录 , 而每位用户又有姓名、性别、地址、手机、邮箱等字段 , 这样就形成了一个二维表格 。
什么是大数据时代(大数据的主要特征是什么)
文章图片

非结构化数据不适合用二维表格来展现 , 比如文档、图片、音频、视频等 。非结构化数据的格式多样 , 难以标准化和理解 , 因此在存储、检索、利用上都需要更加有效的方法和技术 。
03.什么是数据库?数据库从字面意思来看就是存储数据的地方 , 但数据的存储不是杂乱无章的 , 而是按照一定的规则来存储的 , 具有可共享和便于管理的特点 。数据库被视为电子化的文件柜 。用户可以对数据库中的数据进行增、删、改、查等操作 。
数据库可分为关系型数据库、非关系型数据库、数据仓库等类型 。
04.什么是关系型数据库?关系型数据库是指使用关系模型来组织数据的数据库 。关系模型可以简单理解为二维表格模型 , 以行和列的形式存储数据 , 因此适合存储结构化数据 。关系型数据库就是由多个二维表格及其之间的关系组成的数据库 。
常见的关系型数据库有MySQL、SQL Server、PostgreSQL、Oracle等 。
以电商网站为例 , 除了用户信息之外 , 还要记录产品信息和订单信息 。为简化起见 , 每个订单只包含一种产品 。产品包括名称、价格、图片、介绍等字段 , 订单包括所属用户、相关产品、订购数量、订单价格、下单时间等字段 。一个用户拥有一个或多个订单 , 而一个产品也会属于一个或多个订单 , 这样就建立了用户、订单和产品之间的关系 。
什么是大数据时代(大数据的主要特征是什么)