2021年云上贵州观云活动官方入口( 二 )
数据中心(Datacentre)——一个实体地点,放置了用来存储数据的服务 。器数据清洗(Datacleansing)——对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性 。数据管理员(Datacustodian)——负责维护数据存储所需技术环境的专业技术人员 。数据道德准则(Dataethicalguidelines)——这些准则有助于组织机构使其数据透明化,保证数据的简洁、安全及隐私 。数据订阅(Datafeed)——一种数据流,例如Twitter订阅和RSS 。数据集市(Datamarketplace)——进行数据集买卖的在线交易场所 。数据挖掘(Datamining)——从数据集中发掘特定模式或信息的过程 。数据建模(Datamodelling)——使用数据建模技术来分析数据对象,以此洞悉数据的内在涵义 。数据集(Dataset)——大量数据的集合 。数据虚拟化(Datavirtualization)——数据整合的过程,以此获得更多的数据信息,这个过程通常会引入其他技术,例如数据库,应用程序,文件系统,网页技术,大数据技术等等 。去身份识别(De-identification)——也称为匿名化(anonymization),确保个人不会通过数据被识别 。判别分析(Discriminantanalysis)——将数据分类;按不同的分类方式,可将数据分配到不同的群组,类别或者目录 。是一种统计分析法,可以对数据中某些群组或集群的已知信息进行分析,并从中获取分类规则 。分布式文件系统(DistributedFileSystem)——提供简化的,高可用的方式来存储、分析、处理数据的系统 。文件存贮数据库(DocumentStoreDatabases)——又称为文档数据库(document-orienteddatabase),为存储、管理、恢复文档数据而专门设计的数据库,这类文档数据也称为半结构化数据 。
E
探索性分析(Exploratoryanalysis)——在没有标准的流程或方法的情况下从数据中发掘模式 。是一种发掘数据和数据集主要特性的一种方法 。E字节(EB:Exabytes)——约等于1000PB(petabytes),约等于1百万GB 。如今全球每天所制造的新信息量大约为1EB 。提取-转换-加载(ETL:Extract,TransformandLoad)——是一种用于数据库或者数据仓库的处理过程 。即从各种不同的数据源提取(E)数据,并转换(T)成能满足业务需要的数据,最后将其加载(L)到数据库 。
F
故障切换(Failover)——当系统中某个服务器发生故障时,能自动地将运行任务切换到另一个可用服务器或节点上 。
容错设计(Fault-tolerantdesign)——一个支持容错设计的系统应该能够做到当某一部分出现故障也能继续运行 。G游戏化(Gamification)——在其他非游戏领域中运用游戏的思维和机制,这种方法可以以一种十分友好的方式进行数据的创建和侦测,非常有效 。
图形数据库(GraphDatabases)——运用图形结构(例如,一组有限的有序对,或者某种实体)来存储数据,这种图形存储结构包括边缘、属性和节点 。它提供了相邻节点间的自由索引功能,也就是说,数据库中每个元素间都与其他相邻元素直接关联 。网格计算(Gridcomputing)——将许多分布在不同地点的计算机连接在一起,用以处理某个特定问题,通常是通过云将计算机相连在一起 。HHadoop——一个开源的分布式系统基础框架,可用于开发分布式程序,进行大数据的运算与存储 。Hadoop数据库(HBase)——一个开源的、非关系型、分布式数据库,与Hadoop框架共同使用 。
- 私人影院|私人影院可以看上映多久的电影
- 私人影院|私人影院和电影院能同步上映吗
- 私人影院|私人影院会放映正在上映的电影吗
- 上半年|2022年上半年雨水多不多
- 上半年|2022上半年有哪些法定节假日
- 女性统治者|世界十大女性统治者,世界历史上的女性统治者
- 励志句子|2021十大最火励志金句 2021年最励志的一句话
- 上海交大曾有一位高颜值女学霸
- ?五一|2022年五一上海限行吗
- 五一|2022年五一出上海高速堵车吗