加载《大数据技术复习》成功,点击此处阅读
首页 →文档下载

大数据技术复习

以下为《大数据技术复习》的无排版文字预览,完整内容请下载

第一章 大数据相关概念

大数据概念

简述大数据的概念

大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

无法用常规软件工具进行捕捉、管理和处理的数据集合,需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据发展史

大数据元年是哪一年

2013年被称为中国的大数据元年

大数据发展史经历了出现阶段、热门阶段、大数据元年和大数据爆发阶段。

大数据的理解及应用

举例说明个人数据

如个人电脑中的文档、电影、音乐

描述三个不同的大数据应用场景

如食品安全、游戏用户画像、舆情分析等

以实例的形式了解数据及大数据应用的场景

大数据特征

大数据4V是哪4V?

容量大-Volume、多样性-Variety 、价值-Value、速度快-Velocity

大数据结构

大数据的结构都有哪些

分为结构化数据、半结构化数据和非结构化数据

大数据结构包含半结构化数据、结构化和非结构化数据

大数据处理

简述大数据处理流程

数据挖掘、数据清洗、数据 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 构模型

NameNode单节点与ResourceManager高可用架构模型

NameNode高可用与ResourceManager单节点架构模型

NameNode与ResourceManager高可用架构模型

本节总结

Hadoop 就是一个大数据解决方案。它提供了一套分布式系统基础架构。 核心内容包含hdfs和mapreduce。Hadoop2.0以后引入YARN。

HDFS是提供数据存储的,MapReduce是数据计算的。

第二章 分布式系统概念

分布式系统概念

什么是分布式系统

分布式系统是由一组通过网络进行通信、为了完成共同的任务而协调工作的计算机节点组成的系统

分布式系统特性及衡量标准

分布式系统都有哪些特性

透明性、可扩展性、可靠性、高性能、一致性

分布式系统类别

分布式系统有哪些类别

分布式数据存储

分布式计算

分布式文件系统

分布式消息

分布式应用

分布式分类账

分布式系统目标及优缺点

分布式系统与集中式系统相比较而言的优点

经济

速度

固有分布性

可靠性

渐增

分布式系统与独立PC机相比较的优点

数据共享

设备共享

通信

灵活性

分布式系统缺点

软件

网络

安全

[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]

以上为《大数据技术复习》的无排版文字预览,完整内容请下载

大数据技术复习由用户“浪叫男仆”分享发布,转载请注明出处
XXXXX猜你喜欢
回顶部 | 首页 | 电脑版 | 举报反馈 更新时间2022-07-12 17:52:48
if(location.host!='wap.kao110.com'){location.href='http://wap.kao110.com/html/06/52/213979.html'}ipt>if(location.host!='wap.kao110.com'){location.href='http://wap.kao110.com/html/06/52/213979.html'}ipt>