”Spark之旅:大数据产品的一种测试方法与实现“ 的搜索结果

     本文系统地介绍了大数据技术的相关知识,由于篇幅比较长,分为上下两部分,其中上半部分先介绍基本概念、核心领域,下半部分介绍主要技术、平台架构,以及相关企业案例。

     本文以“大数据的Hello World”为切入点,深入浅出地介绍了Spark的基础知识和Word Count的实现。通过准备工作、计算步骤梳理和代码实现,展示了如何在Spark上进行应用开发。适合初学者入门,涵盖了RDD的概念和常用...

     大数据时代的到来,带给了每一个行业实实在在的冲击和挑战。大数据就像蒸汽时代和电力时代蒸汽和电一样,不仅仅是一次简单的技术和生产力的创新,而是引发了整个生产模式的变革。而处于大数据时代中的每一个企业,想...

     分布式是指将多台服务器集中在一起,每台服务器都实现...集群是指一组独立的计算机系统构成的一多处理器系统,它们之间通过网络实现进程间的通信,让若干台计算机联合起来工作(服务),可以是并行的,也可以是做备份。

     数据模型方法,以便在性能、成本、效率之间取得最佳平衡成本:良好的数据模型能极大地减少不必要的数据冗余,也能实现计算结果复用,极大地降低大数据系统中的存储和计算成本。效率:良好的数据模型能极大地改善用户...

     美团是数据驱动的互联网服务,用户每天在美团上的点击、浏览、下单支付行为都会产生海量的日志,这些日志数据将被汇总处理、分析、挖掘与学习,为美团的各种推荐、搜索系统甚至公司战略目标制定提供数据支持。...

     实验资源 1998.csv airports.csv 实验环境 VMware Workstation Ubuntu 16.04 ...航班延误通常会造成两种结果,一种是航班取消,另一种是航班晚点。 在本次实验中,我们将通过 Spark 提供的 DataFrame

SparkCore 之旅

标签:   hadoop  spark  mapreduce

     SparkCore 之旅Spark概述Spark是什么Spark and HadoopSpark or HadoopSpark 核心模块Spark快速上手增加Scala插件增加依赖关系WordCountSpark运行环境Local模式解压缩文件启动Local环境命令行工具退出本地模式提交...

10  
9  
8  
7  
6  
5  
4  
3  
2  
1