Develop applications for the big data landscape with Spark and Hadoop. This book also explains the role of Spark in developing scalable machine learning and analytics applications with Cloud technologies. Beginning Apache Spark 2 gives you an introduction to Apache Spark and shows you how to work with it.
Along the way, you’ll discover resilient distributed datasets (RDDs); use Spark SQL for structured data; and learn stream processing and build real-time applications with Spark Structured Streaming. Furthermore, you’ll learn the fundamentals of Spark ML for machine learning and much more.
使用Spark和Hadoop为大数据领域开发应用程序。本书还解释了Spark在使用云技术开发可伸缩的机器学习和分析应用程序中的作用。从ApacheSpark2开始介绍ApacheSpark,并向您展示如何使用它。
在此过程中,您将发现弹性分布式数据集(RDD);对结构化数据使用sparksql;学习流处理并使用Spark结构化流构建实时应用程序。此外,您还将学习机器学习的Spark ML的基础知识以及更多内容。
相关文库
2021年中国SaaS_市场研究报 告
3930
类型:行研
上传时间:2021-07
标签:Saas、数据库、云服务)
语言:中文
金额:免费
计算机行业:AIGC行业应用畅想
3026
类型:行研
上传时间:2023-04
标签:计算机、AIGC)
语言:中文
金额:5积分
零信任SaaS,美国经验与中国特色-20200802-42页
2739
类型:行研
上传时间:2020-08
标签:计算机、saas)
语言:中文
金额:免费
计算机行业安全服务:网络安全行业的制高点-20210221-64页
2487
类型:行研
上传时间:2021-02
标签:计算机、网络安全)
语言:中文
金额:免费
2021年IEEE高新能计算论文合集
2443
类型:学习教育
上传时间:2021-05
标签:高性能计算、学术、计算机)
语言:中文
金额:30积分
计算机行业专题研究:MES深度报告下篇,7大海外巨头,6家中国领军全梳理-20201015-55页
2361
类型:行研
上传时间:2020-10
标签:计算机、MES)
语言:中文
金额:免费
计算机行业:信创产业发展研究-20220510-84页
1807
类型:行研
上传时间:2022-05
标签:计算机、信创)
语言:中文
金额:免费
计算机行业对于低代码工具发展的思考:AI降低软件使用门槛,交付自动化提升工具价值
1741
类型:行研
上传时间:2023-06
标签:计算机、AI、低代码)
语言:中文
金额:5积分
数据库行业研究
1564
类型:行研
上传时间:2021-03
标签:数据库、saas、paas)
语言:中文
金额:免费
计算机行业:工业软件,研究框架-20200618-132页
1541
类型:行研
上传时间:2020-07
标签:计算机、工业软件、券商报告)
语言:中文
金额:免费
积分充值
30积分
6.00元
90积分
18.00元
150+8积分
30.00元
340+20积分
68.00元
640+50积分
128.00元
990+70积分
198.00元
1640+140积分
328.00元
微信支付
余额支付
积分充值
应付金额:
0 元
请登录,再发表你的看法
登录/注册