微信扫一扫联系客服

微信扫描二维码

进入报告厅H5

关注报告厅公众号

182

电子书-用Spark进行高级分析:规模化地从数据中学习的模式(英)

# 计算机 # 网络学 # 大规模数据分析 大小:4.03M | 页数:276 | 上架时间:2022-02-28 | 语言:英文

电子书-用Spark进行高级分析:规模化地从数据中学习的模式(英).pdf

电子书-用Spark进行高级分析:规模化地从数据中学习的模式(英).pdf

试看10页

类型: 电子书

上传者: 二一

出版日期: 2022-02-28

摘要:

In this practical book, four Cloudera data scientists present a set of self-contained patterns for performing large-scale data analysis with Spark. The authors bring Spark, statistical methods, and real-world data sets together to teach you how to approach analytics problems by example.

You’ll start with an introduction to Spark and its ecosystem, and then dive into patterns that apply common techniques—classification, collaborative filtering, and anomaly detection among others—to fields such as genomics, security, and finance. If you have an entry-level understanding of machine learning and statistics, and you program in Java, Python, or Scala, you’ll find these patterns useful for working on your own data applications.

Patterns include:

  • Recommending music and the Audioscrobbler data set
  • Predicting forest cover with decision trees
  • Anomaly detection in network traffic with K-means clustering
  • Understanding Wikipedia with Latent Semantic Analysis
  • Analyzing co-occurrence networks with GraphX
  • Geospatial and temporal data analysis on the New York City Taxi Trips data
  • Estimating financial risk through Monte Carlo simulation
  • Analyzing genomics data and the BDG project

  • Analyzing neuroimaging data with PySpark and Thunder
  • 在这本实用的书中,四位Cloudera数据科学家介绍了一套独立的模式,用于用Spark执行大规模数据分析。作者将Spark、统计方法和真实世界的数据集结合起来,通过实例教你如何处理分析问题。

    • 你将从介绍Spark及其生态系统开始,然后深入研究将常见技术--分类、协同过滤和异常检测等应用于基因组学、安全和金融等领域的模式。如果你对机器学习和统计学有初步了解,并使用Java、Python或Scala编程,你会发现这些模式对你自己的数据应用很有用。

    • 模式包括。

    • 推荐音乐和Audioscrobbler数据集
    • 用决策树预测森林覆盖率
    • 用K-means聚类法检测网络流量的异常情况
    • 用潜在语义分析理解维基百科
    • 用GraphX分析共同发生网络
    • 对纽约市出租车行程数据进行地理空间和时间数据分析
    • 通过蒙特卡洛模拟估计金融风险
    • 分析基因组学数据和BDG项目
    • 用PySpark和Thunder分析神经影像数据
    展开>> 收起<<

    请登录,再发表你的看法

    登录/注册

    二一

    相关文库

    更多

    浏览量

    (119)

    下载

    (2)

    收藏

    分享

    购买

    5积分

    0积分

    原价5积分

    VIP

    *

    投诉主题:

    • 下载 下架函

    *

    描述:

    *

    图片:

    上传图片

    上传图片

    最多上传2张图片

    提示

    取消 确定

    提示

    取消 确定

    提示

    取消 确定

    积分充值

    选择充值金额:

    30积分

    6.00元

    90积分

    18.00元

    150+8积分

    30.00元

    340+20积分

    68.00元

    640+50积分

    128.00元

    990+70积分

    198.00元

    1640+140积分

    328.00元

    微信支付

    余额支付

    积分充值

    填写信息

    姓名*

    邮箱*

    姓名*

    邮箱*

    注:填写完信息后,该报告便可下载

    选择下载内容

    全选

    取消全选

    已选 1