Jesse Daniel is an experienced Python developer. He taught Python for Data Science at the University of Denver and leads a team of data scientists at a Denver-based media technology company.
Dask是一个原生的并行分析工具,旨在与你已经使用的库无缝集成,包括Pandas、NumPy和Scikit-Learn。有了Dask,你就可以使用你已经拥有的工具,对巨大的数据集进行压缩和处理。而《用Python和Dask实现数据科学》是您在不改变工作方式的情况下将Dask用于您的数据项目的指南!
关于技术
一个高效的数据管道对于数据科学项目的成功意味着一切。Dask是一个灵活的Python并行计算库,可以轻松建立直观的工作流程,以摄入和分析大型分布式数据集。Dask提供了动态任务调度和并行集合,扩展了NumPy、Pandas和Scikit-learn的功能,使用户能够轻松地将其代码从一台笔记本电脑扩展到数百台机器的集群。
关于这本书
使用Python和Dask实现数据科学》教你建立能够处理大量数据集的可扩展项目。在认识了Dask框架之后,你将分析纽约市停车券数据库中的数据,并使用DataFrames来简化你的过程。然后,你将使用Dask-ML创建机器学习模型,构建交互式可视化,并使用AWS和Docker构建集群。
里面的内容
- 处理大型、结构化和非结构化的数据集
- 使用Seaborn和Datashader进行可视化
- 实现你自己的算法
- 使用Dask Distributed构建分布式应用
- 打包和部署Dask应用程序
关于读者
适用于有使用Python和PyData栈经验的数据科学家和开发人员。
关于作者
Jesse Daniel是一位经验丰富的Python开发者。他在丹佛大学教授Python用于数据科学,并在一家位于丹佛的媒体技术公司领导一个数据科学家团队。
相关文库
2021年中国SaaS_市场研究报 告
3933
类型:行研
上传时间:2021-07
标签:Saas、数据库、云服务)
语言:中文
金额:免费
计算机行业:AIGC行业应用畅想
3027
类型:行研
上传时间:2023-04
标签:计算机、AIGC)
语言:中文
金额:5积分
零信任SaaS,美国经验与中国特色-20200802-42页
2741
类型:行研
上传时间:2020-08
标签:计算机、saas)
语言:中文
金额:免费
计算机行业安全服务:网络安全行业的制高点-20210221-64页
2490
类型:行研
上传时间:2021-02
标签:计算机、网络安全)
语言:中文
金额:免费
2021年IEEE高新能计算论文合集
2445
类型:学习教育
上传时间:2021-05
标签:高性能计算、学术、计算机)
语言:中文
金额:30积分
计算机行业专题研究:MES深度报告下篇,7大海外巨头,6家中国领军全梳理-20201015-55页
2363
类型:行研
上传时间:2020-10
标签:计算机、MES)
语言:中文
金额:免费
计算机行业:信创产业发展研究-20220510-84页
1810
类型:行研
上传时间:2022-05
标签:计算机、信创)
语言:中文
金额:免费
计算机行业对于低代码工具发展的思考:AI降低软件使用门槛,交付自动化提升工具价值
1744
类型:行研
上传时间:2023-06
标签:计算机、AI、低代码)
语言:中文
金额:5积分
数据库行业研究
1565
类型:行研
上传时间:2021-03
标签:数据库、saas、paas)
语言:中文
金额:免费
计算机行业:工业软件,研究框架-20200618-132页
1543
类型:行研
上传时间:2020-07
标签:计算机、工业软件、券商报告)
语言:中文
金额:免费
积分充值
30积分
6.00元
90积分
18.00元
150+8积分
30.00元
340+20积分
68.00元
640+50积分
128.00元
990+70积分
198.00元
1640+140积分
328.00元
微信支付
余额支付
积分充值
应付金额:
0 元
请登录,再发表你的看法
登录/注册