Jesse Daniel is an experienced Python developer. He taught Python for Data Science at the University of Denver and leads a team of data scientists at a Denver-based media technology company.
Dask是一个原生的并行分析工具,旨在与你已经使用的库无缝集成,包括Pandas、NumPy和Scikit-Learn。有了Dask,你就可以使用你已经拥有的工具,对巨大的数据集进行压缩和处理。而《用Python和Dask实现数据科学》是您在不改变工作方式的情况下将Dask用于您的数据项目的指南!
关于技术
一个高效的数据管道对于数据科学项目的成功意味着一切。Dask是一个灵活的Python并行计算库,可以轻松建立直观的工作流程,以摄入和分析大型分布式数据集。Dask提供了动态任务调度和并行集合,扩展了NumPy、Pandas和Scikit-learn的功能,使用户能够轻松地将其代码从一台笔记本电脑扩展到数百台机器的集群。
关于这本书
使用Python和Dask实现数据科学》教你建立能够处理大量数据集的可扩展项目。在认识了Dask框架之后,你将分析纽约市停车券数据库中的数据,并使用DataFrames来简化你的过程。然后,你将使用Dask-ML创建机器学习模型,构建交互式可视化,并使用AWS和Docker构建集群。
里面的内容
- 处理大型、结构化和非结构化的数据集
- 使用Seaborn和Datashader进行可视化
- 实现你自己的算法
- 使用Dask Distributed构建分布式应用
- 打包和部署Dask应用程序
关于读者
适用于有使用Python和PyData栈经验的数据科学家和开发人员。
关于作者
Jesse Daniel是一位经验丰富的Python开发者。他在丹佛大学教授Python用于数据科学,并在一家位于丹佛的媒体技术公司领导一个数据科学家团队。
相关文库
计算机行业深度报告:DeepSeek系列报告之AI+医疗
2426
类型:行研
上传时间:2025-02
标签:计算机、DeepSeek、AI+医疗)
语言:中文
金额:5积分
电子书-Linux是如何工作的How Linux Works(英)
1778
类型:电子书
上传时间:2022-04
标签:计算机、操作系统、内部结构)
语言:英文
金额:5积分
《网络是怎样连接的》-75页读书笔记
1594
类型:读书笔记
上传时间:2025-01
标签:网络、计算机、科普)
语言:中文
金额:9.9元
《面向初学者的机器学习》Machine Learning For Absolute Beginners
1401
类型:电子书
上传时间:2021-05
标签:机器学习、计算机、算法)
语言:英文
金额:5积分
电子书-用FastAPI构建数据科学应用:用Python开发、管理和部署高效的机器学习应用程序(英)
1373
类型:电子书
上传时间:2022-03
标签:计算机、数据库、人脸检测系统)
语言:英文
金额:5积分
电子书-软件架构师手册:通过实施有效的架构概念成为成功的软件架构师(英)
1337
类型:电子书
上传时间:2021-11
标签:计算机、软件架构 、软件)
语言:英文
金额:5积分
电子书-DAMA数据管理知识体系指南(DAMA DMBOK)(英)
1275
类型:电子书
上传时间:2022-03
标签:计算机、数据库、数据管理)
语言:英文
金额:5积分
电子书-高维数据统计:方法、理论与应用(英)
1206
类型:电子书
上传时间:2021-10
标签:计算机、统计学、数据统计)
语言:英文
金额:5积分
计算机行业深度研究报告:ChatGPT,开启AI新纪元-20230201-31页
1108
类型:行研
上传时间:2023-02
标签:计算机、处理器)
语言:中文
金额:免费
康波周期复盘:康波周期与中国式现代化-20230726-16页
1086
类型:策略
上传时间:2023-08
标签:汽车、计算机)
语言:中文
金额:5积分
积分充值
30积分
6.00元
90积分
18.00元
150+8积分
30.00元
340+20积分
68.00元
640+50积分
128.00元
990+70积分
198.00元
1640+140积分
328.00元
微信支付
余额支付
积分充值
应付金额:
0 元
请登录,再发表你的看法
登录/注册