Python, a multi-paradigm programming language, has become the language of choice for data scientists for visualization, data analysis, and machine learning.
Hands-On Data Analysis with NumPy and Pandas starts by guiding you in setting up the right environment for data analysis with Python, along with helping you install the correct Python distribution. In addition to this, you will work with the Jupyter notebook and set up a database. Once you have covered Jupyter, you will dig deep into Python’s NumPy package, a powerful extension with advanced mathematical functions. You will then move on to creating NumPy arrays and employing different array methods and functions. You will explore Python’s pandas extension which will help you get to grips with data mining and learn to subset your data. Last but not the least you will grasp how to manage your datasets by sorting and ranking them.
By the end of this book, you will have learned to index and group your data for sophisticated data analysis and manipulation.
What You Will Learn
• Understand how to install and manage Anaconda
• Read, sort, and map data using NumPy and pandas
• Find out how to create and slice data arrays using NumPy
• Discover how to subset your DataFrames using pandas
• Handle missing data in a pandas DataFrame
• Explore hierarchical indexing and plotting with pandas
Python是一种多范式的编程语言,已经成为数据科学家进行可视化、数据分析和机器学习的首选语言。
使用NumPy和Pandas进行实战数据分析》一开始就指导你为使用Python进行数据分析建立正确的环境,同时帮助你安装正确的Python分布。除此之外,你还将使用Jupyter笔记本并建立一个数据库。一旦你掌握了Jupyter,你将深入研究Python的NumPy包,这是一个具有高级数学功能的强大扩展。然后,你将继续创建NumPy数组,并采用不同的数组方法和函数。你将探索Python的pandas扩展,它将帮助你掌握数据挖掘并学会对数据进行子集。最后但并非最不重要的是,你将掌握如何通过分类和排序来管理你的数据集。
在本书结束时,你将学会对你的数据进行索引和分组,以便进行复杂的数据分析和操作。
你将学到的内容
- 理解如何安装和管理Anaconda
- 使用NumPy和pandas读取、分类和映射数据
- 了解如何使用NumPy创建和切分数据数组
- 发现如何使用pandas对你的DataFrames进行子集。
- 处理pandas DataFrame中的缺失数据
- 探索用pandas进行分层索引和绘图的方法
相关文库
计算机行业深度报告:DeepSeek系列报告之AI+医疗
2374
类型:行研
上传时间:2025-02
标签:计算机、DeepSeek、AI+医疗)
语言:中文
金额:5积分
电子书-Linux是如何工作的How Linux Works(英)
1651
类型:电子书
上传时间:2022-04
标签:计算机、操作系统、内部结构)
语言:英文
金额:5积分
《网络是怎样连接的》-75页读书笔记
1557
类型:读书笔记
上传时间:2025-01
标签:网络、计算机、科普)
语言:中文
金额:9.9元
电子书-用FastAPI构建数据科学应用:用Python开发、管理和部署高效的机器学习应用程序(英)
1280
类型:电子书
上传时间:2022-03
标签:计算机、数据库、人脸检测系统)
语言:英文
金额:5积分
《面向初学者的机器学习》Machine Learning For Absolute Beginners
1258
类型:电子书
上传时间:2021-05
标签:机器学习、计算机、算法)
语言:英文
金额:5积分
电子书-软件架构师手册:通过实施有效的架构概念成为成功的软件架构师(英)
1228
类型:电子书
上传时间:2021-11
标签:计算机、软件架构 、软件)
语言:英文
金额:5积分
电子书-DAMA数据管理知识体系指南(DAMA DMBOK)(英)
1199
类型:电子书
上传时间:2022-03
标签:计算机、数据库、数据管理)
语言:英文
金额:5积分
电子书-高维数据统计:方法、理论与应用(英)
1144
类型:电子书
上传时间:2021-10
标签:计算机、统计学、数据统计)
语言:英文
金额:5积分
计算机行业深度研究报告:ChatGPT,开启AI新纪元-20230201-31页
1083
类型:行研
上传时间:2023-02
标签:计算机、处理器)
语言:中文
金额:免费
计算机行业:多模态大模型技术演进及研究框架-20230318-51页
975
类型:行研
上传时间:2023-03
标签:计算机、虚拟人、智能人)
语言:中文
金额:免费
积分充值
30积分
6.00元
90积分
18.00元
150+8积分
30.00元
340+20积分
68.00元
640+50积分
128.00元
990+70积分
198.00元
1640+140积分
328.00元
微信支付
余额支付
积分充值
应付金额:
0 元
请登录,再发表你的看法
登录/注册