This book provides an introduction to the mathematical and algorithmic foundations of data science, including machine learning, high-dimensional geometry, and analysis of large networks. Topics include the counterintuitive nature of data in high dimensions, important linear algebraic techniques such as singular value decomposition, the theory of random walks and Markov chains, the fundamentals of and important algorithms for machine learning, algorithms and analysis for clustering, probabilistic models for large networks, representation learning including topic modelling and non-negative matrix factorization, wavelets and compressed sensing. Important probabilistic techniques are developed including the law of large numbers, tail inequalities, analysis of random projections, generalization guarantees in machine learning, and moment methods for analysis of phase transitions in large random graphs. Additionally, important structural and complexity measures are discussed such as matrix norms and VC-dimension. This book is suitable for both undergraduate and graduate courses in the design and analysis of algorithms for data.
本书介绍了数据科学的数学和算法基础,包括机器学习、高维几何和大型网络的分析。主题包括高维数据的反直觉性质、重要的线性代数技术,如奇异值分解、随机漫步和马尔科夫链的理论、机器学习的基础和重要算法、聚类的算法和分析、大型网络的概率模型、包括主题建模和非负矩阵分解的表示学习、小波和压缩感应。重要的概率技术被开发出来,包括大数法则、尾部不等式、随机投影的分析、机器学习中的泛化保证,以及用于分析大型随机图中相变的矩方法。此外,还讨论了重要的结构性和复杂性措施,如矩阵规范和VC-维度。本书适用于数据算法设计和分析的本科和研究生课程。
相关文库
计算机行业:AIGC行业应用畅想
3022
类型:行研
上传时间:2023-04
标签:计算机、AIGC)
语言:中文
金额:5积分
零信任SaaS,美国经验与中国特色-20200802-42页
2735
类型:行研
上传时间:2020-08
标签:计算机、saas)
语言:中文
金额:免费
计算机行业安全服务:网络安全行业的制高点-20210221-64页
2483
类型:行研
上传时间:2021-02
标签:计算机、网络安全)
语言:中文
金额:免费
2021年IEEE高新能计算论文合集
2442
类型:学习教育
上传时间:2021-05
标签:高性能计算、学术、计算机)
语言:中文
金额:30积分
计算机行业专题研究:MES深度报告下篇,7大海外巨头,6家中国领军全梳理-20201015-55页
2360
类型:行研
上传时间:2020-10
标签:计算机、MES)
语言:中文
金额:免费
计算机行业:信创产业发展研究-20220510-84页
1803
类型:行研
上传时间:2022-05
标签:计算机、信创)
语言:中文
金额:免费
计算机行业对于低代码工具发展的思考:AI降低软件使用门槛,交付自动化提升工具价值
1740
类型:行研
上传时间:2023-06
标签:计算机、AI、低代码)
语言:中文
金额:5积分
计算机行业:工业软件,研究框架-20200618-132页
1540
类型:行研
上传时间:2020-07
标签:计算机、工业软件、券商报告)
语言:中文
金额:免费
电子书-Linux是如何工作的How Linux Works(英)
1422
类型:电子书
上传时间:2022-04
标签:计算机、操作系统、内部结构)
语言:英文
金额:5积分
2020年高考志愿填报全解析—计算机行业报考热门专业、院校及前景(免费
1403
类型:专题
上传时间:2020-07
标签:高考志愿填报、计算机)
语言:中文
金额:5积分
积分充值
30积分
6.00元
90积分
18.00元
150+8积分
30.00元
340+20积分
68.00元
640+50积分
128.00元
990+70积分
198.00元
1640+140积分
328.00元
微信支付
余额支付
积分充值
应付金额:
0 元
请登录,再发表你的看法
登录/注册