Statistical approaches to processing natural language text have become dominant in recent years. This foundational text is the first comprehensive introduction to statistical natural language processing (NLP) to appear. The book contains all the theory and algorithms needed for building NLP tools. It provides broad but rigorous coverage of mathematical and linguistic foundations, as well as detailed discussion of statistical methods, allowing students and researchers to construct their own implementations. The book covers collocation finding, word sense disambiguation, probabilistic parsing, information retrieval, and other applications.
近年来,处理自然语言文本的统计方法已成为主流。这基础文本是第一个全面介绍统计自然语言处理(NLP)出现。这本书包含了构建NLP工具所需的所有理论和算法。它提供了广泛但严格的数学和语言基础,以及统计方法的详细讨论,允许学生和研究人员构建自己的实现。这本书涵盖了搭配发现、词义消歧、概率句法分析、信息检索和其他应用。
相关文库
计算机行业:AIGC行业应用畅想
3025
类型:行研
上传时间:2023-04
标签:计算机、AIGC)
语言:中文
金额:5积分
零信任SaaS,美国经验与中国特色-20200802-42页
2737
类型:行研
上传时间:2020-08
标签:计算机、saas)
语言:中文
金额:免费
计算机行业安全服务:网络安全行业的制高点-20210221-64页
2486
类型:行研
上传时间:2021-02
标签:计算机、网络安全)
语言:中文
金额:免费
2021年IEEE高新能计算论文合集
2442
类型:学习教育
上传时间:2021-05
标签:高性能计算、学术、计算机)
语言:中文
金额:30积分
计算机行业专题研究:MES深度报告下篇,7大海外巨头,6家中国领军全梳理-20201015-55页
2360
类型:行研
上传时间:2020-10
标签:计算机、MES)
语言:中文
金额:免费
计算机行业:信创产业发展研究-20220510-84页
1804
类型:行研
上传时间:2022-05
标签:计算机、信创)
语言:中文
金额:免费
计算机行业对于低代码工具发展的思考:AI降低软件使用门槛,交付自动化提升工具价值
1740
类型:行研
上传时间:2023-06
标签:计算机、AI、低代码)
语言:中文
金额:5积分
计算机行业:工业软件,研究框架-20200618-132页
1540
类型:行研
上传时间:2020-07
标签:计算机、工业软件、券商报告)
语言:中文
金额:免费
电子书-Linux是如何工作的How Linux Works(英)
1426
类型:电子书
上传时间:2022-04
标签:计算机、操作系统、内部结构)
语言:英文
金额:5积分
2020年高考志愿填报全解析—计算机行业报考热门专业、院校及前景(免费
1404
类型:专题
上传时间:2020-07
标签:高考志愿填报、计算机)
语言:中文
金额:5积分
积分充值
30积分
6.00元
90积分
18.00元
150+8积分
30.00元
340+20积分
68.00元
640+50积分
128.00元
990+70积分
198.00元
1640+140积分
328.00元
微信支付
余额支付
积分充值
应付金额:
0 元
请登录,再发表你的看法
登录/注册