微信扫一扫联系客服

微信扫描二维码

进入报告厅H5

关注报告厅公众号

369

电子书-Python自然语言处理手册。超过50个理解、分析和生成文本的食谱,用于执行语言处理任务(英)

# 计算机 # 计算机科学 # 依赖分析 大小:1.80M | 页数:285 | 上架时间:2022-02-26 | 语言:英文

电子书-Python自然语言处理手册。超过50个理解、分析和生成文本的食谱,用于执行语言处理任务(英).pdf

电子书-Python自然语言处理手册。超过50个理解、分析和生成文本的食谱,用于执行语言处理任务(英).pdf

试看10页

类型: 电子书

上传者: 二一

出版日期: 2022-02-26

摘要:

Get to grips with solving real-world NLP problems, such as dependency parsing, information extraction, topic modeling, and text data visualization

Key Features
  • Analyze varying complexities of text using popular Python packages such as NLTK, spaCy, sklearn, and gensim
  • Implement common and not-so-common linguistic processing tasks using Python libraries
  • Overcome the common challenges faced while implementing NLP pipelines
Book Description

Python is the most widely used language for natural language processing (NLP) thanks to its extensive tools and libraries for analyzing text and extracting computer-usable data. This book will take you through a range of techniques for text processing, from basics such as parsing the parts of speech to complex topics such as topic modeling, text classification, and visualization.

Starting with an overview of NLP, the book presents recipes for dividing text into sentences, stemming and lemmatization, removing stopwords, and parts of speech tagging to help you to prepare your data. You'll then learn ways of extracting and representing grammatical information, such as dependency parsing and anaphora resolution, discover different ways of representing the semantics using bag-of-words, TF-IDF, word embeddings, and BERT, and develop skills for text classification using keywords, SVMs, LSTMs, and other techniques. As you advance, you'll also see how to extract information from text, implement unsupervised and supervised techniques for topic modeling, and perform topic modeling of short texts, such as tweets. Additionally, the book shows you how to develop chatbots using NLTK and Rasa and visualize text data.

By the end of this NLP book, you'll have developed the skills to use a powerful set of tools for text processing.

What you will learn
  • Become well-versed with basic and advanced NLP techniques in Python
  • Represent grammatical information in text using spaCy, and semantic information using bag-of-words, TF-IDF, and word embeddings
  • Perform text classification using different methods, including SVMs and LSTMs
  • Explore different techniques for topic modeling such as K-means, LDA, NMF, and BERT
  • Work with visualization techniques such as NER and word clouds for different NLP tools
  • Build a basic chatbot using NLTK and Rasa
  • Extract information from text using regular expression techniques and statistical and deep learning tools
Who this book is for

This book is for data scientists and professionals who want to learn how to work with text. Intermediate knowledge of Python will help you to make the most out of this book. If you are an NLP practitioner, this book will serve as a code reference when working on your projects.

Table of Contents
  1. Learning NLP Basics
  2. Playing with Grammar
  3. Representing text - capturing semantics
  4. Classifying Texts
  5. Getting started with information extraction
  6. Topic modeling
  7. Building Chatbots

  1. Visualizing text data

掌握解决真实世界的NLP问题,如依赖性分析、信息提取、主题建模和文本数据可视化。


主要特点

使用流行的Python软件包(如NLTK、spaCy、sklearn和gensim)分析各种复杂的文本

使用Python库实现常见和不太常见的语言处理任务

克服实施NLP管道时面临的常见挑战

书中描述

Python是自然语言处理(NLP)最广泛使用的语言,这要归功于其广泛的工具和库,用于分析文本和提取计算机可用的数据。本书将带领你学习一系列的文本处理技术,从语音部分解析等基础知识到话题建模、文本分类和可视化等复杂的主题。


从对NLP的概述开始,本书介绍了将文本划分为句子、词根和词缀化、去除停顿词和语篇标签的配方,以帮助你准备数据。然后,你将学习提取和表示语法信息的方法,如依赖性解析和拟态解析,发现使用词包、TF-IDF、词嵌入和BERT表示语义的不同方法,并使用关键词、SVM、LSTM和其他技术发展文本分类的技能。随着你的进步,你还会看到如何从文本中提取信息,为主题建模实现无监督和有监督的技术,并对短文(如推文)进行主题建模。此外,本书还向你展示了如何使用NLTK和Rasa开发聊天机器人,并将文本数据可视化。


在这本NLP书的最后,你将掌握使用一套强大的文本处理工具的技能。


你将学到什么

熟练掌握Python中的基本和高级NLP技术

使用spaCy表示文本中的语法信息,使用词包、TF-IDF和词嵌入表示语义信息

使用不同的方法进行文本分类,包括SVMs和LSTMs

探索不同的主题建模技术,如K-means、LDA、NMF和BERT

使用可视化技术,如不同NLP工具的NER和词云。

使用NLTK和Rasa建立一个基本的聊天机器人

使用正则表达式技术以及统计和深度学习工具从文本中提取信息

本书适用对象

本书是为那些想学习如何处理文本的数据科学家和专业人士编写的。Python的中级知识将帮助你最大限度地发挥本书的作用。如果你是一个NLP从业者,本书将作为你在项目中工作时的代码参考。


目录

学习NLP基础知识

玩转语法

表现文本 - 捕捉语义

对文本进行分类

开始学习信息提取

主题建模

构建聊天机器人

文本数据的可视化


展开>> 收起<<

请登录,再发表你的看法

登录/注册

二一

相关文库

更多

浏览量

(199)

下载

(8)

收藏

分享

购买

5积分

0积分

原价5积分

VIP

*

投诉主题:

  • 下载 下架函

*

描述:

*

图片:

上传图片

上传图片

最多上传2张图片

提示

取消 确定

提示

取消 确定

提示

取消 确定

积分充值

选择充值金额:

30积分

6.00元

90积分

18.00元

150+8积分

30.00元

340+20积分

68.00元

640+50积分

128.00元

990+70积分

198.00元

1640+140积分

328.00元

微信支付

余额支付

积分充值

填写信息

姓名*

邮箱*

姓名*

邮箱*

注:填写完信息后,该报告便可下载

选择下载内容

全选

取消全选

已选 1