Students in social science courses communicate, socialize, shop, learn, and work online. When they are asked to collect data for course projects they are often drawn to social media platforms and other online sources of textual data. There are many software packages and programming languages available to help students collect data online, and there are many texts designed to help with different forms of online research, from surveys to ethnographic interviews. But there is no textbook available that teaches students how to construct a viable research project based on online sources of textual data such as newspaper archives, site user comment archives, digitized historical documents, or social media user comment archives. Gabe Ignatow and Rada F. Mihalcea′s new text An Introduction to Text Mining will be a starting point for undergraduates and first-year graduate students interested in collecting and analyzing textual data from online sources, and will cover the most critical issues that students must take into consideration at all stages of their research projects, including: ethical and philosophical issues; issues related to research design; web scraping and crawling; strategic data selection; data sampling; use of specific text analysis methods; and report writing.
社会科学课程的学生在网上交流、社交、购物、学习和工作。当他们被要求为课程项目收集数据时,他们往往会被吸引到社交媒体平台和其他在线文本数据来源。有许多软件包和编程语言可以帮助学生在网上收集数据,也有许多文本旨在帮助进行不同形式的在线研究,从调查到人种学访谈。但目前还没有一本教科书教学生如何根据在线文本数据来源,如报纸档案、网站用户评论档案、数字化历史文件或社交媒体用户评论档案,构建一个可行的研究项目。Gabe Ignatow和Rada F. Mihalcea′的新书《文本挖掘导论》将成为对收集和分析在线来源的文本数据感兴趣的本科生和一年级研究生的起点,它将涵盖学生在研究项目的各个阶段必须考虑的最关键问题,包括:伦理和哲学问题;与研究设计有关的问题;网络刮擦和抓取;战略数据选择;数据采样;特定文本分析方法的使用;以及报告撰写。
相关文库
计算机行业深度报告:DeepSeek系列报告之AI+医疗
2313
类型:行研
上传时间:2025-02
标签:计算机、DeepSeek、AI+医疗)
语言:中文
金额:5积分
电子书-Linux是如何工作的How Linux Works(英)
1594
类型:电子书
上传时间:2022-04
标签:计算机、操作系统、内部结构)
语言:英文
金额:5积分
《网络是怎样连接的》-75页读书笔记
1492
类型:读书笔记
上传时间:2025-01
标签:网络、计算机、科普)
语言:中文
金额:9.9元
《面向初学者的机器学习》Machine Learning For Absolute Beginners
1184
类型:电子书
上传时间:2021-05
标签:机器学习、计算机、算法)
语言:英文
金额:5积分
电子书-用FastAPI构建数据科学应用:用Python开发、管理和部署高效的机器学习应用程序(英)
1183
类型:电子书
上传时间:2022-03
标签:计算机、数据库、人脸检测系统)
语言:英文
金额:5积分
电子书-软件架构师手册:通过实施有效的架构概念成为成功的软件架构师(英)
1164
类型:电子书
上传时间:2021-11
标签:计算机、软件架构 、软件)
语言:英文
金额:5积分
电子书-DAMA数据管理知识体系指南(DAMA DMBOK)(英)
1112
类型:电子书
上传时间:2022-03
标签:计算机、数据库、数据管理)
语言:英文
金额:5积分
计算机行业深度研究报告:ChatGPT,开启AI新纪元-20230201-31页
1051
类型:行研
上传时间:2023-02
标签:计算机、处理器)
语言:中文
金额:免费
电子书-高维数据统计:方法、理论与应用(英)
1016
类型:电子书
上传时间:2021-10
标签:计算机、统计学、数据统计)
语言:英文
金额:5积分
计算机行业:多模态大模型技术演进及研究框架-20230318-51页
945
类型:行研
上传时间:2023-03
标签:计算机、虚拟人、智能人)
语言:中文
金额:免费
积分充值
30积分
6.00元
90积分
18.00元
150+8积分
30.00元
340+20积分
68.00元
640+50积分
128.00元
990+70积分
198.00元
1640+140积分
328.00元
微信支付
余额支付
积分充值
应付金额:
0 元
请登录,再发表你的看法
登录/注册