商品详情
;普通高等院校网络与新媒体专业系列教材凝聚了众多网络与新媒体领域专家学者的智慧与心血,注重理论与实践相结合、教育与应用并重、系统知识与课后习题相呼应,是兼具前瞻性、系统性、知识性和实操性的教学范本。同时,我们充分借鉴了国内外网络与新媒体专业教学实践的先进经验,确保内容的时效性。作为一套面向未来的系列教材,本系列教材不仅注重向学生传授专业知识,更注重培养学生的创新思维和专业实践能力。我们深切希望,通过对本系列教材的学习,学生能够深入理解网络与新媒体的本质与发展规律,熟练掌握相关技术与工具,具备扎实的专业素养和专业技能,在未来的媒体岗位工作中能熟练运用专业技能,提升创新能力,为社会做出贡献。
《大数据分析基础》是传媒专业的研究方法类课程教材,具体介绍了大数据分析的基本原理、主要方法、技术操作、研究应用以及常见工具,系统讲解了从数据收集到分析、挖掘的全套研究流程。本教材聚焦于传播学科与大数据科学的交叉领域,旨在拓宽相关专业学生的学术视野,提供更加丰富和精确的研究工具。本教材共分 10 章,分别介绍了在计算传播学研究中常用的大数据方法。第 1 章主要介绍了大数据的获取方法,第 2 章至第 10 章分别介绍了文本分析、情感分析、聚类分析、主题模型、机器学习、自动文本分析、社会网络分析、语义网络分析、虚拟仿真等具体的大数据分析方法。本教材将研究方法与研究案例相结合,内容丰富,难易适中,注重系统性、科学性、实用性、时代性和引导性,既可作为传媒专业及交叉学科教师、研究生、本科生、大中专院校学生的教学、实践与研究资料,又可作为传媒从业者、市场营销人员和社会科学研究者等读者的参考读物。《大数据分析基础》提供课件,请扫描封底二维码获取。
罗茜,苏州大学传媒学院副教授;研究方向为计算传播、智能传播、网络舆论等;在SSCI、CSSCI期刊发表论文十余篇;主持国家社科基金青年项目;基于人工智能的网络意识形态自动分类和人机综合治理研究。
第1章 大数据的获取 0011.1 大数据获取方式 0011.1.1 网络公开数据获取 0011.1.2 网络爬虫获取 0071.2 使用GooSeeker获取网络数据 0151.2.1 GooSeeker简介 0151.2.2 GooSeeker的优势与应用 0151.2.3 GooSeeker的操作步骤 0161.3 使用Python获取网络数据 0181.3.1 Python和PyCharm介绍 0191.3.2 Python的优势和适用领域 0191.3.3 Python和PyCharm的下载安装 0201.3.4 Python和PyCharm的使用步骤 0221.3.5 使用Python爬取网络数据的步骤 025本章小结 027核心概念 028思考题 028第2章 文本分析 0292.1 文本分析概述 0292.1.1 文本分析的概念 0292.1.2 文本分析的对象 0302.1.3 文本分析的流程 0312.1.4 文本分析的应用 0322.2 文本规范化 0332.2.1 词语切割 0332.2.2 停用词去除 0442.2.3 词干提取 0462.2.4 词形还原 0472.2.5 词性标注 0482.2.6 词频统计与词云图制作 0522.3 文本关键词提取 0542.3.1 关键词提取方法的分类 0542.3.2 关键词提取算法 0552.4 文本向量化 0582.4.1 离散表示 0592.4.2 分布式表示 0592.4.3 Word2vec实现文本向量化或进行词向量的训练 0632.4.4 文本向量化的应用 0652.5 文本分析技术操作 0652.5.1 词性标注与词频统计 0652.5.2 关键词提取与词云图制作 0672.6 案例分析 0682.6.1 文本分析在媒体报道中的应用 0682.6.2 文本分析在社交媒体平台中的应用 069本章小结 075核心概念 076思考题 077第3章 情感分析 0783.1 情感分析概述 0783.1.1 情感分析的概念 0783.1.2 情感分析的分类 0783.1.3 情感分析的研究框架 0793.2 英文文本情感分析 0803.2.1 情感信息抽取 0803.2.2 情感信息分类 0873.3 中文文本情感分析 0913.3.1 基于词典匹配的情感分类方法 0913.3.2 有监督机器学习的情感分类方法 0963.3.3 中文文本情感分析的Python实现案例 0983.4 研究案例 1073.4.1 情感分析在风险传播研究中的应用 1073.4.2 情感分析在健康传播研究中的应用 1083.4.3 情感分析在传播学研究中的方法探索 112本章小结 113核心概念 113思考题 115第4章 聚类分析 1164.1 聚类分析概述 1174.1.1 认识聚类和簇 1174.1.2 聚类分析的概念 1194.1.3 聚类分析的分类 1204.1.4 聚类分析的原理及基本过程 1214.2 聚类分析方法 1224.2.1 K_means聚类 1224.2.2 DBSCAN 1324.2.3 凝聚层次聚类 1344.3 实战演练 1374.4 案例介绍 1414.4.1 聚类分析在新闻报道研究中的运用 1414.4.2 聚类分析在社交媒体研究中的运用 143本章小结 146核心概念 147思考题 147第5章 主题模型 1485.1 主题模型概述 1495.1.1 主题模型的概念 1495.1.2 主题模型的主要内容 1505.1.3 主题模型涉及的数学概念 1545.2 主要模型类型 1565.2.1 LSA模型和pLSA模型 1565.2.2 LDA模型 1585.3 技术操作 1605.3.1 系统配置和文本预处理 1605.3.2 LDA模型分析 1645.3.3 结果探讨 1675.4 案例研究 1705.4.1 LDA模型在传播学中的方法探索 1715.4.2 LDA模型的传播学分析实践 1725.4.3 主题模型在科学传播研究中的应用 1745.4.4 主题模型在政治传播研究中的应用 1765.4.5 主题模型的主要应用方向及面临的挑战 178本章小结 179核心概念 179思考题 180第6章 机器学习 1826.1 机器学习概述 1826.1.1 机器学习的定义及关键术语 1826.1.2 机器学习的分类及步骤 1846.2 线性回归算法 1876.2.1 原理简述及基本概念介绍 1876.2.2 线性回归算法的Python实现 1896.3 支持向量机 1916.3.1 原理简述及基本概念介绍 1916.3.2 支持向量机的Python实现 1936.4 使用WEKA进行机器学习 1956.5 应用机器学习发掘数据潜力 2036.5.1 从卫星图像中提取社会经济数据并预测贫困 2046.5.2 通过视频观测政治候选人的情绪表现如何影响选民印象 205本章小结 207核心概念 207思考题 208第7章 自动文本分析 2097.1 自动文本分析概述 2097.1.1 自动文本分析的发展历程 2097.1.2 自动文本分析的原则 2107.1.3 自动文本分析的步骤 2117.2 有监督机器学习 2167.2.1 有监督机器学习概述 2167.2.2 有监督机器学习的步骤 2177.3 有监督机器学习下文本分类的不同算法 2197.3.1 统计学习算法:朴素贝叶斯 2197.3.2 基于实例分类:K近邻法 2237.3.3 基于逻辑的算法:决策树 2247.4 不同算法的机器学习应用 2267.4.1 前期操作 2267.4.2 数据预处理 2287.4.3 引入算法 2297.5 案例研究 2317.5.1 自动文本分析在政治传播研究中的应用 2317.5.2 自动文本分析在文化研究中的应用 2337.5.3 自动文本分析在健康传播研究中的应用 235本章小结 237核心概念 237思考题 238第8章 社会网络分析 2398.1 社会网络分析概述 2398.1.1 社会网络的概念 2398.1.2 社会网络分析基础知识 2408.1.3 社会网络的形式化表达 2428.1.4 社会网络的常见分类 2438.2 整体网络测量 2468.2.1 密度 2468.2.2 核心边缘结构 2488.3 中心性分析 2498.3.1 点度中心性 2498.3.2 中间(中介)中心性 2538.3.3 接近中心性(整体中心性) 2558.3.4 特征向量中心性 2568.4 凝聚子群分析 2578.5 使用UCINET进行社会网络计算 2578.5.1 UCINET的运行环境 2578.5.2 UCINET数据导入导出与数据处理 2598.6 网络可视化分析 2668.6.1 NetDraw 2668.6.2 Gephi 2668.6.3 导出数据 2718.7 案例研究 2718.7.1 社会网络分析在网络结构研究中的应用 2718.7.2 社会网络分析在社会资本研究中的应用 2738.7.3 社会网络分析在同质性研究中的应用 274本章小结 276核心概念 276思考题 277第9章 语义网络分析 2789.1 语义网络分析概述 2789.1.1 语义网络分析的基本概念 2789.1.2 语义网络分析的流程结构 2789.2 语义网络分析的结构特征 2799.3 语义网络分析的常用工具 2809.3.1 ROST CM6 2809.3.2 Python 2829.3.3 结果探讨 2879.4 研究案例 2889.4.1 语义网络分析在学科发展领域的应用 2889.4.2 语义网络分析在媒体报道分析层面的应用 2919.4.3 语义网络分析在数字平台用户层面的应用 294本章小结 296核心概念 297思考题 297第10章 虚拟仿真 29810.1 虚拟仿真概述 29810.1.1 虚拟仿真的基本概念 29810.1.2 ABM的发展和应用 29910.1.3 ABM建模 30010.1.4 ABM的核心概念 30110.1.5 ABM方法的优点 30210.2 NetLogo 30310.2.1 基本编程概念 30310.2.2 认识NetLogo 30410.3 实战演练 31010.3.1 模拟程序的流程 31010.3.2 SIR模型 31210.4 案例分析 32010.4.1 ABM仿真模拟的两个研究方向 32010.4.2 ABM仿真模拟在信息传播和社交媒体中的应用 32210.4.3 ABM仿真模拟在健康传播中的应用 324本章小结 325核心概念 326思考题 326
【前言】另附在智能传播时代,人们的日常生活深深嵌入网络之中,几乎所有的社会互动和个体活动都在某种程度上留下了数字踪迹。在线上,从信息搜索、购物消费到媒体互动;在线下,从外出旅行、学习培训到娱乐活动,产生的所有信息都以数据形式被记录并存储,从而形成庞大而复杂的数据生态系统,构成全面而多元的基础信息库。这些行为数据具有丰富性和实时性,正在改变社会科学研究范式,并催生了;计算社会科学这一研究领域。大数据时代的崛起,为社会科学研究者提供了新的研究方法和研究途径,研究者能够更加深入地挖掘庞大而又复杂的信息流,揭示其中蕴含的规律,预判未来的发展趋势。从信息采集、处理到知识提取,大数据技术以前所未有的广度、深度以及收集和分析数据的能力,改变了我们获取信息的方式,更为我们理解社会现象提供了全新的认知途径。大数据时代给社会科学研究者带来了前所未有的机遇,提高了理论创新的可能性,但也给社会科学研究者带来了巨大的挑战。数据的庞大、多样和实时性既要求社会科学研究者掌握先进的数据处理和分析技能,又要求社会科学研究者发展新的理论框架和方法论,从而更深刻、全面地理解和解释这些数据。这就对传媒专业的学生培养提出了新的要求。在海量信息时代,传统的研究方法已经不能满足高效处理庞大数据集的需求,传媒专业的学生需要掌握并能运用先进的计算方法,从庞杂的媒体数据中提炼出有价值的信息,以便开展新闻报道、深度分析、广告投放、公关策略优化等实务工作。此外,传媒专业的学生还应能在理论层面理解大数据改变信息生产和传播的过程,从而推动传媒研究趋向于数据驱动,为学科的深度发展创造新的契机。本书是传媒专业的研究方法类课程教材,一方面侧重技术细节,致力于用浅显和简单的语言介绍复杂的计算方法;另一方面侧重计算方法在新闻传媒研究中的实际应用,以便于读者学习如何将计算方法应用于社会实践和理论创新。本书以大数据分析技术为线索,每章介绍一种方法,包括大数据的获取、文本分析、情感分析、聚类分析、主题模型、机器学习、自动文本分析、社会网络分析、语义网络分析、虚拟仿真等。除了;第1章 大数据的获取以外,其他章的编写思路都是先介绍技术原理,再通过数据案例介绍技术操作流程,最后选取若干篇研究案例,介绍相关技术原理在新闻传播学研究中的主要应用。本教材的知识框架和知识内容基于本人的课堂教案,感谢我的学生蔡文怡、赖咏晴校对教材内容并进行格式调整,感谢我的学生文湘婧、王皎(第1章)、陈辰(第2章)、杨雅坤(第3章)、王昱瑾(第4章)、蔡文怡(第5章)、赖咏晴(第6章)、董晨曦和吴洋洋(第7章)、凌觐如(第8章)、耿珂欣(第9章)、张金(第10章)帮助收集资料并凝聚成初稿。此次书稿得以成书出版,还得益于苏州大学传媒学院给予的大力支持和我的导师清华大学沈阳教授提供的宝贵指导意见,在此表示衷心的感谢。限于作者水平,书中不足之处在所难免,敬请读者批评指正。反馈邮箱:shim@tup.tsinghua.edu.cn。罗茜2023年12月
- 新华一城书集 (微信公众号认证)
- 上海新华书店官方微信书店
- 扫描二维码,访问我们的微信店铺
- 随时随地的购物、客服咨询、查询订单和物流...