商品详情
本书依托作者四年的;网络与新媒体专业教学实践,力图贯彻新文科理念,给文科生讲解人工智能和智能传播基础知识与相关算法的底层逻辑。书中涉及的高等数学知识(特征空间、核函数、矩阵计算、图论等)均被巧妙地穿插在智能传播算法地讲解过程中,以贴近生活地举例说明完成讲授,有助于文科生循序渐进的吸收算法知识。
王天娇,传播学博士,广东外语外贸大学云山青年学者、副教授,硕士生导师,广州城市舆情治理与国际形象传播研究中心研究员。主要研究领域为政治传播、智能传播、公共关系、修辞与公共传播和媒介与社会变迁。主持国家社科基金项目1项,在SSCI、SCI和中文核心期刊上已发表论文20余篇。学术成果获国际中华传播学会(CCA)杰出博士论文奖、全国新闻传播学优秀论文奖等。
第一部分 总论
第一章 智能传播中的场景与算法
第一节 一种发展史:从计算传播到智能传播
第二节 智能时代中的场景与算法
第二章 场景与算法的辩证关系
第一节 数据场景:学习算法的入场券
第二节 数据算法:探索数据奥秘的钥匙
第三章 智能传播的学习路径
第一节 两种取向
第二节 一种融合路径的探索
第二部分 网络计算
第一章 网络信息搜索的底层逻辑
第一节 放大镜思维
第二节 投票思维
第二章 PageRank算法及其矩阵化表达
第一节 PageRank基础公式
第二节 PageRank算法的矩阵计算
第三节 两个问题
第四节 PageRank算法的困境与优化
第五节 互联网的片区观
第三章 网络与图的计算
第一节 图的构成与邻接矩阵
第二节 复杂关系的图表达与图计算
第三节 作为图的文本:关键词提取与摘要生成
第四节 自然语言处理的基础知识
第四章 网络计算中的中心性度量
第一节 社会影响力与顶点的度分布
第二节 顶点的中心性
第三节 图的中心势
第五章 网络计算的现实场景及其代码实现
第一节 场景与代码:基于多部图投射的排行榜信息挖掘
第二节 场景与代码:三大奖项演员合作网络的计算
第三部分 一种简化世界的方法:聚类
第一章 聚类与智能传播
第一节 什么是聚类?
第二节 非结构化数据的聚类
第二章 聚类前的准备:以文本为例
第一节 词频
第二节 词频逆文档频率
第三章 相似度的计算
第一节 特征空间与矩阵表达
第二节 文本相似度的计算
第四章 常用聚类算法
第一节 层次聚类
第二节 K均值聚类
第三节 基于密度的空间聚类
第四节 LDA主题模型
第五章 相似度的应用:推荐算法与关联规则分析
第一节 常用推荐算法
第二节 关联规则挖掘算法
第六章 聚类、推荐与关联规则的现实场景及其代码实现
第一节 场景与代码:基于关联规则的用户影响力挖掘
第二节 场景与代码:基于推荐算法的情感预测
第四部分 智能传播中的机器学习
第一章 机器学习发展简史
第一节 从规则学习到机器学习
第二节 机器学习主要概念辨析
第三节 机器学习的应用
第二章 机器学习的分类
第一节 离线学习与在线学习
第二节 监督学习、无监督学习、半监督学习和自监督学习
第三章 模型评估的底层逻辑
第一节 训练集、测试集和验证集
第二节 K折交叉验证
第三节 过拟合与欠拟合
第四章 模型评估应用
第一节 回归分析与分类任务
第二节 二分类任务场景与基础概念
第三节 单模型评价指标
第四节 多模型评价指标
第五节 二分类算法在多分类问题中的应用
第五章 常用机器学习算法
第一节 K近邻算法
第二节 支持向量机
第三节 从决策树到集成方法
第六章 机器学习算法的现实场景及其代码实现
第一节 场景与代码:虚假新闻的识别
第二节 场景与代码:无监督学习的语料分类与自动摘要生成
参考文献
自 序
无论是国际传播协会的计算方法小组,还是中国新闻史学会下设的智能与计算传播专业委员会,它们在初创时都有祝建华老师及其博士生活跃的身影。而这批博士生中的大多数,正是我在香港城市大学读博阶段的师兄、师姐和同学们。从这个意义上讲,我也算是见证了智能与计算传播从香港城市大学;破茧而出的过程。后来,出于好奇,也出于个人发展的需要,我陆陆续续参与过一些与人工智能或者计算社会科学相关的人才培养项目,参加过不少计算机专业、新闻传播专业以及其他人文社科专业背景的高校教师或互联网大厂程序员参与的、致力于培养智能与计算社会科学人才而开设的讲习班、交流会或培训课程。在交流与培训中,我慢慢萌生了写作此书的念头。
这本书酝酿了很久。最初,在香港城市大学给研究生讲授社交网络数据获取与分析课程时,我就一直困惑于智能传播相关领域的教学门径,困惑于如何更有效地拆解、传授智能传播研究所需掌握的知识、技能以及思维习惯。老实说,当时教课是赶鸭子上架。它迫使我在短时间内将与智能传播相关的编程知识、场景知识和算法逻辑条理化、系统化。然而,我还是觉得愧对当年的学生。那时,自己对智能传播的理解有限,特别是对数据生成场景与数据算法之间的辩证关系认识不足,使得当时的课程讲授主要围绕编程技能展开,而场景和算法知识只是点缀。这也是当时大多数与智能传播有关的工作坊、讲习班甚至课堂教学的常见样貌。然而,一次课后,有学生问我:;老师,我们以后是要当程序员吗?这么多编程知识我老是记不住怎么办?那时,我也挺困惑。
后来到广东外语外贸大学任教,适逢课程体系改革,学院鼓励老师开新课。于是,按照当时主流的提法,我给自己的课取名为计算传播学导论。这门课程,现在被认为是在智能传播视域下的知识架构,但在当时的学界,还是大多被放在计算传播学的概念下做探讨,这也是这门课程名字的由来。如今,这门课程已经;折磨过20202023级网络与新媒体专业的全体同学。感谢这四百多位同学的认真反馈和尚可的教评成绩。在这四年多的时间里,我的教案每学期都会修改从最初的;以理论和论文为主,代码学习为辅的学术加实践的思路,到后来改为从同学们熟悉的网络应用场景入手,围绕场景讲述相关算法知识,最终触达机器学习知识体系的教学努力。
这本书的写作既源自新文科的教学实践,也是对新文科顶层设计的思考与体悟。2018年,我国新文科建设正式发端。其后,随着人工智能和信息技术的发展,越来越多学界同仁认识到应努力将人工智能与高等教育相结合、与新文科建设相融合,让文科生也能在人工智能时代踏浪前行。未来会有越来越多的工作岗位涉及与人工智能、网络信息服务相关的数据服务、咨询、应用拓展等。因此,从智能传播和计算社会科学相关的场景知识和算法逻辑入手,让文科生有机会入门信息技术和人工智能的应用场景,进而能与工程技术人员开展对话,这是我的一个梦想。从香港到广州,之前教过的学生,有些做了互联网大厂的产品经理,有些做了用户研究与体验设计相关的工作,有些虽然从事传统行业却用课堂讲授过的算法逻辑分析着日常的商业数据,还有些在智能传播领域读博深造或已经毕业进入了高校教师行列。跟他们的交流越发坚定了我写作、完善本书的想法。希望这本书能惠及更多学子、学界同仁或者有志于了解算法知识但囿于文科背景的终身学习者。
这本书不适合理工科背景的读者。你们可能觉得它好啰唆明明一个公式可以讲明白的事,为什么又是拿生活中熟悉的场景做比喻(如用饮料瓶的投影讲解低维数据向高维空间的投射变换),又是掰开了揉碎了、事无巨细地讲那么多算法设计的细节(如讲信息熵,从;人咬狗才是新闻讲到信息的可加原则如何用对数的相乘得以实现),以及对应的现实行为逻辑和商业考量(如PageRank算法中的阻尼系数)?其实,我是故意为之。
如前所述,这本书源自课堂教学实践。在这四年多的教学过程中,我收到的最多的反馈意见是;这门课太干了!;比撒哈拉沙漠还干!熟悉大学教学环境的朋友可能知道,学生们喜欢把一些容易得分又缺乏实质性内容的课程称为;水课。哪个老师也不希望自己的课被学生私下称为;水课;而;太干的课程往往意味着学生接受起来比较困难。从一开始我就有清晰的认识:我面对的是文科生是完全没有编程技术、缺乏系统统计知识(如回归分析、聚类算法)和高等数学知识(线性代数和微积分)的大学一年级和二年级的文科生。很多人说,他们当年之所以选择新闻传播专业,就是为了不再学数学!可想而知,对于这样一群文科生来说,算法知识的接受度会很低、畏难情绪会很强。所以,要讲余弦相似度、贝叶斯统计、集成算法、TextRank算法等,就不能像教理工科学生那样干巴巴地放公式。
任何学习都要首先保护学生的兴趣。让他们觉得有用、有趣、有可能学会,才能在不抗拒的前提下,主动完成信息的接收、消化与应用。基于自己的教学经验,我深知:文科生不是学不会编程和算法思维,而是畏惧、抗拒此类学习体验。因此,在我的教学实践中,在这本书的写作中,我脑海中一直有个;典型文科生的形象。每个知识点,我都会站在她/他的角度自问一句:她/他会不会没看懂?哪些预设的前置知识或者扩展应用还没讲到位,以至于可能影响她/他的信息接收与理解?她/他会不会觉得太枯燥、不实用?这个知识点会不会讲得太抽象了,让她/他失去了兴趣?就是在这种反复对话、反复拉扯的过程中,我努力完善着手稿增加细节、增加日常生活场景,尽力用形象的比喻拆解抽象的数学概念。你可以说,我在努力;注水。但从教学实践来看,即使;注水到如此地步,对于大多数文科学生而言,这门课依旧是他们大学期间修过的;最干的一门课。
我知道学生们学得辛苦,但当有学生反馈说;痛并快乐着;体会了算法的乐趣或者;这门课程助力了我的产品经理梦时,我是开心的。说实话,对于尚可的教评,甚至越来越好的学生打分,我自己也有些惊讶。近几年,甚至有学生在不计算学分的情况下全程蹭课。比如,有临近毕业却没上过本课程的网络与新媒体专业学生因;不想留下遗憾来蹭课,也有新闻学专业的同学跨专业跑来蹭课。他们不仅蹭课,连每月一次的月考也要蹭。虽然大家的成绩喜忧参半,但他们的坚持给了我信心,也让我加快了写书的进度。
因为有月考,所以学生们不得不经常复习。同时,因为我们的考试都是应用性极强的场景题,需要学生现场手算结果(如矩阵计算、网络计算、聚类计算等),因此,很多学生在复习时会主动上网搜索一些相关的知识点进行自我拓展,以期更加灵活、全面地掌握已讲授的知识点。这样就经常会碰到如下状况。考试前,有学生拿着网上找来的补充资料问我:;老师,为什么你讲的我听懂了,但网上的技术资料中,这个部分我还是不能完全看懂?或者问我:;我找到这个算法的扩展形式,但我不确定我的理解对不对,老师你能帮我看看吗?面对这样的问题,我深感一本配套的系统性的参考书的出版势在必行。
在讲授知识点时, 虽然我尽量由浅入深并以文科生更易理解的语言、逻辑完成讲述,但说到底公式还是要讲、专业术语还是得说,因为这些才是学生在人工智能和智能传播领域的进身之阶他们要能用商业领域和技术人才的专业术语完成更具商业价值、应用价值的交流与沟通,这才是跨学科复合型人才的培养目标。已毕业的学生中,有的做了产品经理或者其他需要跟一线编程人员合作的工作。他们反馈说;能用程序员听得懂的术语跟他们交流算法和我要的任务结果,这对我的工作帮助很大。这句话让我印象深刻。后来,这也成了我写书的一个目标,即;搭梯子最终要让文科生也能掌握那些看似艰深的算法术语,理解算法的底层逻辑,让他们在离开高校后,在需要独立阅读技术文档、了解更新的算法前沿时,能看懂技术人才在网络问答社区分享的专业文档,能理解基础性的核心术语,能在人工智能时代有继续前行的进身之阶。
在四届学生的教学实践和新文科建设浪潮下,日益沉淀的思考最终形成了这样一本小书。它可以作为高等院校计算传播类或人文社科专业的算法类课程的参考书,也可以成为想要了解算法思维的普通读者的入门读物。它有公式,但你可以略过。主要的讲解部分都是用通俗语言对数据生成场景和相关算法逻辑的直白讲述。通常,讲完这些才会给出公式。因为此时的读者已经能够看懂公式每一部分所对应的算法逻辑和场景需求了。当然,作为一名智能传播相关课程的高校教师,我是有私心的希望这本书的出版能帮助学生更好地复习课堂讲授的知识点、更有效地扩展相关算法和场景知识,成为课堂教学的重要补充。从这个角度讲,这本书具备如下三个特征。
第一,在内容体量上,本书适合以新闻传播学为代表的高等学校文科专业学生使用,且其体量适用于一个学期(大约16周)的教学安排。虽然教案每学期都修订,但在最近三年的教学实践中,整本书的知识框架已经固定,每学期只是在具体知识点的讲授方式、援引的数据场景以及勾连的知识体系上做微调。因此,实践证明本书是可以满足高校日常教学需求的。
第二,在场景选择上,本书主要围绕三类场景展开,即生活场景、商业场景、学术场景。生活场景涉及普通人的日常网络使用行为及其数据生成场景(如搜索引擎、社会网络);商业场景则从商业分析的常用需求入手,解析不同数据分析场景的商业目标及其算法实现(如购物篮分析、推荐算法);学术场景则围绕新闻传播领域的常见学术议题讲解算法(如文本分类、主题提取、回归预测等)。
考虑到即使是新闻传播专业的学生,多数人可能也并不致力于从事科研工作,且前两种场景更有助于保持读者兴趣,因此,它们的占比相对较高。同时,前两种场景的大量引入也是为了将复杂的算法逻辑和公式讲解代入更具普遍性、应用性的现实境况中去,使得知识的拆解与拼接更容易被读者理解。不过,随着算法难度的提升、相关基础知识的累积,以及应用场景逐渐从普通人/普通商业机构转移到更为专业的人工智能相关行业(如数字标注等),相对复杂的算法讲解也将主要围绕科研需求场景展开。
第三,在知识架构上,本书内容自成体系,学生可以把握一个整体性的框架或者一种循序渐进的知识获得感。文科生学理工科知识,最容易引发劝退思想的就是那种;知识又多又碎,我迷失了的感觉。因此,提供一种框架感较强的知识体系有助于学生将新知识纳入旧有知识体系中,促进知识的学习与迁移。
本书将智能传播的主要知识点划归到三个版块中,即网络计算、聚类算法和机器学习,并尝试在版块内部,以数据场景或算法逻辑本身的相似性、相关性串联既往看似零散的知识点,使之形成某种体系;同时,在版块之间,以一种场景熟悉度递减、算法难度递增的方式安排知识梯度。具体来说,第一版块;网络计算从大家每天都用的搜索引擎算法入手,先过渡到利用这一算法对文本开展网络分析并介绍图与网络的相关概念与矩阵计算,然后转入社会网络分析的相关算法和应用场景。第二版块;聚类算法从智能传播的常见应用入手,以文本的聚类为基础,展开讲解多种聚类算法及其扩展应用。第三版块;机器学习则是对第二版块的延伸在第二版块的应用场景和算法知识基础上,正式引介机器学习的概念,并系统比较无监督学习算法和监督学习算法,最终导向对常用监督学习算法的讲解。考虑到人工智能领域的飞速发展,本部分在写作中,也加入了深度网络、神经网络、大语言模型、具身机器人等内容,帮助读者厘清该领域诸多概念之间的关系。
此外,考虑到智能传播场景的具体应用及其分析往往需要编程技术做支持,在每个版块之后,会附上一些基于现实智能传播场景的应用及其分析的代码实现(Python)。这些代码力求通俗易懂,所以,做了相对繁复的注释。同时,所有代码都尽量使用最简单的编程技术完成。对于有志于从事智能传播及其研究的读者,可以初尝应用代码完成智能传播任务的获得感。对于应用本书作为教学辅助的老师和同学,也可以在代码基础上深入理解书中所述算法逻辑在实现过程中的技术可能。同时,考虑到读者在阅读本书过程中,可能需要回溯一些已经看过的术语、概念,笔者编制了术语索引。既方便读者快速查找重要的算法、概念和指标,也有助于将其作为教辅资料的读者复习主要的知识点。
虽有雄心,也付出了努力,但我深知:知识一经写下便已过时。在算法技术日新月异的时代,铅字永远追不上浪潮的发展;唯愿本书为有志于人工智能和智能传播领域的读者充当敲门砖、垫脚石,助力大家一窥算法思维的门径。
2024年8月于广州
第一章 智能传播中的场景与算法
第一节 一种发展史:从计算传播到智能传播
随着ChatGPT的火爆,智能传播的概念也日渐走入了公众视野。然而,什么是智能传播?彭兰指出,虽然近年来这一语汇被提及的频率日渐攀升,却鲜有清晰界定。1不过,梳理目前学界的界定思路或者提及语境,不难发现:在讨论智能传播时,人们通常肯定了人工智能算法在其中发挥的基础性作用,同时辅以诸多应用场景解释相关的传播活动,并最终构成智能传播的一套界定话语。比如,周葆华和苗榕在《智能传播研究的知识地图:主要领域、核心概念与知识基础》中,曾将其界定为人工智能技术介入和参与的传播活动。2他们指出,这包括:机器新闻生产、算法推荐以及以智能技术为中介的人类交往和人机交往活动等。彭兰也赞同周葆华等人的界定思路,并强调了应用场景所对应的传播活动(如机器参与的信息生产与分发等)在智能传播界定中的核心基础地位,以及作为规则体系的算法对智能传播的目标确立及其实现路径的决定性影响。3程明和孙嘉蔚在《中国智能传播研究年度报告2023》中则指出,智能传播是数字时代的核心概念。4而;通过大数据分析、自然语言处理、机器学习和自动化技术,更精准的信息传递、个性化内容推荐以及更高效的决策支持是智能传播研究的题中之义。
作为一种传播活动,有关智能传播的讨论虽然不限于却多见于新闻传播学的著述中。那么,回到学科视角下,我们其实可以看见一条从;计算传播向;智能传播发展的演进之路。
在学术版图上,计算传播学是计算研究范式下的一个分支。在过去三十多年的学术演进中,学界先后发展出了计算物理学(computational physics)、计算生物学(computational biology),以及计算社会学(computational sociology)。2009年,以大卫拉扎尔(David Lazar)为首的15位学者在《科学》杂志上以《计算社会科学》为题,发表了一篇定位宣言宣告计算社会科学正式诞生。它强调了计算方法在获取和分析数据中的核心地位。5
虽然计算传播学属于计算社会学的一个分支,但是,其发展并不滞后于计算社会学。事实上,祝建华教授曾经指出,在传播学领域,早在1970年代的电视收视研究中就有了类似后来计算传播学研究的方法取向,只是未成气候,未引起广泛关注。6中文的;计算传播学一词,最早由王成军提出。那时,他还是香港城市大学的一名在读博士生。或者,更确切地说,有关计算传播学的想法,诞生于他赴港读博之前在北京大学读研阶段。在他参加集智俱乐部的活动时,有关计算传播研究的想法就已在酝酿之中。他赴港读博后,其导师祝建华教授作为较早关注计算研究方法并系统培养博士生开展相关学术训练的华人学者在与其博士生的组会交流中,逐渐认可了计算传播学这一概念。2014年,在国际传播学会(International Communication Association,简称ICA),由祝建华教授牵头,由其博士毕业生和在读博士生共同参与发起了一个名曰;计算方法(computational methods)的兴趣小组。这标志着计算传播学方法及其相关理论版图正式被国际传播学界接纳。2018年,在祝建华教授的倡导下,中国计算传播学专业委员会正式成立它成了中国新闻史学会下设的一个二级分会,致力于研究、探讨、分享有关智能时代数据收集、处理、分析的前沿方法。这标志着我国新闻传播学界正式认可并确立了计算传播研究的学术地位。随着人工智能技术的演进和传播格局的快速变化,该二级分会于2023年更名为;智能与计算传播专业委员会,正式将智能传播纳入计算社会科学范式的研究视野。
智能传播和计算传播的异同目前学界未有定论。但在实践层面,似乎人们倾向于将二者作为两个有所交叠又不尽相同的视角。比如,在北京师范大学新闻传播学院2023年的;智能传播与计算传播方向介绍中,将智能传播描述为;人工智能技术在信息传播过程中引发的新现象和新问题,而将计算传播看作一种更具学理性的范畴,即;基于计算社会科学,为传播学构建一个整个信息传播过程可计算的框架的收集和分析人类传播行为数据的研究工作。从这个表述对比来看,智能传播更关注与信息技术相关的人类行为和人机互动行为的前沿动态,而计算传播学则似乎更宽泛、更偏理论性和研究性。
如前所述,智能传播脱胎于计算传播学,是在人工智能技术快速迭代的时代背景下应运而生的语汇。目前,智能传播尚在发展、更新中。因此,本书并不打算加入概念的唇舌之争。相信大多数读者更关心的是:如何深入浅出地真正把握人工智能时代诸多的传播现象、传播场景以及拆解这些场景所须具备的底层算法逻辑。因此,在概念择取中,本书使用新出现的;智能传播概念以切合本书对传播活动和传播现象的关注。在后续的章节中也将从具体的场景入手,从人们熟悉的传播活动或场景需要出发,带领读者领略智能传播时代算法思维的魅力。
第二节 智能时代中的场景与算法
尽管已经进入智能传播时代,但就学科体系来说,目前在国际传播学界公认的概念名词依旧是计算传播或者计算方法。换言之,如果将智能传播看作最新发展,将计算传播看作一直滋养智能传播发展的学术沃土与方法之根,那么,回到计算社会科学的学术视域内,从其生发的土壤中找到这一演进之路中相对不变的、基础性的要素、知识和技能或许才是智能传播时代能立身、进身的关键。因此,要理解智能传播中的场景与算法,我们也需要回到计算方法范式下,从计算传播学中已经取得共识的诸多表述中,获得相对扎实的基础与进路。
在中文学界,最早使用;计算传播学一词的南京大学的王成军教授在其撰写的《计算传播学的起源、概念和应用》一文中提到,;计算传播是指数据驱动的、借助于可计算方法所进行的传播过程,而分析计算传播现象的研究领域就是计算传播学7。在该定义中,计算传播的研究对象是一种特殊的传播过程或称传播行为。值得注意的是,在介绍计算传播学的发展历程时,王成军以两个著名的网络公司的商业场景举例说明。其一是网飞(Netflix)公司的商业模式曾是邮寄电影碟片给用户,需要根据用户画像计算碟片仓库的选址;其二是谷歌公司为满足网民的信息检索、提取、排序需求,开发搜索引擎算法的;计算故事。由此可见,现实场景下,诸多亟待满足的商业需求与生产生活需求构成了计算传播学发展的最初动力。
祝建华教授在《对谈计算传播学:起源、理论、 方法与研究问题》一文中则指出,计算传播学是;通过收集和分析网上行为数据(online behavioral data),描述、解释和预测人类传播行为及其背后驱动机制的一系列计算方法(computational methods)8。在其定义中,网上行为数据是计算传播学的研究对象,而这些数据可能来自网络爬虫抓取的网络用户的点击、分享、跳转、表达形成的自然数据,即我们常说的;数字痕迹,也可能来自组织机构后台服务器存储的用户访问数据日志,还可能包括组织机构在互联网上发布的信息及其在时间维度上的延展所构成的信息发布行为数据。可以看出,在计算传播学视域内,数据的生成场景多种多样其中既有用户个体的生活需求满足,也有商业机构的运作逻辑。而拆解这些场景奥秘的计算方法就构成了计算传播学。
范阿特费尔特(van Atteveldt)与彭泰权作为较早开展计算传播学研究工作的学者曾经指出,计算传播学研究有三个显著特征。9一是大量可用的数据。这些数据来自社交媒体、人们在网络上活动留下的;数字痕迹以及各种报纸、媒介内容以及传统纸质资料的电子化浪潮。二是日新月异的分析算法。这包括社会网络分析法,以及用于自动文本分析的聚类算法、主题建模、有监督的机器学习算法和词嵌入等算法思想及其实现工具的出现。三是日益强大且价格低廉的算力的出现,如各种云计算平台、算法代码的分享平台以及依靠集体智慧众包算法设计和分析任务的协作平台的涌现。在其界定中,以应用场景界定数据的生成及其类型特征,并以算法模型作为计算传播研究的技术要素,同时强调计算机算力的成本下降助推了计算传播学的兴起。
综合上述三位学者的界定,不难看出,计算传播学研究关注网络数据的生成场景,并利用特殊的分析算法或叫;可计算方法;计算方法,探索数据中潜藏的行为模式、行为动因和演化特征。与传统的问卷调查法或者实验室控制实验不同,计算传播学中处理数据不是在研究人员不同程度地介入、干预下完成的。因此,它们不是响应特定的研究设计而产生的反应数据(如问卷中填写的回答或者在实验室中被人工设计的实验材料激发出的意向性或行为反应)。它们是在人们的生活场景、商业场景中自然产生的。这包括手机的通讯数据、网络游戏中用户的行为数据、社交媒体互动数据、问答平台的知识分享数据、网站之间的链接关系数据等。在计算传播研究中,数据的生成场景影响着数据的特征,也因此影响着对数据的收集过程及分析方法的选择。而算法则构成了计算传播学数据分析的核心。
- 新华一城书集 (微信公众号认证)
- 上海新华书店官方微信书店
- 扫描二维码,访问我们的微信店铺
- 随时随地的购物、客服咨询、查询订单和物流...