科学出版社旗舰店店铺主页二维码
科学出版社旗舰店 微信认证
科学出版社秉承多年来形成的“高层次、高水平、高质量”和“严肃、严密、严格”的优良传统与作风,始终坚持为科技创新服务、为传播与普及科学知识服务、为科学家和广大读者服务的宗旨。
微信扫描二维码,访问我们的微信店铺
你可以使用微信联系我们,随时随地的购物、客服咨询、查询订单和物流...

中国科学家思想录·第十三辑

64.80
运费: ¥ 0.00-18.00
中国科学家思想录·第十三辑 商品图0
中国科学家思想录·第十三辑 商品图1
中国科学家思想录·第十三辑 商品图2
中国科学家思想录·第十三辑 商品图3
中国科学家思想录·第十三辑 商品缩略图0 中国科学家思想录·第十三辑 商品缩略图1 中国科学家思想录·第十三辑 商品缩略图2 中国科学家思想录·第十三辑 商品缩略图3

商品详情

书名:中国科学家思想录·第十三辑
定价:82.0
ISBN:9787030523198
作者:中国科学院
版次:1
出版时间:2017-03

在线试读:
抓住信息时代机遇,促进人文计算发展
  李启虎等
  一、引言
  人文指人类社会的各种文化现象,而信息是联系物理世界与人类认知的重要桥梁和纽带。因此,人文与信息有着天然的联系。信息技术的飞速发展为社会进步做出了巨大贡献,并已深入到社会生活的方方面面。它不仅拓展了人类认知的疆域,也改变了人类对于物理世界的认知模式,更进一步地影响、渗透到传统研究视野下的社会学科,并形成一个文理工交叉学科 ―人文计算( Humanities Computing或 Computing in the Humanities),衍生出数字人文( digital humanities)的概念。人文计算是一个新型的将现代信息技术深入应用于传统人文研究的跨学科研究领域。目前,欧美发达国家和地区已经建立了数字人文研究中心,研究成果已广泛服务于社会。为了更进一步服务社会发展,信息技术需要与人文社会学科进行更深入的结合,为相关研究注入新的活力。特别是利用信息技术手段变革传统的既有研究模式,从而在广度和深度两个方面增强对人文社会学科研究内容的认知。这一发展趋势既是信息技术服务社会生活的需要,也是人文社会学科适应信息时代变化的必然,因此具有重要的研究意义。从另一个方面看,我国已经成为高速发展的新兴经济体,在经济建设方面已经取得了巨大的成就,推动和强化我国在人文计算这一方向的研究,对于增强我国的软实力同样具有现实意义。
  本咨询项目主要研究内容包括全面了解人文计算方面的研究概况,分析其未来的发展趋势。在本咨询项目实施过程中,咨询项目组对国内外在人文计算领域研究的重点内容进行了深入调研,剖析了这些研究所处的状态,为我国抓住信息时代机遇,促进人文计算学的蓬勃发展提出了积极可行的意见与建议。
  二、人文计算的概念及其国内外发展现状
  2010年 11月,美国《纽约时报》刊出一篇报道,名为 “打开人文宝藏的数字钥匙”的文章。文章起头说, 20世纪的人文社会学科历经了一波又一波“主义”的洗礼——形式主义、弗洛伊德主义、结构主义、后殖民主义,凡此种种。作者问道:下一个关键概念会是什么?给出的答案是:数据。因为我们生活在这样的年代,研究者所能接触的数据量前所未有,信息技术为大量资料提供了处理工具。两者汇合,催生了“人文计算”的诞生。
  这只是《纽约时报》一系列报道中的一篇文章:从 2010年 3月开始,《纽约时报》已经就人文计算这一主题,陆续发表多篇报道。内容涵盖文学、戏剧、历史等各种人文学的不同分支。这说明,人文计算所带来的冲击,跨越了传统学科的界线。
  《纽约时报》的文章可以反映美国学界的发展趋势。当然人文计算的发展不仅仅局限于美国,实际上这是一个全球学界的发展趋势。
  1人文计算的概念
  人文计算是针对计算与人文学科之间的交叉领域进行研究、学习及创新的一门学科。人文计算的研究范围从在线文档处理到大规模文化数据的挖掘,研究内容涵盖经过数字化加工和直接数字化产生的数据资源及传统人文学科(如历史,哲学,语言学,文学,艺术,考古,音乐和文化研究)的方法论。它试图通过数据可视化、信息检索、数据挖掘、统计分析、文本挖掘及数字出版等计算方式为这些研究提供多种工具。
  人文计算的一个重要内容是,将信息处理技术系统地融合到人文研究的活动中。如同当代经验社会科学研究对计算技术的利用一样,基础的信息技术已经大量应用到传统的艺术和人文学科中,包括文本分析技术、地理信息系统技术、通用协同工作技术、交互式游戏和多媒体技术等。
  2人文计算不同于计算社会学
  近年来,与人文计算研究内容相近的计算社会学蓬勃发展,在研究方面取得了丰富的研究成果,特别是在社会舆情、信息传播、社会网络、人工社会等方面都取得了长足进展,有些研究成果已经应用于实际的社会学研究和社会管理中。
  2009年 2月, 15位来自社会科学、物理学、信息学等领域的学者联合在《科学》杂志发表名为“计算社会学”( Computational Social Science)的文章,分析了在广泛使用和多样应用网络背景下产生的、以发掘行为和组织规律为目的的研究问题,以及已有基础和学科发展的机遇与挑战。这篇文章提出了计算社会学的概念,认为人们各种社会行为都以数据的形式留下了记录,而这些数据中蕴含的关于个人和群体行为的规律,可能足以改变我们对个人生活、组织机构乃至整个社会的认知。与传统社会科学通过问卷调查形式获得的数据不同,计算社会学可以借助各种新技术获得长时间、连续、大量人群的各种行为和互动的更为全面客观的数据。这些数据为研究动态的人际交流、大型社会网络的演化等方面的问题提供了实的基础。近期美国中央情报局前雇员斯诺登(Snowdon)所揭秘的美国“棱镜”(prism)项目,从技术角度讲,就是一个世界顶*科技强国以其国力服务于特殊目的的计算社会学实践案例。
  另外,据 2012年 11月美国《时代》杂志报道,奥巴马(Obama)团队在 2012年美国总统大选中利用计算社会学研究成果,通过对各州选民投票倾向样本数据的建模,每晚用云计算平台模拟大选,并于每天上午获得计算结果,了解在这些州胜出的可能性,从而针对性地分配资源,为奥巴马*终赢得大选发挥了重要作用。
  虽然社会人文通常被归为一个大的学科领域,然而从目前计算社会学的研究内容上看,计算社会学有特定的研究内容和研究方向:在社会问题和计算技术间架起桥梁,从基础理论、实验手段及领域应用等各个层面突破社会科学与计算科学交叉借鉴的困难。因此,计算社会学和人文计算在研究内容上存在明显的区别:计算社会学侧重于社会学和社会管理的研究范畴;人文计算则侧重于信息技术与人文研究的结合方面。因此,本文仅限于对人文计算范畴内相关内容的研究。
  3人文计算的发展及现状
  人文计算在世界范围内呈现蓬勃发展之势。
  表现之一,不少学术机构纷纷建立人文计算研究单位。其中,历史较长的有乔治梅森大学(George Mason University)于 1994年成立的历史与新媒体中心(Center for History and New Media)。从这个机构的名称可以看出,当时“人文计算”的概念还没有产生,人们侧重于历史研究与新兴媒体的结合。同样,很多人文计算机构也都是由原先的类似单位演变而来。在亚洲,日本的立命馆大学开办了日本艺术与文化数字人文中心(Digital Humanities Center for Japanese Arts and Cultures);我国的台湾大学建立了数位 a典藏研究发展中心,即数字人文研究中心。
  表现之二,这些研究单位招收人文计算专业的研究生,组建人文计算实验室成为普遍现象。以美国为例,斯坦福大学有斯坦福人文实验室(Stanford Humanities Lab)、加利福尼尔大学洛杉矶分校有数字人文中心;哈佛大学在 2008年推出“数字人文先导计划”(Digital Humanities Initiative),2010年则再进一步成立“人文 20”(Humanities 20)实验室。它们面向校内的人文院系,发展数字化的研究工具、建立讨论平台或提出跨领域的合作计划。
  表现之三,定期举办的各类人文计算学术会议,特别是国际会议。国际上人文计算方面具有较大影响的是一年一度的数字人文年会。此年会的前身是文学与语言学计算学会( Association for Literary and Linguistic Computing, ALLC)和计算与人文学会( The Association for Computers and the Humanities)的年会。自 2006年开始,此会议正式改名为 “数字人文”,在欧洲和美洲轮流举行,到目前为止举办的地点分别为巴黎大学、伊利诺伊大学、芬兰大学、马利兰大学、伦敦大学与斯坦福大学。从主办方的分布,足以再次说明人文计算的发展,不是一时一地的孤立现象,而是国际学界共同关心的主题。
  表现之四,有大量研究论文发表和相关研究期刊创办。例如,牛津大学出版社出版的《文学与语言学计算》( Literary and Linguistic Computing)是一个人文计算方面学术论文发表的重要期刊。此期刊由文学与语言学计算学会、计算与人文学会和加拿大的数字人文协会( The Society for Digital Humanities)共同主持。另外,还有一些期刊采取在线出版抛弃传统的纸质出版模式,成为人文计算论文发表的重要园地。例如,《数字人文季刊》( Digital Humanities Quarterly),围绕人文计算展开广泛讨论,除了数据挖掘等技术层面的讨论外,还有“如何将数字人文的计划完成”( Done: Finishing Projects in the Digital Humanities)这样的专题探索。
  现阶段,人文计算在我国还只是在一些机构或大学的研究中零星出现。从学科的研究角度看还没有形成气候,也未受到足够的重视。然而,在社会生活中,对于人文计算的需求已经显现,并且有些人文计算研究成果已运用于社会实践和生活中。
  自 2005年起,我国国家语言文字工作委员会、教育部语言文字信息管理司出版发布了“中国语言生活绿皮书”丛书。这一丛书分为 A系列和 B系列,其中的 B系列是关于我国语言状况的呈现和分析的,主要发布语言生活中的各种调查报告和实态数据。其中的语言数据的统计及处理技术,则属于人文计算研究的基本内容。统计数据按年度计算和发布。这些工作由教育部语言文学信息管理司具体组织和领导。截至 2012年,语言数据已经连续发布 8年,成为我国大陆地区乃至整个华语圈具有影响力的权**发布。同时在“中国语言生活绿皮书”丛书的框架下, A系列出版发布了各类语言规范,其中很多规范涉及语言计算的内容。对数据进行规范,便于数据的共享和再利用。“中国语言生活绿皮书”丛书所涉及的内容已经超*了传统语言学的研究范围,也不仅仅是计算语言学所研究的内容。尽管没有直接使用人文计算这一概念,实际上这里的内容已经深刻涉及了人文计算领域。围绕“中国语言生活绿皮书”丛书的研究工作已经成为近年来我国持续时间*长、涉及面众多、影响广泛的人文计算工程实践。
  三、人文计算的数据基础与计算模型
  人文计算有其发展的渊源,这个专业概念的出现也具有其基础和特征:第*,人文计算需要数据资源作为基础,这也是计算的出发点;第二,人文计算重视计算手段的应用,发展计算模型尝试提供客观可量化的指标辅助人文研究,但是并不认为计算能解答所有人文研究的命题;第三,人文计算重视数据的开放与分享,且努力降低进入领域的门槛,扩大影响。
  1人文计算的数据资源
  大规模的数据资源是展开人文计算的基础。除了直接数字化产生的数据资源,人文计算需要有资源与人力将非数字化的资料数字化。
  自 2004年起,以欧盟为主体的“欧洲研究基础建设策略论坛”( The European Strategy Forum on Research),汇集了英国、法国、德国、荷兰和丹麦等众多国家的研究力量,合作推动“艺术与人文的数字研究基础建设”( Digital Research Infrastructure for the Arts and Humanities,简称 DARIAH)。他们认为就如天文学家需要天文台观测宇宙,艺术与人文学者也需要相应的研究基础建设。这是 DARIAH 成立的目标,也是各国文献资料数字化工作的目标。许多国家的大型图书馆扮演了文献资料数字化的领导角色。比如,美国国会图书馆( Library of Congress)的“美国记忆”( American Memory)项目就是一个例子。
  “美国记忆”集中在与美国历史和文化相关的资料。自 20世纪 90年代开始,美国国会图书馆便有计划地将馆内藏品逐步数字化,并转由 CD储存。不过这一工作成本较高,存取也不方便。随着网络的发展,国会图书馆开始建设以“美国记忆”( American Memory)为名的数字图书馆。根据官方数字,至今已经有 900万笔数据上线,供读者使用。日本的国会图书馆也于 1998年提出“电子图书馆”构想,将馆内明治、大正和昭和前期的图书加以扫描,并提供数字化目录索引。到 2010年为止,总共有 47万册的日文图书完成数字化。由于著作权的问题,其中的 30万册图书只能在馆内使用,其余 17万册图书全部上网,可以在世界各地免费连线阅览。
  美国与日本的国会图书馆,只是数字图书馆发展中的两个例子。“维基百科”收录的数字图书馆(博物馆)计划列表有上百个项目。我国台湾地区自 2002年开始实施“数位典藏计划”( National Digital Archives Program, NDAP),已经建立了门类比较齐全的各类数字化人文数据资源,其中很大部分对外开放。与此同时,台湾的文化建设委员会启动了另外一项大型数字化计划,名为“文化数据库”。与“数位典藏计划”不同,这一计划的数字化内容为台湾地区的艺术作品、文献等,以民间文化为主。
  在我国大陆,文献资料的数字化工作也积极展开,特别是古籍文献方面的数字化工作取得较大进展,其中有两项数字化工程已经形成了可以使用的数据资源:《四库全书》和“中国基本古籍库”。在中国传统的大型丛书中,《四库全书》是第*套被数字化的,文渊阁《四库全书》的电子版由香港迪志文化出版公司推出。自 2001年开始,北京大学等校与商业公司联合,推动名为 “中国基本古籍库”的古籍文献数字化计划,计划涵括上万本中国古籍,总字数超过 17亿字。
  此外,一些商业公司也积极进入文献资料的数字化领域,谷歌公司自 2002年开始就推动“谷歌图书”( Google Books)计划。根据这一计划,谷歌要建立世界上*大、*全面的数字图书馆,将人类有史以来出版过的印刷书籍,全数扫描上网。 2004年,谷歌与英美几所大学——包括牛津大学、哈佛大学、斯坦福大学和密歇根大学等的图书馆签约,要将这些图书馆的馆藏书籍加以数字化。目前“谷歌图书”已经可以提供超过 700万本图书的全文检索,部分能提供整本书的浏览,这个数量十分惊人。
  从上面的说明可以看出:当今社会处在一个数据量前所未有的时代,这个时代的人文计算,与以前计算工具在人文学科中的简单应用大大不同,研究方法和模式也将出现显著差异。如今,数据资源已经不再是拥有大量研究经费者的专有资源,人们可以利用网络接触和使用到庞大的数据资源。而且,这些资源不仅仅限于文字,还包括了影像、音乐等多媒体形式。对于人文研究来说,这些都具有正面的积极意义。
  为了增进人们对人文资源的认知,发掘其中的新知识,需要引入计算模型,通过信息处理的技术手段拓展研究的视野。因此,从发展的角度看,相对于数据的积累,分析计算具有更重要的意义。
  2人文计算中的计算模型
  目前,信息技术的处理手段已经引入人文计算研究,研究者利用这一手段从大量数据资源中挖掘出新的意义。这些方法可以应用在不同的材料上,在方法论层面上对其他的研究具有启发意义。这里对其中几种处理模式进行具体说明。
  首先是“词语频度分析”,简单地说就是计算文本中各种词汇出现的次数。词语频度分析是一种常用的文献分析手段。以英语世界中的莎士比亚作品为例。是否所有冠名莎士比亚的作品都是出自他本人之手呢?有诸多的研究者尝试采用不同的方式进行解答,如分析莎士比亚的生平,寻找代笔的证据,或者分析作品本身的写作风格,比较各作品之间的差异。可以利用词语频度分析判定写作风格。虽然这类统计分析不见得能直接给出结果,但是可以给出一些量化的指标,为讨论分析提供客观的基础。这一研究方式已经被引入汉语文学作品中,例如,《红楼梦》前八十回和后四十回是否为同一作者所写,就有学者引入词语频度分析进行探讨。
科学出版社旗舰店店铺主页二维码
科学出版社旗舰店 微信公众号认证
科学出版社秉承多年来形成的“高层次、高水平、高质量”和“严肃、严密、严格”的优良传统与作风,始终坚持为科技创新服务、为传播与普及科学知识服务、为科学家和广大读者服务的宗旨。
扫描二维码,访问我们的微信店铺
随时随地的购物、客服咨询、查询订单和物流...

中国科学家思想录·第十三辑

手机启动微信
扫一扫购买

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏

微信支付

支付宝

扫一扫购买

打开微信,扫一扫

或搜索微信号:sciencepress-cspm
科学出版社官方微信公众号

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏