极客时间商城店铺主页二维码
极客时间商城
为极致和美好付费
微信扫描二维码,访问我们的微信店铺

正则指引(第2版)

70.85
运费: 免运费
库存: 0 件
商品已售罄 收藏 / 分享
正则指引(第2版) 商品图0
正则指引(第2版) 商品缩略图0

商品详情

产品特色

编辑推荐

适读人群 :《正则指引》适合经常需要进行文本处理(比如日志分析或网络运维)的技术人员、熟悉常用开发语言的程序员,以及已经对正则表达式有一定了解的读者阅读。

√ 来自真实场景与高频问题的妙用法门

√ 覆盖所有主流编程语言及其版本差异

√ 源代码及文本数据处理走向高效之路

√ 贯通编码问题→匹配原理→解题思路

√ 适用日志分析|网络运维|自动化测试

√ 深入原理结构差异以利现成成果移植

内容简介

《正则指引(第2版)》综合作者自己遇到的实际问题,以及其他开发人员咨询的问题,总结出一套巧妙运用正则表达式的办法,并通过具体的例子指导读者拆解、分析问题。《正则指引(第2版)》分为三部分:第一部分主要讲解正则表达式的基础知识,涵盖了正则表达式中常见的各种功能和结构;第二部分主要讲解关于正则表达式的更深入的知识,详细探讨了编码问题、匹配原理、解题思路;第三部分将之前介绍的各种知识落实到常用语言.NET、Java、JavaScript、PHP、Python、Ruby、Objective-C、Golang中,在详细介绍了在这些语言中正则表达式的具体用法之外,还辨析了版本之间的细微差异。《正则指引(第2版)》既可以作为专门的学习用书,也可以作为备查的参考手册。

作者简介

余晟,非正统型技术爱好者,有多年研发经验,目前在在线教育行业从事研发与架构管理的工作。在强调技术追求的同时,倡导全面、完整的技术路线和技术文化,业余写作、翻译、审校了若干技术图书。个人公众号为“余晟以为”(yurii-says)。

精彩书评

  掌握正则表达式应该是IT工程师的一项标准技能,遗憾的是,过去,不少人多多少少忽视了这一点,所以在工作中总要应对正则表达式带来的“麻烦”。
  我相信只有掌握并熟练运用它才有可能成为一名高效的工程师。期待每个人手边都有一本正则表达式的参考书,当然,希望就是你现在看到的这本。
  就在写这句话的几分钟前,我又从这本书中学到了一个有用的技巧。
  ——冯大辉

  配合恰当的案例,大量的反问,使读者自问、思考,扣人心扉,比较有代入感,加上配图,很容易让读者全面认识正则表达式。在原理讲解的章节,对比两种理论模型的区别,顺其自然地引入NFA引擎的关键要素一回朔,使读者从匹配原理上了解回溯,从而写出高效、严谨的正则表达式。
  ——陈驰

  本书由浅入深地讲述了正则表达式,在正则表达式的应用和调优方面有非常详细的介绍,特别是在正则表达式处理中文方面有独到的阐述,对于需要经常处理中文的国内技术人员来说,本书无疑是非常值得拥有的一-本手册。
  ——贺钧

  正则表达式是程序员的必备知识。如果您还没有使用过这个强大的工具,或者学习正则表达式总不得要领,建议读读本书。
  ——何源

  这是一本通俗版的《精通正则表达式》。高手很难挑出毛病,一般程序员会受益匪浅,普通用户一步步读下去也能登堂入室。
  ——张东亮

  余晟在之前翻译业内名着的基础上,结合中文环境和自己的丰富经验,再接再厉推出自己的作品,实在是我等码农的一大幸事。
  ——陈钢

目录

第1章 字符组 .................2 
1.1 普通字符组 ............. 2 
1.2 关于Python的基础知识........................... 4 
1.3 普通字符组(续) . 6 
1.4 元字符与转义 ......... 8 
1.5 排除型字符组 ....... 10 
1.6 字符组简记法 ....... 12 
1.7 字符组运算 ........... 14 
1.8 POSIX字符组 ...... 15 
第2章 量词 ...................17 
2.1 一般形式 ............... 17 
2.2 常用量词 ............... 19 
2.3 数据提取 ............... 21 
2.4 点号....................... 23 
2.5 滥用点号的问题 ... 23 
2.6 忽略优先量词 ....... 26 
2.7 转义....................... 31 
第3章 括号 ...................33 
3.1 分组....................... 33 
3.2 多选结构 ............... 39 
3.3 引用分组 ............... 44 
3.4 非捕获分组 ........... 55 
3.5 补充....................... 56 
第4章 断言 ...................60 
4.1 单词边界 ............... 60 
4.2 行起始/结束位置 .. 62 
4.3 环视....................... 69 
4.4 补充....................... 75 
第5章 匹配模式 ............83 
5.1 不区分大小写模式与模式的指定方式 .. 83 
5.2 单行模式 ............... 86 
5.3 多行模式 ............... 87 
5.4 注释模式 ............... 89 
5.5 补充....................... 91 
第6章 其他 ...................95 
6.1 转义....................... 95 

6.2 正则表达式的处理形式 ........................ 103 
第7章 Unicode ...........112 
第8章 匹配原理 ..........138 

第9章 常见问题的解决思路 ...........................146 
第10章 .NET ..............176 

第11章 Java ..............191 
第12章 JavaScript .....208

第13章 PHP ...............225 

第14章 Python ...........245 

第15章 Ruby ..............263 

第16章 Objective-C ..280 

第18章 Linux/UNIX ....314 
附录A 常用语言中正则特性一览 ....................337 
附录B 常用的正则表达式 ...............................340 
附录C 常用的正则表达式工具及资源 .............356 
正则表达式术语中英文对照表 ...........................363


前言/序言

前言 


提到正则表达式,许多人很有点不屑一顾:这东西,不登大雅之堂,再说也不是总要用到,何必专门花时间学习? 
没错,正则表达式并不“总要用到”,但如果到了需要的场合不会用,往往面临“一分钱难倒英雄汉”的困境。经常需要处理文本的程序员自然知道正则表达式的价值,其他的程序员如果不会正则表达式,即便开发的领域与文本处理没什么关系,也难以躲过“躺着中枪”的命运—前几天我遇到一个问题,将一行长长的地址拆分成多行,负责这部分的程序员的日常工作只是制作PDF而已,拆分地址是很“边缘”的功能,但不会正则表达式就无法准确折行(一般需要在标点符号出现的地方折行,而不能只在空白字符处折行,但是不同语言中的标点符号各有不同),结果一筹莫展;相反,如果了解正则表达式,就可以很容易地处理各种语言中的标点字符。 
按照我的开发经验,专门花点时间学习一下正则表达式,确实很有必要。目前可以见到的关于正则表达式的书籍和资料有不少,但又各有不足。 
在互联网上,流传着一些编程语言的正则文档和《30分钟教会你正则表达式》之类的帖子。这类资料的好处是简单直接,如果有现成的例子,而且适用于自己的语言,则可以直接抄来用。然而,其坏处也是简单直接,因为缺乏背后原理的讲解,如果找不到现成的例子,或者找不到能在自己所使用语言中行得通的例子(要知道,一种语言下的正则表达式往往并不能直接套用到另一种语言中),则束手无策。 
在正式的出版领域,已经有《精通正则表达式》、《正则表达式必知必会》之类的书籍出版,尤其是前者,堪称关于正则表达式的经典著作,如果想认真学习正则表达式,这类书籍是必须阅读的。但这类书籍的弱点也很明显,即都是由英文版本翻译而来的,更多侧重英文文本的处理,身为中文世界的开发人员,我们经常需要处理中文文本—英文之外的字符。其实对于非英文字符的处理,正则表达式已经提供了足够丰富的功能,可惜资料相当匮乏。 
为解决这些问题,我花了很多时间研习各种资料,然后经常给人讲解正则表达式的相关知识。我发现,很多人并不是不努力学,实在是合适的资料太少了。所以,我斗胆写作这本书。 
相对于正则文档和速成教学帖子,本书深入讲解了匹配背后的原理,而且往往会举一反三,告诉读者,这里为何这样写,如果改成其他形式,会造成什么结构差异;同时集中讲解和比较了多种语言中正则表达式用法的异同,方便读者把现成的正则表达式“移植”到自己的工作环境中。 
相对于《精通正则表达式》等“正式”的书籍,本书辟出专门的章节讲解语言和编码,告诉读者如何设定编码,如何正确处理中文字符等。另外,本书还涵盖了.NET、Java、JavaScript、PHP、Python、Ruby、Objective-C、Golang等常用语言,为每种语言专门撰写相关内容,不但详细介绍了语言中正则表达式的用法,更辨析了版本之间的细微差异,既可以作为专门学习的教材,也可以成为有用的参考手册。 
本书结构 
本书分为三部分。 
第一部分主要讲解正则表达式的基础知识,覆盖常见正则表达式中的各种功能和结构。看完前3章,就可以基本弄明白现在流行的各种正则表达式;如果你之前有一些经验,会觉得阅读起来并不困难。但是我也希望读者不要忽略其他的内容,断言和匹配模式现在已经是正则表达式的“标准配置”了,而且确实可以派上大用场,所以第4章和第5章的内容,即便不是很熟悉,阅读起来可能有一些麻烦,但也不应该忽略。最后的第6章,则厘清了正则表达式在使用中的若干疑惑,了解它们,你就可以相对自如地穿行于正则表达式的世界了。 
第二部分主要讲解关于正则表达式的深层次知识,这一部分用3章的内容,详细探讨了编码问题、匹配原理、解题思路。这部分内容更抽象,需要多花一点时间来阅读和理解,但是它们确实可以帮你在正则表达式的世界里登堂入室,脱离“术”的层面,掌握万变不离其宗的“道”。 
第三部分的作用是接地气,将之前介绍的各种知识落实到常用语言.NET、Java、JavaScript、PHP、Python、Ruby、Objective-C、Golang中来。每一章的开头有正则功能列表,其中的功能对应着前面部分的讲解,这些功能的具体应用实例以及不同版本之间的差异,则在章节中详细讲解,每一章的最后还给出了常见任务的示例代码,方便日后查询。第18章简要介绍了正则表达式在Linux下常用工具vi、grep、awk、sed中的使用,并通过一个实际的例子将这几种工具串起来,对比说明了它们适合解决的问题。 
在本书的最后提供了用作参考的3个附录。 
附录A是正则表达式的常用功能在不同语言中的比对,希望能给需要在多种语言中使用正则表达式或者移植正则表达式的读者提供一份有用的参考;附录B给出了若干常见的正则表达式,比如匹配邮政编码、身份证号、手机号、QQ号、电子邮件地址等,希望能成为常见问题的“速查手册”;附录C列出了常用正则表达式的工具和资源,方便大家调试自己的正则表达式,以及继续深入学习。 
本书的读者对象 
本书适合以下几类读者: 
经常需要进行文本处理(比如日志分析或网络运维)的技术人员。这些读者或许已经熟悉了正则表达式的基本用法,但面对日益复杂化和海量的数据,阅读本书可以帮助大家更准确、更高效地处理文本,提升自己工作的价值。 
熟悉常用开发语言的程序员。虽然这些读者不需要专职进行文本处理,但源代码和许多数据其实也是文本,如果不会正则表达式,在偶然遇到处理源代码或文本数据的任务时,往往会产生无力感。本书的第三部分可以帮你快速找到有关的例子,并落实在自己的编程语言中。当然前两部分也非常有必要,因为它们可以帮你夯实基础。 
对正则表达式已经有一定了解的读者。这些读者虽然能用正则表达式解决常见的问题,但未必了解正则表达式的编码问题、匹配原理、解题思路,仔细阅读本书的第二部分,可以深入完善对正则表达式的理解;而第三部分详细比较了可以使用正则表达式的各种语言,以及同一种语言中各种版本的差异。所有这一切,应该可以让你对正则表达式的掌握更上一层楼。 
致谢 
一本书的完成,离不开众多人的帮忙。 
首先要感谢的是李笑来老师、周筠老师以及徐定翔和卢鸫翔两位编辑。在我翻译完《精通正则表达式》之后,李笑来老师三番五次地鼓励我写一本关于正则表达式的书,并且打消了我的很多顾虑;周筠老师、徐定翔和卢鸫翔两位编辑在我写作的最初阶段做了大量细致耐心的工作。可以说,没有他们,我就不会有写作这本书的念头,也不会有坚持完成的动力。 
然后要感谢的是电子工业出版社的杨福平副总编、张月萍编辑、张春雨编辑和刘舫编辑,没有他们的关照和辛勤工作,这本书的出版定然会遇到更多的困难。 
感谢我的朋友霍炬和韩磊,虽然我之前阅读过《精通正则表达式》,但与翻译和写作结缘,他们给了我莫大的帮助,于是今天才有了《正则指引》这本书。尤其值得一提的是,霍炬的夫人西乔,精心手绘了这本书的封面,我在这里要对她表示诚挚的谢意。 
感谢我曾工作过的盛大创新院以及创新院的各位同事(李骏、郝培强、庄表伟、丁宇、许式伟、莫华枫、李道兵、赵劼、樊一鹏、张一宁等),创新院给了大家宽松自由的工作环境,与各位同事的讨论加深了我对正则表达式的理解,也为我提供了许多例子。 
感谢张东亮、陆亦斌、孙勇、叶劲峰等各位朋友,愿意拨冗阅读本书的草稿,并提出了大量专业的意见。 
感谢何源、陈钢、贺钧、陈驰等读者,试读本书之后提出了大量的宝贵意见,在最后关头打消了我心中的许多忐忑。 
在更早之前,我的父母从小就鼓励我研究和了解各种科学原理(“玩也要动脑筋”),我之所以有兴趣探究正则表达式背后的世界,而不满足于“够用/凑合”,都是受益于这种思维行为习惯。在中小学阶段,我的语文老师罗碧玉、易玺铭培养了我对于文字的兴趣,在大学阶段,东北师范大学文学院的王确老师给了我这个理科生非常多的帮助和指引。对各位师长,在此一并表示感谢,能遇到你们是我的幸运。 
最后还需要感谢许多为这本书做出过贡献的人,你们的名字我可能暂时无法记起,或者无法一一罗列,但我会在心中保持对你们的感谢。


极客时间商城店铺主页二维码
极客时间商城
为极致和美好付费
扫描二维码,访问我们的微信店铺

正则指引(第2版)

手机启动微信
扫一扫购买

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏

微信支付

支付宝

扫一扫购买

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏