快速业务通道

浅谈Java中正则表达式的优化方法 - 编程入门网

作者 佚名技术 来源 NET编程 浏览 发布时间 2012-06-17

浅谈Java中正则表达式的优化方法

时间:2011-04-05 jisuanji009

获取每次使用引起小损失的分组。如果你实际并不需要获取一个分组内的文本,那么 就使用非捕获分组。例如使用“(?:X)”代替“(X)”。

让引擎完成优化(Let the engine do the work for you)

如上面我所提到的,java.util.regex包可以编JAVA译正则表达式时对其优化。例如, 正则表达式中包含了一个必须在输入字符串中出现的字符串(或者整个表达式都不匹配) ,引擎有时会首先搜索该字符串,如果没有找到匹配就会报告失败,不再检查整个正则表 达式。

另外非常有用地自动优化正则表达式的方式让引擎根据正则表达式中的期望长度检查 输入字符串的长度。例如,表达式“\d{100}”是内在优化的,以致于如果输入 字符串不是JAVA100个字符,引擎就会报告失败,而不再考察整个正则表达式。

无论何时编写复杂的正则表达式时,尝试找出一种编写方式使引擎可以识别和优化这 些特殊情况。例如,不要在分组或选择中隐藏命令字符串,因为引擎不会识别它们。若有 可能,指定你想要匹JAVA配的输入字符串的长度也是相当有用的,如上例所示。

优化贪婪模式和勉强模式(Optimizing greedy and reluctant quantifiers)

你已经有了如何优化正则表达式的基本概念,其中一些方式可以JAVA让引擎来完成优 化。现在我们讨论优化贪婪模式和勉强模式。贪婪模式量词如“*”或 “+”,会首先从输入字符串中尝试匹配尽可能多的字符,即使这意味着字符 串中的剩下的内容已经不足以匹配正则表达式的其余部分。如果是这样,贪婪模式量词就 会回缩,返回字符,知道可以完全匹配或者没有字符了。勉强(或者lazy)模式,另一方 面,会首先尝试匹配输入字符串中尽可能少的字符。

凌众科技专业提供服务器租用、服务器托管、企业邮局、虚拟主机等服务,公司网站:http://www.lingzhong.cn 为了给广大客户了解更多的技术信息,本技术文章收集来源于网络,凌众科技尊重文章作者的版权,如果有涉及你的版权有必要删除你的文章,请和我们联系。以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!

分享到: 更多

Copyright ©1999-2011 厦门凌众科技有限公司 厦门优通互联科技开发有限公司 All rights reserved

地址(ADD):厦门软件园二期望海路63号701E(东南融通旁) 邮编(ZIP):361008

电话:0592-5908028 传真:0592-5908039 咨询信箱:web@lingzhong.cn 咨询OICQ:173723134

《中华人民共和国增值电信业务经营许可证》闽B2-20100024  ICP备案:闽ICP备05037997号