正则表达式初探之正则匹配的魅力

时间:2022-09-19 09:15:41

正则表达式初探之正则匹配的魅力

大家好,我是TianTian。

今天要分享的内容是正则表达式Regex

某天中午正要拿起手机打把王者荣耀,突然微信来了条消息!

某位网友来电,问我能不能帮忙看个字符串匹配的问题。

我硬着头皮答应了,可是,我看到题目的时候。

正则表达式初探之正则匹配的魅力

题目大概需要匹配检索的是:

  • =A12/B14/D14..../H18
  • =C12 * D12 * H16...*F19

嗯,我翻开了我多年没有碰的正则手册。

初探Regex

 

首先,先简单介绍一下:

  • 正则表达式(也称为regex或regexp)只是一种模式,可用于匹配字符的不同且通常是特定的组合。

我们可以使用这些模式来检查和处理字符串,如何检索呢,我们得知道如何构造,创建正则表达式可能看起来像这样:

  1. let dog; 
  2. rat = /dog/; 
  3. rat = new RegExp("dog"); 

有了表达式,那么我们如何匹配呢,当然正则表达式有自己的可用方法,也可以在某些字符串方法中使用它们。

例如,.test是可用于正则表达式的方法。它返回是否在字符串中找到正则表达式的布尔值:

  1. let rat = /dog/; 
  2. rat.test('I saw a dog!');  // returns true 
  3. /rat/.test('I saw a dog!');  // returns true 

上面两种调用.test的方式是等效的:也就是说,可以使用分配给regexp的变量或直接使用regexp来调用它。对于正则表达式的任何使用都是如此。重要的是要注意,正则表达式匹配必须精确,包括任何换行符,大写字母和空白。例如:

  1. /dog/.test('I saw some dogs!');  // returns true 
  2. /dog/.test('Meet at the bad og 9');  // returns false 
  3. /dog/.test('Rats and doihs are not friends');  // returns false 

看到这里,肯定不理解,为什么要使用它吧,不急,往下看。

特殊字符

 

特殊字符是用于修改或指定正则表达式的字符组合的字符。最有用的特殊字符之一是方括号。方括号允许您表示目标字符串中的字符可以是任意数量的字符!让我们看看它们的作用:

  1. const bt = /b[aeiou]t/; 
  2. bt.test('bat');  // returns true 
  3. bt.test('bet');  // returns true 
  4. bt.test('bit');  // returns true 
  5. bt.test('bot');  // returns true 
  6. bt.test('but');  // returns true 
  7. bt.test('bpt');  // returns false 

想想看,括号里的一切都对应于你要搜索的字符串中的一个字符。在这个有用的能力之上,我们可以使用"-"字符来指定一个特定的字符范围!

  1. const nums = /[0-5]/; 
  2. nums.test('0');  //  returns true 
  3. nums.test('3');  //  returns true 
  4. nums.test('7');  //  returns false 

再者,比如,要指定所有的字母,你会做这样的事情:

  1. const letters = /[A-Za-z]/; 
  2. letters.test('M');  // returns true 
  3. letters.test('y');  // returns true 
  4. letters.test('5');  // returns false 

另一个需要记住的特殊字符是 "+"字符。这表明一个特定的元素可以重复任何次数。让我们看看它的作用。

  1. const bomb = /boo+m/;   
  2. bomb.test('boom!');  // returns true 
  3. bomb.test('Boom!');  // returns false 
  4. bomb.test('boooooooooooom!');  // returns true 

如果你想忽略大小写怎么办,可以在后面加个i。

  1. const bomb = /boo+m/i;   
  2. bomb.test('boom!');  // returns true 
  3. bomb.test('Boom!');  // returns true 
  4. bomb.test('boooooooooooom!');  // returns true 
  5. bomb.test('BOOOOOOOOOOOOM!');  // returns true 

比如我们常见的"?"字符也是一个有用的特殊字符。这个字符表示前面的字符可以包括也可以不包括。

  1. const color = /colou?r/;  
  2. color.test('color');  // returns true 
  3. color.test('colour');  // returns true 

你可能还需要关注的特殊字符是". "字符。这是个通配符。一个". "可以代表任何其他字符,不包括换行。

  1. const anything = /./;  
  2. anything.test('a');  // returns true 
  3. anything.test('1');  // returns true 
  4. anything.test('[');  // returns true 

嗯,先提这么几个基础的,我们再来看看其他的语法。

其他语法

 

\w "字符指的是任何字母数字字符。它的反义词,"\W",指任何非字母数字字符。

  1. const alphaNumber = /\w/;   
  2. alphaNumber.test('a');  // returns true 
  3. alphaNumber.test('1');  // returns true 
  4. alphaNumber.test('&');  // returns false 
  5.  
  6. const notAlphaNumber = /\W/;  
  7. notAlphaNumber.test('a');  // returns false 
  8. notAlphaNumber.test('1');  // returns false 
  9. notAlphaNumber.test('&');  // returns true 

再介绍一个,"\s "字符指的是任何空白字符,而"\S "字符指的是任何非空白字符。

  1. const whitespace = /\s/;   
  2. whitespace.test('a');  // returns false 
  3. whitespace.test('1');  // returns false 
  4. whitespace.test('&');  // returns false 
  5. whitespace.test(' ');  // returns true 
  6. whitespace.test('\n');  // returns true 
  7.  
  8. const notWhitespace = /\S/;  
  9. notWhitespace.test('a');  // returns true 
  10. notWhitespace.test('1');  // returns true 
  11. notWhitespace.test('&');  // returns true 
  12. notWhitespace.test(' ');  // returns false 
  13. notWhitespace.test('\n');  // returns false 

嗯,不能全部介绍完滴,还得自己查,那么有没有总结性的图呢,这个时候,当然有。

一图解千愁

 

正则表达式初探之正则匹配的魅力

手册

这是一个第三方网站,推荐结合这个,右边的语法参考,基本上是上面的内容。

  • https://c.runoob.com/front-end/854

左边调试,中间是语法参考,右侧是控制台,岂不美哉。

解题

 

匹配的格式是=A12/B12/C12.../K23中间是乘法也行。

想了很久,首先,我们是不是可以拆成三部分呢,一头一尾和中间部分。

开头,我们是不是可以这么匹配:

  1. reg = /^=[A-Z]+\d+/i; 

首先的是=开头,然后是字母,接着是数字,考虑到可能是一个或者是多个,得用“+”特殊字符。

然后我们看看预期:

  1. reg.test('=b12')  // true 
  2. reg.test('=C12') //  true 
  3. reg.test('=CC3') // true 
  4. reg.test('=CDdd35') //  true 
  5. reg.test('=CDdd 35')  // false 

嗯,我们在来看看,尾巴部分怎么写:

  1. // 尾巴部分,应该都是 /CC12, /B234,这样子滴 
  2. reg = /(\/|\*)[A-Z]+\d+$/i 

首先,考虑到可能是乘法和除法,于是有这样子的**(/|*)**,需要注意的是,需要转义一下,然后以$结尾。

  1. reg.test('/cc')  // false 
  2. reg.test('/cc12') // true 

剩下的就是中间的部分了,也就是剩下多个形如: /B231这样子的结构,于是:

  1. reg = /((\/|\*)[A-Z]+\d+$)*/i 

最后组合一下,就是这样子的:

  1. const multiplicationAndDivisionReg = /^=[A-Z]+\d+((\/|\*)[A-Z]+\d*$)*(\/|\*)[A-Z]+\d+$/i; 

简单入门后,留一个思考题,之前面试看过一个有趣的题目,数字千分位。

  • '100000000.00'
  • // 输出 '100,000,000.00'

赶紧来实战一下吧。

最后

今天的分享,简单的介绍了如何入门正则表达式Regex,赶紧动手学起来吧。

原文地址:https://mp.weixin.qq.com/s/sQmzdP6Vcw5EW5nM6yzdaQ