golang正则之命名分组方式

正则中有分组这个功能，在golang中也可以使用命名分组。

一次匹配的情况

场景还原如下：

有一行文本，格式为：姓名年龄邮箱地址

请将其转换为一个map

代码实现如下：

				?

									str := `Alice 20 alice@gmail.com`

									// 使用命名分组，显得更清晰

									re := regexp.MustCompile(`(?P<name>[a-zA-Z]+)\s+(?P<age>\d+)\s+(?P<email>\w+@\w+(?:\.\w+)+)`)

									match := re.FindStringSubmatch(str)

									groupNames := re.SubexpNames()

									fmt.Printf("%v, %v, %d, %d\n", match, groupNames, len(match), len(groupNames))

									result := make(map[string]string)

									// 转换为map

									for i, name := range groupNames {

									    if i != 0 && name != "" { // 第一个分组为空（也就是整个匹配）

									        result[name] = match[i]

									    }

									}

									prettyResult, _ := json.MarshalIndent(result, "", "  ")

									fmt.Printf("%s\n", prettyResult)

输出为：

				?

									[Alice 20 alice@gmail.com Alice 20 alice@gmail.com], [ name age email], 4, 4

									{

									  "age": "20",

									  "email": "alice@gmail.com",

									  "name": "Alice"

									}

注意 [ name age email]有4个元素，第一个为""。

多次匹配的情况

接上面的例子，实现一个更贴近现实的需求：

有一个文件，内容大致如下：

				?

									Alice 20 alice@gmail.com

									Bob 25 bob@outlook.com

									gerrylon 26 gerrylon@github.com

									...

									更多内容

和上面一样，不过这次转出来是一个slice of map, 也就是多个map。

代码如下：

				?

									// 文件内容直接用字符串表示

									usersStr := `

									    Alice 20 alice@gmail.com

									    Bob 25 bob@outlook.com

									    gerrylon 26 gerrylon@github.com

									`

									userRe := regexp.MustCompile(`(?P<name>[a-zA-Z]+)\s+(?P<age>\d+)\s+(?P<email>\w+@\w+(?:\.\w+)+)`)

									// 这里要用FindAllStringSubmatch，找到所有的匹配

									users := userRe.FindAllStringSubmatch(usersStr, -1)

									groupNames := userRe.SubexpNames()

									var result []map[string]string // slice of map

									// 循环所有行

									for _, user := range users {

									    m := make(map[string]string)

									    // 对每一行生成一个map

									    for j, name := range groupNames {

									        if j != 0 && name != "" {

									            m[name] = strings.TrimSpace(user[j])

									        }

									    }

									    result = append(result, m)

									}

									prettyResult, _ := json.MarshalIndent(result, "", "  ")

									fmt.Println(string(prettyResult))

输出为：

				?

									[

									  {

									    "age": "20",

									    "email": "alice@gmail.com",

									    "name": "Alice"

									  },

									  {

									    "age": "25",

									    "email": "bob@outlook.com",

									    "name": "Bob"

									  },

									  {

									    "age": "26",

									    "email": "gerrylon@github.com",

									    "name": "gerrylon"

									  }

									]

总结

使用命名分组可以使正则表示的意义更清晰。

转换为map更加符合人类的阅读习惯，不过比一般的根据索引取分组值麻烦一些。

补充：golang 正则分组匹配多个值

看代码吧~

				?

									import (

									   "encoding/json"

									   "fmt"

									   "regexp"

									)

				?

									str := `9x_xx:995:88`  // `9x_xx:995`

									// 使用命名分组，一次匹配多个值

									re := regexp.MustCompile(`(?P<fname>\w+):+(?P<mod>[1-9]*):*(?P<strlen>[0-9]*)`)

									match := re.FindStringSubmatch(str)

									groupNames := re.SubexpNames()

									fmt.Printf("%v, %v, %d, %d\n", match, groupNames, len(match), len(groupNames))

									result := make(map[string]string)

									if len(match) == len(groupNames) {

									   // 转换为map

									   for i, name := range groupNames {

									      if i != 0 && name != "" { // 第一个分组为空（也就是整个匹配）

									         result[name] = match[i]

									      }

									   }

									}

				?

									prettyResult, _ := json.MarshalIndent(result, "", "  ") 

									fmt.Printf("%s\n", prettyResult)

PS：服务器之家推荐两款在线的正则表达式工具。

正则表达式在线测试工具

正则表达式生成器

以上为个人经验，希望能给大家一个参考，也希望大家多多支持服务器之家。如有错误或未考虑完全的地方，望不吝赐教。

原文链接：https://gerrylon.blog.****.net/article/details/82532970

秒客网

golang正则之命名分组方式

一次匹配的情况

多次匹配的情况

总结

看代码吧~

相关文章