Linux下自带的regex

时间:2023-03-09 13:39:32
Linux下自带的regex

Linux下可直接用regex.h来支持正则表达式。

Android同样也有该头文件,可认为Android也是支持的。

#include <sys/types.h>
#include <regex.h>

int regcomp(regex_t *preg, const char *regex, int cflags);

int regexec(const regex_t *preg, const char *string, size_t nmatch, regmatch_t pmatch[], int eflags);

size_t regerror(int errcode, const regex_t *preg, char *errbuf, size_t errbuf_size);

void regfree(regex_t *preg);

rm_so为匹配字符串起始偏移(start offset),rm_eo为匹配字符串的终止偏移(end offset)。

typedef struct {
regoff_t rm_so;
regoff_t rm_eo;
} regmatch_t;

 #include <stdio.h>
#include <regex.h>
#include <string.h> int main(void)
{
const char *str = "aabbccdd.com";
const char *pattern = "^(.+)\\.com$";
regex_t reg;
regmatch_t match[]; int ret = ;
ret = regcomp(&reg, pattern, REG_EXTENDED | REG_NEWLINE);
if(ret != )
printf("error\n");
else
{
ret = regexec(&reg, str, , match, );
if(ret != REG_NOMATCH)
{
int len = match[].rm_eo - match[].rm_so;
char buf[] = {};
memcpy(buf, str + match[].rm_so, len);
printf("final buf %s\n", buf);
}
}
regfree(&reg);
return ;
}

regmatch_t数组用来存储匹配的结果,该参数为数组的原因实际上是为了匹配group,其规则和Java等实现一致,若匹配成功,数组的[0]为整个匹配串,即group(0),其他为各个匹配到的组。

man regex