C++11标准 STL正则表达式 验证电子邮件地址

时间:2023-03-09 00:08:07
C++11标准 STL正则表达式 验证电子邮件地址

转自:http://www.cnblogs.com/yejianfei/archive/2012/10/07/2713715.html

我们最经常遇到的验证,就是电子邮件地址验证。网站上常见。各种网页脚本也都常用“正则表达式”(regular expression)对我们输入的电子邮件地址进行验证,判断是否合法。有的还能分解出用户名和域名。现在用C++语言实现一下电子邮件地址验证程序,用的是C++ 11标准新增加的STL正则表达式。

  源代码如下,该代码已在Visual Studio 2010上验证通过。g++ 4.6不支持C++ 11的STL正则表达式,g++ 4.6上编译可以通过,但运行时错误,抛出regex_error异常。因此,如果要在g++ 4.6上使用正则表达式,请用GNU正则表达式库或者用boost正则表达式库。

 /*
* regex.cpp - 用正则表达式验证电子邮件地址
*
* C++11标准 STL正则表达式
*
*
*
*
* 编译命令:
* cl regex.cpp /EHsc /link /out:regex.exe
*
*/ #include <iostream>
#include <cstdlib>
#include <string>
#include <regex> // regular expression 正则表达式 using namespace std; int main ( )
{
string email_address;
string user_name, domain_name; //regex pattern("([0-9A-Za-z\\-_\\.]+)@([0-9a-z]+\\.[a-z]{2,3}(\\.[a-z]{2})?)"); //这个不全
  regex pattern("([0-9A-Za-z\\-_\\.]+)@(([a-zA-Z0-9\\-])+\\.+[a-z]{2,3}(\\.[a-z]{2})?)"); //这个最全
// 正则表达式,匹配规则:
// 第1组(即用户名),匹配规则:0至9、A至Z、a至z、下划线、点、连字符之中
// 的任意字符,重复一遍或以上
// 中间,一个“@”符号
// 第二组(即域名),匹配规则:0至9或a至z之中的任意字符重复一遍或以上,
// 接着一个点,接着a至z之中的任意字符重复2至3遍(如com或cn等),
// 第二组内部的一组,一个点,接着a至z之中的任意字符重复2遍(如cn或fr等)
// 内部一整组重复零次或一次 // 输入文件结尾符(Windows用Ctrl+Z,UNIX用Ctrl+D)结束循环
while ( cin >> email_address )
{
if ( regex_match( email_address, pattern ) )
{
cout << "您输入的电子邮件地址合法" << endl; // 截取第一组
user_name = regex_replace( email_address, pattern, string("$1") ); // 截取第二组
domain_name = regex_replace( email_address, pattern, string("$2") ); cout << "用户名:" << user_name << endl;
cout << "域名:" << domain_name << endl;
cout << endl;
}
else
{
cout << "您输入的电子邮件地址不合法" << endl << endl;
}
}
return EXIT_SUCCESS;
}

2014-11-11补充 :

 string GetUrlDomainName(string url)
{
string user_name, domain_name,temp,com,cn;
const std::regex pattern("([0-9A-Za-z\\-_\\.]+)@(([a-zA-Z0-9\\-])+\\.+[a-z]{2,3}(\\.[a-z]{2})?)"); if ( std::regex_match(url.c_str(), pattern ))
{
// 截取第一组
user_name = regex_replace(url.c_str(), pattern, string("$1") ); // 截取第二组
domain_name = regex_replace(url.c_str(), pattern, string("$2") ); const std::regex subPattern("([a-zA-Z0-9\\-_]+)\\.([a-z]{2,3}(\\.[a-z]{2})?)");//这个正则对于.com和.com.cn都适合
//const std::regex subPattern("([a-zA-Z0-9\\-_]+)\\.([a-z]{2,3})\\.(([a-z]{2})?)");//这个正则只适合后面.com.cn
if (std::regex_match(domain_name,subPattern))
{
temp = regex_replace(domain_name,subPattern,string("$1"));//@和com之间
com = regex_replace(domain_name,subPattern,string("$2"));//得到com
cn = regex_replace(domain_name,subPattern,string("$3"));//得到cn
}
}
return temp;
}