Perl输出复杂数据结构:Data::Dumper,Data::Dump,Data::Printer

时间:2023-03-09 08:10:13
Perl输出复杂数据结构:Data::Dumper,Data::Dump,Data::Printer

输出复杂结构

Data::DumperData::DumpData::Printer都可以用来输出复杂的数据结构。本文只介绍简单的几个输出形式,以后再需要的地方再详细介绍。

前两者建议传递数据结构的引用给对应的函数、方法,当然直接传递非引用也不会错(标量、数组、哈希或引用都允许)。第三个Printer,则可以自动判断是否是引用。

例如,下面的数据结构,一个是复杂的hash,一个是相对简单的匿名数组引用,分别使用这3个模块来输出。

%Config = (
'auto_commit' => '0',
'build_dir' => '/home/fairy/.cpan/build',
'bzip2' => '/bin/bzip2',
'urllist' => [
'http://cpan.metacpan.org/',
\@my_urllist # 将数组my_urllist作为元素
],
'wget' => '/usr/bin/wget',
); @my_urllist=('http://mirrors.aliyun.com/CPAN/',
'https://mirrors.tuna.tsinghua.edu.cn/CPAN/',
'https://mirrors.163.com/cpan/',
\@more_urllist # 将数组more_urllist引用作为元素
); @more_urllist=qw(http://mirrors.shu.edu.cn/CPAN/
http://mirror.lzu.edu.cn/CPAN/
); $ref_arr=[qw(longshuai wugui fairy xiaofang)];

1.使用Data::Dumper的Dumper函数,期待的是引用

#!/usr/bin/perl
use Data::Dumper; print Dumper(\%Config,$abc);

输出结果:

$VAR1 = {
'wget' => '/usr/bin/wget',
'urllist' => [
'http://cpan.metacpan.org/',
[
'http://mirrors.aliyun.com/CPAN/',
'https://mirrors.tuna.tsinghua.edu.cn/CPAN/',
'https://mirrors.163.com/cpan/',
[
'http://mirrors.shu.edu.cn/CPAN/',
'http://mirror.lzu.edu.cn/CPAN/'
]
]
],
'bzip2' => '/bin/bzip2',
'auto_commit' => '0',
'build_dir' => '/home/fairy/.cpan/build'
}; $VAR2 = [
'longshuai',
'wugui',
'fairy',
'xiaofang'
];

注意,Dumper()将第一个引用赋值给$VAR1,第二个引用赋值给$VAR2。例如:

如果想要将默认的$VAR修改为自定义的变量名称,可以使用Data::Dumper->Dump方法。

2.使用Data::Dumper的Dump方法,期待两个数组引用,第二个数组引用用来定义现实的变量名,而不是默认的VAR

#!/usr/bin/perl
use Data::Dumper; print Data::Dumper->Dump([\%Config,$ref_arr],[qw(myvar myarr)]);

以下是输出结果:

$myvar = {
'wget' => '/usr/bin/wget',
'auto_commit' => '0',
'bzip2' => '/bin/bzip2',
'build_dir' => '/home/fairy/.cpan/build',
'urllist' => [
'http://cpan.metacpan.org/',
[
'http://mirrors.aliyun.com/CPAN/',
'https://mirrors.tuna.tsinghua.edu.cn/CPAN/',
'https://mirrors.163.com/cpan/',
[
'http://mirrors.shu.edu.cn/CPAN/',
'http://mirror.lzu.edu.cn/CPAN/'
]
]
]
};
$myarr = [
'longshuai',
'wugui',
'fairy',
'xiaofang'
];

注意上面用了两个数组引用,第一个数组引用是待输出的复杂数据结构,第二个数组引用是定义前一个数组引用的变量名称。

例如,下面的Dump方法,myvar定义\%Config的输出变量名称,myarr定义\@name1的输出变量名称,\@name2没有对应的变量名称,所以使用默认的$VAR3来输出。

print Data::Dumper->Dump([\%Config,\@name1,\@name2],[qw(myvar,myarr)]);

3.使用Data::Dump的dump方法,它输出时不会将输出结果赋值给标量变量,而是直接输出数据结构,有什么就输出什么

例如,输出数组引用:

#!/usr/bin/perl
use Data::Dump qw(dump); print dump($ref_arr);

输出结果:

["longshuai", "wugui", "fairy", "xiaofang"]

输出hash引用:print dump(\%Config);

{
auto_commit => 0,
build_dir => "/home/fairy/.cpan/build",
bzip2 => "/bin/bzip2",
urllist => [
"http://cpan.metacpan.org/",
[
"http://mirrors.aliyun.com/CPAN/",
"https://mirrors.tuna.tsinghua.edu.cn/CPAN/",
"https://mirrors.163.com/cpan/",
[
"http://mirrors.shu.edu.cn/CPAN/",
"http://mirror.lzu.edu.cn/CPAN/",
],
],
],
wget => "/usr/bin/wget",
}

输出hash引用和匿名数组结果:print dump(\%Config,$ref_arr);

(
{
auto_commit => 0,
build_dir => "/home/fairy/.cpan/build",
bzip2 => "/bin/bzip2",
urllist => [
"http://cpan.metacpan.org/",
[
"http://mirrors.aliyun.com/CPAN/",
"https://mirrors.tuna.tsinghua.edu.cn/CPAN/",
"https://mirrors.163.com/cpan/",
[
"http://mirrors.shu.edu.cn/CPAN/",
"http://mirror.lzu.edu.cn/CPAN/",
],
],
],
wget => "/usr/bin/wget",
},
["longshuai", "wugui", "fairy", "xiaofang"],
)

4.使用Data::Printerp函数,它会直接输出结果,无需额外的print或say

  • p函数可以直接传递数据对象
  • 如果传递的是引用,则必须是引用变量,而不能是反斜线开头的引用
  • p函数不能同时格式化输出两个对象

例如:

p(%Config)      # 正确
p($ref_Config) # 正确
p(\%Config) # 错误
p($ref_arr,$ref_Config) # 错误

首先安装这个模块:

shell> cpan -i Data::Printer

直接传递数据对象:

use Data::Printer;

p(%Config)

以下是输出:

{
auto_commit 0,
build_dir "/home/fairy/.cpan/build",
bzip2 "/bin/bzip2",
urllist [
[0] "http://cpan.metacpan.org/",
[1] [
[0] "http://mirrors.aliyun.com/CPAN/",
[1] "https://mirrors.tuna.tsinghua.edu.cn/CPAN/",
[2] "https://mirrors.163.com/cpan/",
[3] [
[0] "http://mirrors.shu.edu.cn/CPAN/",
[1] "http://mirror.lzu.edu.cn/CPAN/"
]
]
],
wget "/usr/bin/wget"
}

传递引用变量:

p($ref_arr);

以下是结果:

\ [
[0] "longshuai",
[1] "wugui",
[2] "fairy",
[3] "xiaofang"
]

让Dumper和eval结合

由于Data::Dumper以及Data::Dump的输出中会包含变量,所以如果将dump出的结果持久化保存到文本后,可以在读取时使用eval将其直接构建成新的数据结构。

例如:

print DATA Dumper(\%Config);

它将%Config的内容持久化到文件句柄DATA连接的文件中。当需要时,读取它并解除引用:

open DATA, "<$datafile" or die "$!";
{
local $/;
%new_Config = %{ eval <DATA> };
}

上面的eval使得perl去编译读取到的DATA,因为DATA是由Dumper出去的数据,它们都是变量开头的,所以eval <DATA>编译读取的内容后先进行赋值,然后返回赋值完成的类似$VAR1变量,由于这个标量变量是在解除引用的结构中,所以将新构建一个hash对象。

但是上面的语句还有点问题,因为有时候持久化的文件可能会是空的,这时就会报错eval那里就会报错。为了健壮性,不得不加入更多的逻辑判断。

比如,下面先将DATA的内容当作字符串赋值给变量变量$dumped_hash,然后判断这个变量。

open DATA, "<$datafile" or die "$!";
my $dumped_hash;
{
local $/;
$dumped_hash = <DATA>;
}
my %new_Config = %{ eval $dumped_hash } if $dumped_hash;

但是,以下是我见过最亮瞎狗眼的写法:

%new_Config = %{ +eval { <DATA> } };

用eval进行错误捕获,如果DATA不为空,则返回赋值后的变量$VAR1,前面加一个+得到+$VAR1,这个加号显式提示perl这是一个匿名hash,而不是一次性的语句块结构。然后解除引用。