Perl初学笔记

Perl初学笔记

标量数据

标量：数字和字符串。

数字：Perl不存在整形，全部是double类型。整形常量会被自动转换为浮点型。

Perl数字字面量(直接量)：+-和小数点是非必须的，e代表10的多少次方。例如：-1.2e15，12_999.。2进制已0b开头，8进制已0开头，十六进制已0x开头，非十进制的字面量超过4个字符可以使用_区分，例如：0x1377_67

Perl支持字符串使用Unicode，但是必须使用use utf-8并且文件保存为UTF-8的格式。

字符串字面量可以支持’’和””两种方式，’\n’不表示换行，表示两个字符\和n；”\n”表示换行。双引号内的（\特殊字符，例如：\n、\r等）表示换行、回车。

Perl初学笔记

变量的定义：$加上变量名称，例如：$test=”hello world”。如果变量未被赋值，则使用空字符代替。未进行赋值的变量默认值为undef。如果变量未赋值就直接使用，数字类型为0，字符串类型为’’，例如：$sum+=3;$str.=”test”。

字符串中使用变量的两种方式：

双引号：print “Saying $test”。
单引号：print ‘Saying’.$test。
避免误解：print “Saying ${test}s“。//避免变量名称无法识别
字符串可以是用qq (hello,world)、q(hello,world)表示，qq代表字符串双引号，q代表单引号。()可以改为<>、//、{}等，qq <hellow,world>

操作符优先级：

Perl初学笔记

比较操作符：

Perl初学笔记

Perl布尔判断规则：

1. 如果是数字类型，0为假，其他都为真。
2. 如果是字符串类型，’’为假，其他都为真。
3. 如果不是字符串或者数字，先转换为数字或者字符串再判断。
4. 特殊规则：’0’与0是同一个标量值，因此也为假。
5. 特殊规则：undef表示假，所有的引用表示为真。

Perl输入信息：由于<STDIN>返回行中会带有’\n’，可以使用chomp()删除掉’\n’,例如：chomp($line=chomp(<STDIN>))

$line=<STDIN>；//标准输入

If($line eq“\n”){

print …

}else{

print …

}

Perl使用规则：如果去掉括号不影响语义，可以不使用()，例如：chomp <STDIN>。

Perl的函数：

1. chomp:去除行末尾的’\n’，返回实际删除的字符数
2. defined：用于判断字符串是否为undef，使用defined($line)，如果是undef返回假，否则返回真。

$line=<STDIN>

If(defined($line)){

print‘$line’ .”不是undef”

}else{

print “\$line 是undef”

}

列表与数组

Perl列表：列表存储的是标量有序集合。例如：（1，2,3）、（1..100）、（$test,$test1,$test2）。

Perl数组：存储的是列表的变量的集合。数组最大索引值$#变量名称。也可以采用负值来表示：-1代表最后一个，-2代表倒数第二个，依次类推。

qw()表示为其添加单引号，因此字符串\n等会被转换为字符：qw可以省略字符串的引号，例如：(“test”,”test1”)，可以使用qw(test test1)简写。可以不采用括号作为界定符，例如：qw ! test test1 !，qw #test test1 #等。

列表赋值：($test,$test1,$test2)=(“test”,”test1”,”test2”)。

Perl初学笔记

@数组名称，就可以引用整个数组。

Perl初学笔记

数组操作方法：pop和push，pop取出数组最后一个值，push在末尾追加一个元素。例如：pop @arr取出数组最后一个值并返回，push(@arr,0)向数组末尾追加0。

Perl初学笔记

Shift和unshift，与pop和push类似，操作数组的起始元素。

Perl初学笔记

splice操作数组任意位置。

Perl初学笔记

foreach用法:foreach变量名称 (列表或者数组){

doSomething....

}

#! /usr/bin/perl

#$var 是数组元素的本身，如果修改变量也就是修改元素本身

foreach $var (qw /test test1 test2/){

print $var ."\n";

}

#如果没有使用变量，则默认使用$_

foreach (1..100){

print $_ ."\n";

}

reverse：数组顺序反序。

sort：数组排序，如果是数字排序得不到有序的结果

each: 获取数组中的索引下标和值。类似key/value

子程序

Perl子程序：sub 子程序名称 { }，子程序可以放在任意位置，并且是全局的，如果存在同名的子程序，则第一个会被覆盖。

sub subName{

$n+=1;//全局变量

Print $n;//返回值为1，表示执行成功

}

&subName;//调用子程序

sub sum{

$n+=1;//最后一个运算结果作为返回值

}

#数组变量,参数会被存放在@_数组中，在程序执行时有效

sub max{

if($_[0]>$_[1]){

$_[0];

}else{

$[1];

}

#使用my创建私有变量

Sub max{

my($m,$n);#定义私有变量

($m,$n)=@_;#将值赋值给变量

#my($m,$n)=@_;

If($m>$n){$m}else{$n}

}

Sub max{

If(@_ !=2)#获取参数数组的长度

}

Sub max{

state $line=0;#持久化变量，可以重复使用

$line+=1;

}

use strict：强制使用严格的、良好的编程风格，会给出提示

调用子程序的三种情况：

1. 调用子程序并且传递参数：test（@lines）这种情况可以省略与符号。
2. 子程序在调用之前定义：sub test{ … }，可以直接调用：test 222 ,333 ;可以省略与符号。
3. 如果子程序与内置函数同名，必须通过&符号说明调用的不是内置的函数。

Perl的state定义持久化变量

Perl初学笔记

哈希

哈希的值可以是字符串、数字和undef，但是键必须为字符串。$hashName{key}。hash命名不能以数字开头，可以有字母、下划线、数字。

#! /usr/bin/perl

$family_name{"fred"}="li";

$family_name{"frid"}="luo";

foreach my $person (qw <fred frid> ){

print "$person family_name $family_name{$person} .\n";

}

指向整个hash可以使用%hashname。hash可以与列表互换

%hashTest=（"test1",21,"test2",1212,333,"test2","tes"）;

@arr_hash=%hashTest;

my %hashReverse =reverse %hashTest;#获得反转的hash

获取key和value列表

@keyArr=key s %hashTest

@valueArr=values %hashTest

#each函数获取hash的键值对

while(($key,$value)=each %hashTest){#判断列表中获取到元素个数判断布尔

print $key;

print $value;

}

#hash排序

foreach my $key (sort $key %hashTest){

$value=$hashTest{$key};

print $value;

}

#exists判断hash是否存在该key

If(exists $hashTest{key}){

...

}

#delete从hash中删除指定的key及对应的value

delete $hashTest{key};

#%ENV获取环境变量

print $ENV(PATH);获取环境设置的PATH

正则表达式

类型	表达式	说明	例子
Unicode属性	/ab/	匹配ab的字符串
	/\p{Space}/	判断Unicode属于空白字符(p代表包含)
	/\p{Digit}/	判读Unicode属于数字字符
	/\p{Hex}/	判断Unicode属于十六进制字符
	/\P{Space}/	判断Unicode属于非空白字符(P代表不包含)
元字符	.	匹配任意一个字符，除"\n"	/by.e/匹配byte、byxe等
量词	*	匹配0~n次字符	*/by\t/匹配by\t\t\t**等
	.*	匹配0~n次字符，除了\t	*/by.x/匹配byx、byxxx**等
	+	匹配1~n次
	?	匹配1次或者0次	/ba_?ba/匹配ba_ba或者baba
模式分组	()	字符串分组	/(red)+/匹配red 1~n次
	/(.)\1/	反向匹配组	abba匹配bb
	/(.)\g{1}/	反向匹配组
	\|	或	/frd(\|\t)+bra/匹配出现一次\t、空格或者两者混合的字符串，并且重复1~n次
	[]	匹配字符集出现的任一字符
	\d	匹配数字[0-9]
	/a	/a放在末尾，表示按ASCII字符语义解释	/\d+/a
	\s	匹配任意空白字符与/\p{Space}/类似，[\f\t\n\r]
	\w	[a-zA-Z0-9]
	^	代表非	[^\d]非数字
	\D	非数字
	\S	非空白
	\W	非字符

模式匹配

表达式	说明	例子
/i	匹配大小写无关	/yes/i 匹配yes或者YES
/s	匹配任意字符
/x	在匹配表达式中加入空格
\A	锚位字符串绝对开头	m{\Ahttps?://}i判断是否以https开头
\z	锚尾	m{\.png\z}i
\Z	锚尾，允许后面出现换行符
\m	代表字符串出现在行末，而不是结尾	/test/m匹配$_="this is test is \m test!"

其他控制结构

1、unless(condition)当条件为假的时候执行，与if(condition)相反。

unless(0){

...

}

unless($key){

...

}else{

...#条件为真的执行

}

2、until与while表达式相反，循环会一直执行，知道循环为真退出

until($j>$i){

$j*=2;

}

3、表达式修饰符

if块简写	print "hello world " if $n<2;	if($n<2){ print "hello world " }
unless
while
until
foreach

4、for

for($i=1;$i<=10;$i++){

...

}

5、退出循环控制:只对循环控制最内层有效(last、next、redo)，

last
next
redo
label

#获取指定目录下的文件名，并且开头不是 .

my $dir_to_process = '/home/lincc/perlTrain/script';

opendir my $dh, $dir_to_process or die "Cannot open $dir_to_process: $!";

foreach $file ( grep { -f "/$dir_to_process/$_" and $_=~/^(?!\.)/m } readdir $dh) {

print "one file in $dir_to_process is $file\n";

}

closedir $dh;

标量数据

列表与数组

子程序

哈希

正则表达式

其他控制结构

相关文章