Perl初学笔记

时间:2023-03-09 19:43:52
Perl初学笔记

Perl初学笔记

标量数据

标量:数字和字符串。

数字:Perl不存在整形,全部是double类型。整形常量会被自动转换为浮点型。

Perl数字字面量(直接量):+-和小数点是非必须的,e代表10的多少次方。例如:-1.2e15,12_999.。2进制已0b开头,8进制已0开头,十六进制已0x开头,非十进制的字面量超过4个字符可以使用_区分,例如:0x1377_67

Perl支持字符串使用Unicode,但是必须使用use utf-8并且文件保存为UTF-8的格式。

字符串字面量可以支持’’和””两种方式,’\n’不表示换行,表示两个字符\和n;”\n”表示换行。双引号内的(\特殊字符,例如:\n、\r等)表示换行、回车。

Perl初学笔记

Perl初学笔记

变量的定义:$加上变量名称,例如:$test=”hello world”。如果变量未被赋值,则使用空字符代替。未进行赋值的变量默认值为undef。如果变量未赋值就直接使用,数字类型为0,字符串类型为’’,例如:$sum+=3;$str.=”test”。

字符串中使用变量的两种方式:

  1. 双引号:print “Saying $test”。
  2. 单引号:print ‘Saying’.$test。
  3. 避免误解:print “Saying ${test}s“。//避免变量名称无法识别
  4. 字符串可以是用qq (hello,world)、q(hello,world)表示,qq代表字符串双引号,q代表单引号。()可以改为<>、//、{}等,qq <hellow,world>

操作符优先级:

Perl初学笔记

Perl初学笔记

比较操作符:

Perl初学笔记

Perl布尔判断规则:

  1. 1.       如果是数字类型,0为假,其他都为真。
  2. 2.       如果是字符串类型,’’为假,其他都为真。
  3. 3.       如果不是字符串或者数字,先转换为数字或者字符串再判断。
  4. 4.       特殊规则:’0’与0是同一个标量值,因此也为假。
  5. 5.       特殊规则:undef表示假,所有的引用表示为真。

Perl输入信息:由于<STDIN>返回行中会带有’\n’,可以使用chomp()删除掉’\n’,例如:chomp($line=chomp(<STDIN>))

$line=<STDIN>;//标准输入

If($line eq“\n”){

   print …

}else{

print …

}

Perl使用规则:如果去掉括号不影响语义,可以不使用(),例如:chomp <STDIN>

Perl的函数:

  1. 1.       chomp:去除行末尾的’\n’,返回实际删除的字符数
  2. 2.       defined:用于判断字符串是否为undef,使用defined($line),如果是undef返回假,否则返回真。

$line=<STDIN>

If(defined($line)){

print‘$line’ .”不是undef”

}else{

  print “\$line 是undef”

}

列表与数组

Perl列表:列表存储的是标量有序集合。例如:(1,2,3)、(1..100)、($test,$test1,$test2)。

Perl数组:存储的是列表的变量的集合。数组最大索引值$#变量名称。也可以采用负值来表示:-1代表最后一个,-2代表倒数第二个,依次类推。

qw()表示为其添加单引号,因此字符串\n等会被转换为字符:qw可以省略字符串的引号,例如:(“test”,”test1”),可以使用qw(test  test1)简写。可以不采用括号作为界定符,例如:qw ! test test1 !,qw #test test1 #等。

列表赋值:($test,$test1,$test2)=(“test”,”test1”,”test2”)

Perl初学笔记

@数组名称,就可以引用整个数组。

Perl初学笔记

数组操作方法:pop和push,pop取出数组最后一个值,push在末尾追加一个元素。例如:pop @arr取出数组最后一个值并返回,push(@arr,0)向数组末尾追加0

Perl初学笔记

Shift和unshift,与pop和push类似,操作数组的起始元素。

Perl初学笔记

Perl初学笔记

splice操作数组任意位置。

Perl初学笔记

 

foreach用法:foreach变量名称 (列表或者数组){

doSomething....

}

#! /usr/bin/perl

#$var 是数组元素的本身,如果修改变量也就是修改元素本身

foreach $var (qw /test test1 test2/){

print $var ."\n";

}

#如果没有使用变量,则默认使用$_

foreach (1..100){

print $_ ."\n";

}

reverse:数组顺序反序。

sort:数组排序,如果是数字排序得不到有序的结果

each: 获取数组中的索引下标和值。类似key/value

子程序

Perl子程序:sub 子程序名称 { },子程序可以放在任意位置,并且是全局的,如果存在同名的子程序,则第一个会被覆盖。

sub subName{

$n+=1;//全局变量

Print $n;//返回值为1,表示执行成功

}

&subName;//调用子程序

sub sum{

$n+=1;//最后一个运算结果作为返回值

}

#数组变量,参数会被存放在@_数组中,在程序执行时有效

sub max{

if($_[0]>$_[1]){

$_[0];

}else{

$[1];

}

}

#使用my创建私有变量

Sub max{

my($m,$n);#定义私有变量

($m,$n)=@_;#将值赋值给变量

#my($m,$n)=@_;

If($m>$n){$m}else{$n}

}

Sub max{

If(@_ !=2)#获取参数数组的长度

}

Sub max{

state $line=0;#持久化变量,可以重复使用

$line+=1;

}

use strict:强制使用严格的、良好的编程风格,会给出提示

 

 

 

 

调用子程序的三种情况:

  1. 1.       调用子程序并且传递参数:test(@lines)这种情况可以省略与符号。
  2. 2.       子程序在调用之前定义:sub test{ … },可以直接调用:test   222 ,333 ;可以省略与符号。
  3. 3.       如果子程序与内置函数同名,必须通过&符号说明调用的不是内置的函数。

Perl的state定义持久化变量

Perl初学笔记

Perl初学笔记

Perl初学笔记

哈希

哈希的值可以是字符串、数字和undef,但是键必须为字符串。$hashName{key}。hash命名不能以数字开头,可以有字母、下划线、数字。

#! /usr/bin/perl

$family_name{"fred"}="li";

$family_name{"frid"}="luo";

foreach my $person (qw <fred frid> ){

    print "$person family_name $family_name{$person} .\n";

}

指向整个hash可以使用%hashname。hash可以与列表互换

%hashTest=("test1",21,"test2",1212,333,"test2","tes");

@arr_hash=%hashTest;

my %hashReverse =reverse  %hashTest;#获得反转的hash

获取key和value列表

@keyArr=key s %hashTest

@valueArr=values %hashTest

#each函数获取hash的键值对

while(($key,$value)=each %hashTest){#判断列表中获取到元素个数判断布尔

   print $key;

   print $value;

}

#hash排序

foreach my $key (sort $key %hashTest){

   $value=$hashTest{$key};

   print $value;

}

#exists判断hash是否存在该key

If(exists $hashTest{key}){

   ...

}

#delete从hash中删除指定的key及对应的value

delete $hashTest{key};

#%ENV获取环境变量

print $ENV(PATH);获取环境设置的PATH

正则表达式

类型

表达式

说明

例子

Unicode属性

/ab/

匹配ab的字符串

 

/\p{Space}/

判断Unicode属于空白字符(p代表包含)

 

/\p{Digit}/

判读Unicode属于数字字符

 

/\p{Hex}/

判断Unicode属于十六进制字符

 

/\P{Space}/

判断Unicode属于非空白字符(P代表不包含)

 

元字符

.

匹配任意一个字符,除"\n"

/by.e/匹配byte、byxe

量词

*

匹配0~n次字符

/by\t*/匹配by\t\t\t

.*

匹配0~n次字符,除了\t

/by.*x/匹配byx、byxxx

+

匹配1~n

 

?

匹配1次或者0

/ba_?ba/匹配ba_ba或者baba

模式分组

()

字符串分组

/(red)+/匹配red 1~n

 

/(.)\1/

反向匹配组

abba匹配bb

 

/(.)\g{1}/

反向匹配组

 

 

|

/frd(|\t)+bra/匹配出现一次\t、空格或者两者混合的字符串,并且重复1~n

 

[]

匹配字符集出现的任一字符

 

 

\d

匹配数字[0-9]

 

 

/a

/a放在末尾,表示按ASCII字符语义解释

/\d+/a

 

\s

匹配任意空白字符与/\p{Space}/类似,[\f\t\n\r]

 

 

\w

[a-zA-Z0-9]

 

 

^

代表非

[^\d]非数字

 

\D

非数字

 

 

\S

非空白

 

 

\W

非字符

 

 

模式匹配

表达式

说明

例子

/i

匹配大小写无关

/yes/i 匹配yes或者YES

/s

匹配任意字符

 

/x

在匹配表达式中加入空格

 

\A

锚位字符串绝对开头

m{\Ahttps?://}i判断是否以https开头

\z

锚尾

m{\.png\z}i

\Z

锚尾,允许后面出现换行符

 

\m

代表字符串出现在行末,而不是结尾

/test/m匹配$_="this is test

               is \m test!"

 

其他控制结构

1、unless(condition)当条件为假的时候执行,与if(condition)相反。

unless(0){

   ...

}

unless($key){

   ...

}else{

   ...#条件为真的执行

}

2、until与while表达式相反,循环会一直执行,知道循环为真退出

until($j>$i){

   $j*=2;

}

3、表达式修饰符

if块简写

print "hello world " if $n<2;

if($n<2){

print "hello world "

}

unless

 

 

while

 

 

until

 

 

foreach

 

 

4、for

for($i=1;$i<=10;$i++){

  ...

}

5、退出循环控制:只对循环控制最内层有效(last、next、redo)

last

 Perl初学笔记

next

 Perl初学笔记

redo

 Perl初学笔记

label

 Perl初学笔记

 

#获取指定目录下的文件名,并且开头不是 .

my $dir_to_process = '/home/lincc/perlTrain/script';

opendir my $dh, $dir_to_process or die "Cannot open $dir_to_process: $!";

foreach $file ( grep { -f "/$dir_to_process/$_" and $_=~/^(?!\.)/m } readdir $dh) {

print "one file in $dir_to_process is $file\n";

}

closedir $dh;