python文件操作+字符串操作 总结(学习记录)

时间:2023-01-04 10:26:02

python  菜鸟 写代码的时候总是需要各种google 查一些python常用函数!!今天下定决心自己总结一份,,方便自己,幸福大家,且看且珍惜!!!!!!!

Python 文件操作函数   总结python中对文件、文件夹(文件操作函数)的操作需要涉及到os模块和shutil模块

一、其中OS模块主要有以下方法:

1、得到当前工作目录,即当前Python脚本工作的目录路径os.getcwd()——返回值就是当前工作目录

<span style="font-size:14px;"><span style="font-size:14px;">sil4@debian:~$ python
Python 2.6.6 (r266:84292, Dec 27 2010, 00:02:40) 
[GCC 4.4.5] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import os
>>> os.getcwd()
'/home/sil4'
>>> current_path = os.getcwd()
>>> current_path
'/home/sil4'
>>> 
</span></span>

2、 返回指定目录下的所有文件和目录名:os.listdir(pathname) ——返回值为指定目录下的所有文件名和目录名

<span style="font-size:14px;"><span style="font-size:14px;">>>> os.listdir('/home/sil4')</span></span>

<span style="font-size:14px;"><span style="font-size:14px;">>>> for name in os.listdir(os.getcwd()):
...     print name
... 
</span></span>

这两种使用方法会有不一样的输出效果,,,,可以自己试一下!!!


3、函数用来删除一个文件:os.remove()

<span style="font-size:14px;"><span style="font-size:14px;">>>> os.remove('/home/sil4/pointer')</span></span>
<span style="font-size:14px;"><span style="font-size:14px;">>>> path = "/tmp/log"
>>> path
'/tmp/log'
>>> os.remove(path)</span></span>

4、
创建多级目录:os.makedirs(r“c:\python\test”)

<span style="font-size:14px;"><span style="color:#000000;"><span style="font-size:14px;">>>> >>> os.makedirs(r"/tmp/a/b/c")</span></span></span>

删除多个目录os.removedirs(r“c:\python”)

<span style="font-size:14px;"><span style="font-size:14px;">>>> os.removedirs(r"/tmp/test")</span></span>
创建单个目录:os.mkdir(“test”)

<span style="font-size:14px;"><span style="font-size:14px;">>>> os.mkdir("/tmp/x")</span></span>


5、检验给出的路径是否是一个文件os.path.isfile()

     检验给出的路径是否是一个目录:os.path.isdir()

<span style="font-size:14px;"><span style="font-size:14px;">>>> path = "/tmp/log1"
>>> os.path.isfile(path)
True
>>> os.path.isdir(path)
False
</span></span>

判断是否是链接文件:os.path.islink()

<span style="font-size:14px;"><span style="color:#000000;"><span style="font-size:14px;">>>> os.path.islink(r"/tmp/a")
False</span></span><span style="font-size:14px;">
</span></span>
搜索目录下的所有文件:os.path.walk()


6、检验给出的路径是否真地存:os.path.exists()

     判断是否是绝对路径:os.path.isabs()

<span style="font-size:14px;"><span style="font-size:14px;">>>> path = "/tmp/test"
>>> os.path.exists(path)
True
>>> os.path.isabs(path)
True
</span></span>

7、
返回一个路径的目录名和文件名: os.path.split()      

     分离扩展名:os.path.splitext()

     获取路径名:os.path.dirname()

     获取文件名:os.path.basename()

<span style="font-size:14px;"><span style="font-size:14px;">>>> os.path.split("/tmp/test/test_file.py")
('/tmp/test', 'test_file.py')
</span></span>
<span style="font-size:14px;"><span style="font-size:14px;">>>> os.path.splitext(path)
('/tmp/test/test_file', '.py')
</span></span>
<span style="font-size:14px;"><span style="font-size:14px;">>>> path = "/tmp/test/test_file.py"
>>> os.path.dirname(path)
'/tmp/test'
>>> os.path.basename(path)
'test_file.py'
</span></span>

8、
运行shell命令: os.system()

<span style="font-size:14px;"><span style="font-size:14px;">>>> cmdline = "cat /tmp/hello"
>>> os.system(cmdline)
this is test file    //这是文件内容
0         //这是执行成功之后的返回值
</span></span>

9、
读取和设置环境变量: os.getenv() 与os.putenv()

<span style="font-size:14px;"><span style="font-size:14px;">>>> print os.getenv('PATH')</span></span>

10、给出当前平台使用的行终止符: os.linesep     Windows使用'\r\n',Linux使用'\n'而Mac使用'\r'

<span style="font-size:14px;"><span style="font-size:14px;">>>> os.linesep
'\n'
</span></span>

11、指示你正在使用的平台:os.name       对于Windows,它是'nt',而对于Linux/Unix用户,它是'posix'

12、重命名:os.rename(old, new)

<span style="font-size:14px;"><span style="font-size:14px;">>>> os.rename("/tmp/test/hello","/tmp/test/test")
</span></span>
13、 获取文件属性: os.stat(file)

       修改文件权限与时间戳:os.chmod(file)

       终止当前进程:os.exit()、os._exit()

       获取文件大小:os.path.getsize(filename)

       在后台执行程序:osspawnv()

         启动新进程:os.exec(), os.execvp()

         改变工作目录:os.chdir(newdir)


二、 关于文件的操作

os.mknod("test.txt")        创建空文件
fp = open("test.txt",w)     直接打开一个文件,如果文件不存在则创建文件

关于open 模式:

w     以写方式打开,
a     以追加模式打开 (从 EOF 开始, 必要时创建新文件)
r+     以读写模式打开
w+     以读写模式打开 (参见 w )
a+     以读写模式打开 (参见 a )
rb     以二进制读模式打开
wb     以二进制写模式打开 (参见 w )
ab     以二进制追加模式打开 (参见 a )
rb+    以二进制读写模式打开 (参见 r+ )
wb+    以二进制读写模式打开 (参见 w+ )
ab+    以二进制读写模式打开 (参见 a+ )

 

<span style="font-size:14px;">fp.read([size])                     #size为读取的长度,以byte为单位
fp.readline([size])                 #读一行,如果定义了size,有可能返回的只是一行的一部分
fp.readlines([size])                #把文件每一行作为一个list的一个成员,并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数,size是表示读取内容的总长,也就是说可能只读到文件的一部分。
fp.write(str)                      #把str写到文件中,write()并不会在str后加上一个换行符
fp.writelines(seq)            #把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入,不会在每行后面加上任何东西。
fp.close()                        #关闭文件。python会在一个文件不用后自动关闭文件,不过这一功能没有保证,最好还是养成自己关闭的习惯。  如果一个文件在关闭后还对其进行操作会产生ValueError
fp.flush()                                      #把缓冲区的内容写入硬盘
fp.fileno()                                      #返回一个长整型的”文件标签“
fp.isatty()                                      #文件是否是一个终端设备文件(unix系统中的)
fp.tell()                                         #返回文件操作标记的当前位置,以文件的开头为原点
fp.next()                                       #返回下一行,并将文件操作标记位移到下一行。把一个file用于for … in file这样的语句时,就是调用next()函数来实现遍历的。
fp.seek(offset[,whence])              #将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。
fp.truncate([size])                       #把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。</span>


 

目录操作:
os.mkdir("file")                   创建目录
复制文件:
shutil.copyfile("oldfile","newfile")       oldfile和newfile都只能是文件
shutil.copy("oldfile","newfile")            oldfile只能是文件夹,newfile可以是文件,也可以是目标目录
复制文件夹:
shutil.copytree("olddir","newdir")        olddir和newdir都只能是目录,且newdir必须不存在
重命名文件(目录)
os.rename("oldname","newname")       文件或目录都是使用这条命令
移动文件(目录)
shutil.move("oldpos","newpos")   

删除文件
os.remove("file")
删除目录
os.rmdir("dir")只能删除空目录
shutil.rmtree("dir")    空目录、有内容的目录都可以删
转换目录os.chdir("path")   换路径


三、shutil模块对文件的操作

1.复制单个文件:shultil.copy(oldfile, newfle)

2.复制整个目录树:shultil.copytree(r".\setup", r".\backup")

3.删除整个目录树:shultil.rmtree(r".\backup")


临时文件的操作

1.创建一个唯一的临时文件:tempfile.mktemp() --> filename

2.打开临时文件:tempfile.TemporaryFile()

内存文件(StringIO和cStringIO)操作

 [4.StringIO] #cStringIO是StringIO模块的快速实现模块

1.创建内存文件并写入初始数据:f = StringIO.StringIO("Hello world!")

2.读入内存文件数据:print f.read() #或print f.getvalue() --> Hello world!

3.向内存文件写入数据:f.write("Good day!")

4.关闭内存文件:f.close()


Python 字符串操作总结

总体上来说,Python中的字符串用起来还是相当简单。也许最复杂的事情就是在代码中有如此多的方法去编写他们。
1.python字符串通常有单引号('...')、双引号("...")、三引号("""...""")或('''...''')包围,三引 号包含的字符串可由多行组成,一般可表示大段的叙述性字符串。在使用时基本没有差别,但双引号和三引号("""...""")中可以包含单引号,三引号 ('''...''')可以包含双引号,而不需要转义。
<span style="font-size:14px;">单引号:'spa"m'
双引号:"spa'm"
三引号:'''... spam ...''',"""... spam ..."""</span>

在Python字符串中,单引号和双引号是可以互换的 :这两种形式都能使用是因为不需要使用\转义字符就可以实现在一个字符串中包含其余种类的引号。
也就是说可以在一个双引号所包含的字符串中嵌入一个单引号字符。
<span style="font-size:14px;">>>> print "HelloWorld"
HelloWorld
>>> print "Hello'World"
Hello'World</span>

Python自动在任意表达式中合并相邻的字符串常量,尽管可以使用+来表明是字符串连接操作。
<span style="font-size:14px;">>>> title = "Hello" "World"
>>> print title
HelloWorld
>>> title = "Hello"+"World"
>>> print title
HelloWorld
</span>

注意:这些字符串之间增加逗号会创建一个元组,而不是一个字符串。而且Python倾向于打印所有这些形式的字符串为单引号,除非字符串内有单引号了。也可以使用\嵌入引号:
<span style="font-size:14px;">>>> title = 'Hello\'World',"Hello\"World"
>>> title
("Hello'World", 'Hello"World')
</span>

2.用(\)对特殊字符转义,如(\)、(')、(")。

转义字符:“s\tp\na\om”
<span style="font-size:14px;">>>> string = "s\np\na\nm"
>>> print string
s
p
a
m
</span>
<span style="font-size:14px;">>>> len(string)   <span style="color:#CC0000;">#这个字符串占了7个字节分别包含了ASCIIs字符、p字符、a字符、m字符和3个换行字符</span>
7
</span>
Python字符串反斜杠字符总结:
\newline        连续
\\                  保留\            
\'                   保留’
\"                   保留”
\a                  响铃
\b                  倒退
\f                   换页
\n                  换行
\r                   返回
\t                   水平制表符
\v                   垂直制表符
\xhh               十六进制值
\ooo                八进制值
\0                   Null(不是字符串结尾)

Raw字符串抑制转义:

有时候为了引入转义字符而是用适应的反斜杠会带来一些麻烦:
例如:
myfile = open('C:\new\text.dat' , 'w')
 通常我们会认为这句的作用是打开C:\new目录下名为text.dat的文件。但是这时候就会出现问题。。。。。问题就是这里面有\n,它会被识别成一个换行字符,\t会被识别称为一个制表符代替。。结果就是这句话就会被翻译成 C:(换行)ew(制表符)ext.dat文件 。。。而不是我们所期待的结果。。。
这正是我们所需要使用raw字符串所要解决的问题。如果字母r(大或小写)出现在第一个引号前面,将会关闭转义机制,结果就是
python会将\作为常量保持,就像输入那样。因此为了避免文件名错误记得增加字母r.
myfile = open(r'C:\new\text.dat' , 'w')

Raw字符串 :r"/tmp/test/hello.py"
<span style="font-size:14px;">>>> string = r"/tmp/test/hello.py"
>>> print string
/tmp/test/hello.py</span>

另一种解决方法就是:使用两个反斜杠。
myfile = open('C:\\new\\text.dat' , 'w')
值得注意的是:当打印一个嵌入反斜杠的字符串时python自身也会使用这种写两个反斜杠的方法
<span style="font-size:14px;">>>> path = r'c:\new\text.dat'
>>> path
'c:\\new\\text.dat'
>>> print(path)
c:\new\text.dat
</span>
<span style="font-size:14px;">>>> len(path)
15
</span>

一个raw字符串不能以单个反斜杠结尾,因为\会转义后续引用的字符。。。


Byte字符串:b'sp\x01am'+-- 
<span style="font-size:14px;">>>> print b'sp\x01am'</span>


仅在Python2.6中使用的Unicode字符串:u'eggs\u0020spam'

3.常用字符串函数
<span style="font-size:14px;">1)str.count() //返回该字符串中某个子串出现的次数
2)str.find()   //返回某个子串出现在该字符串的起始位置
3)str.lower() //将该字符串全部转化为小写
4)str.upper() //转为大写
5)str.split() //分割字符串,返回字串串列表,默认以空格分割
6)len(str)     //返回字符串长度</span>


3、三重引号编写多行字符串块(输入的什么,得到的就是什么)
>>> mantra = ''' always look
...  on the bright
... side of life
... .'''
>>> mantra
' always look\n on the bright\nside of life\n.'
 >>> print mantra
 always look
 on the bright
side of life
.
三重引号字符串常用于文档字符串——侵入多行错误信息或在原文件中编写html、xml代码。也可以用来废除一些代码。如果希望让一些代码行不工作然后在继续运行代码,可以简单的在这几行代码前后加入三重引号,这样比在每一行加#方便一些。



参考:http://www.cnblogs.com/txw1958/archive/2012/03/08/2385540.html

纯手写,不正之处欢迎纠正。。