Python 常用模块(1) -- collections模块,time模块,random模块,os模块,sys模块

时间:2022-06-13 23:44:28

主要内容:

  一. 模块的简单认识

  二. collections模块

  三. time时间模块

  四. random模块

  五. os模块

  六. sys模块

 

一. 模块的简单认识

模块: 模块就是把装有特定功能的代码进行归类的结果
引入模块的方式:
(1) import 模块
(2) from 位置 import 模块

 

二. collections模块
collections模块主要封装了一些关于集合类的相关操作. 如我们学过的iterable,iterator等等.
除此以外, collections还提供了一些除了基本数据类型以外的数据集合类型.
如: Counter, deque, OrderDict, defaultdict, namedtuple

1. Counter
  Counter是一个计数器,主要用来计数.
(1)用普通方法计算一个字符串中每个字符出现的次数:

s = "Dava likes a pig"
dic = {}
for c in s:
    dic[c] = dic.get(c, 0) + 1
print(dic)
# 以上代码执行结果:
# {'D': 1, 'a': 3, 'v': 1, ' ': 3, 'l': 1, 'i': 2, 'k': 1, 'e': 1, 's': 1, 'p': 1, 'g': 1}

(2)引入collections模块中的Counter方法:

from collections import Counter
s = "Dava likes a pig"
print(Counter(s))
# 以上代码执行结果:
# Counter({'a': 3, ' ': 3, 'i': 2, 'D': 1, 'v': 1, 'l': 1, 'k': 1, 'e': 1, 's': 1, 'p': 1, 'g': 1})

 

2. deque 双向队列
在学习双向队列之前,我们需要了解两种数据结构(重点):
  (1)队列: FIFO(First In First Out) --> 先进先出
  (2)栈: FILO(First In Last Out) --> 先进后出

(1)队列:

import queue
# 创建队列
q = queue.Queue()
# 在q中放入元素
q.put("汪峰")
q.put("章子怡")
q.put("刘德华")
# 获取元素
print(q.get())  # 汪峰
print(q.get())  # 章子怡
print(q.get())  # 刘德华
print(q.get())  # 阻塞了,该代码在等待下一个元素进入队列

# 注意: 如果队列里没有元素了, 也就再也拿不出来元素了.此时程序被阻塞

(2)栈: 1)入栈 ---> 2)出栈
栈的属性: 1)载体(list)   2)大小(size)   3)栈顶指针(下一个装元素的位置)
注意: 以下代码有严重的并发问题!

class StackFullError(Exception): pass
class StackEmptyError(Exception): pass
class Stack:
    def __init__(self, size):
        self.index = 0
        self.size = size
        self.lst = []

    def push(self, element):
        if self.index < self.size:
            self.lst.insert(self.index, element)
            self.index += 1
        else:
            raise StackFullError("the stack is full")

    def pop(self):
        if self.index > 0:
            self.index -= 1
            return self.lst[self.index]

 

在了解了队列和栈的概念以后,,我们再来看双向队列deque:

from collections import deque
q = deque()                     # 创建双向队列
q.append("汪峰")                # 默认从右侧添加
q.append("章子怡")
q.appendleft("赵又廷")          # 从左侧添加
q.appendleft("高圆圆")
print(q)

q.pop()                         # 默认从右侧删除
q.popleft()                     # 从左侧删除
print(q)

# 以上代码执行结果:
# deque(['高圆圆', '赵又廷', '汪峰', '章子怡'])
# deque(['赵又廷', '汪峰'])

 

3. namedtuple 命名元组
命名元组,即给元组内的元素进行命名,例如,我们把(x, y)看作是一个元组,
同时, 我们还可以认为这是一个点坐标. 此时, 我们就可以使用namedtuple对元素进行命名.

from collections import namedtuple
point = namedtuple("Point", ["x", "y"])     # namedtuple方法类似于 定义一个简单的类
p = point(1, 2)     # 命名元组
print(p)
# 以上代码执行结果:
# Point(x=1, y=2)

 

4. OrderedDict和defaultdict
(1) OrderedDict -- 指有序字典(字典的key是有序的)

先观察一般情况下创建的字典:

dic = {"a": 1, "b": 2, "c": 3}
print(dic)
# 执行结果:
# {'a': 1, 'b': 2, 'c': 3}

再观察用OrderedDict方法创建的字典:

from collections import OrderedDict
od = OrderededDict({"a": 1, "b": 2, "c": 3})
print(od)
print(od.get("b"))
print(od["b"])
# 以上代码执行结果:
# OrderedDict([('a', 1), ('b', 2), ('c', 3)])
# 2
# 2

 

(2) defaultdict -- 可以给字典设置默认值, 当key不存在时, 直接获取默认值

from collections import defaultdict
dd = defaultdict(list)  # 这里的默认值参数必须是可调用的(callable). 在这里, list是可调用的, 因为 list()有意义, 它是一个空列表
dd["汪峰"] = "乐坛半壁*"
print(dd["刘德华"])    # 当key不存在的时候,会自动执行构造方法中传递的内容
print(dd["汪峰"])
# 以上代码执行结果是:
# []
# 乐坛半壁*

 

(3)处理字典时setdefault与defaultdict各自的用法, 举例说明:
例1: setdefault(key, default=None)
题目内容: 把列表中大于66和小于66的数字各自分类

lst = [11, 22, 33, 44, 55, 66, 77, 88, 99]
dic = {}
for el in lst:
    if el > 66:
        dic.setdefault("大于66的值有", []).append(el)
    else:
        dic.setdefault("小于等于66的值有", []).append(el)
print(dic)
# 以上代码执行结果是:
# {'小于等于66的值有': [11, 22, 33, 44, 55, 66], '大于66的值有': [77, 88, 99]}

例2: defaultdict(callable)
题目内容: 把列表中大于66和小于66的数字各自分类

from collections import defaultdict
lst = [11, 22, 33, 44, 55, 66, 77, 88, 99]
dd = defaultdict(list)
for el in lst:
    if el > 66:
        dd["大于66的值有"].append(el)
    else:
        dd["小于等于66的值有"].append(el)
print(dd)
# 以上代码执行结果:
# defaultdict(<class 'list'>, {'小于等于66的值有': [11, 22, 33, 44, 55, 66], '大于66的值有': [77, 88, 99]})

 

 

三. time时间模块(重点)

1. 时间戳 -- 当前系统时间(给计算机使用)

import time
print(time.time())
# 执行结果:
# 1538998798.0641088 --> 这个就是当前系统时间,也称时间戳,它是给计算机使用的

 

2. 格式化时间(日常生活中常用的)

import time
s = time.strftime("%Y/%m/%d %H:%M:%S")
print(s)
# 执行结果:
# 2018/10/08 19:43:27 --> 格式化时间指的是我们能看懂的时间,这里的"%Y/%m/%d %H:%M:%S"是就是时间格式,它是可以根据要求进行更改的
日期格式化标准:
%y    两位数的年份表示(00-99%Y    四位数的年份表示(000-9999%m    月份(01-12%d    月内中的⼀天(0-31%H    24小时制小时数(0-23%I    12小时制小时数(01-12%M    分钟数(00=59%S    秒(00-59%a    本地简化星期名称
%A    本地完整星期名称
%b    本地简化的月份名称
%B    本地完整的月份名称
%c    本地相应的日期表示和时间表示
%j    年内的一天(001-366%p    本地A.M.或P.M.的等价符
%U    一年中的星期数(00-53)星期天为星期的开始
%w    星期(0-6),星期天为星期的开始
%W    一年中的星期数(00-53)星期一为星期的开始
%x    本地相应的日期表示
%X    本地相应的时间表示
%Z    当前时区的名称
%%    %号本身

 

3. 结构化时间(用于时间格式的转化,时间差计算)

import time
print(time.localtime())
# 执行结果:
# time.struct_time(tm_year=2018, tm_mon=10, tm_mday=8, tm_hour=19, tm_min=52, tm_sec=12, tm_wday=0, tm_yday=281, tm_isdst=0)

 

4. 时间的相关操作

(1)把时间戳转化为格式化时间
步骤: 时间戳 --> localtime(时间戳) --> 结构化时间 --> strftime(格式,结构化时间) --> 格式化时间

举例说明:

# 已知数据库中存储了这样一个时间: 1888888888, 请将它转化成 xxxx年xx月xx日 的形式
import time
t = time.localtime(1888888888)      # 把"时间戳"结构化
s = time.strftime("%Y-%m-%d %H:%M:%S", t)   # 把"结构化时间"格式化
print(s)
# 执行结果:
# 2029-11-09 11:21:28

 

(2)把格式化时间转化成时间戳
步骤: 格式化时间 --> strptime(格式化时间,格式) --> 结构化时间 --> maketime(结构化时间) --> 时间戳

举例说明:

import time
s = "2020-10-01 12:18:34"
t = time.strptime(s, "%Y-%m-%d %H:%M:%S")   # 把格式化时间结构化
print(time.mktime(t))   # 把结构化时间转换成时间戳
# 执行结果:
# 1601525914.0

从以上两个例子可以看出: 在对时间进行格式转换时, 都必须要先将该时间转换成"结构化时间".所以可以把结构化时间当作是一个中间站.

 

(3)计算时间差

# 已知两个格式化时间, 它们分别是"2017-09-11 08:30:00"和"2017-09-12 11:00:00", 计算它们的时间差
import time
true_time1 = time.mktime(time.strptime("2017-09-11 08:30:00", "%Y-%m-%d %H:%M:%S"))
true_time2 = time.mktime(time.strptime("2017-09-12 11:00:00", "%Y-%m-%d %H:%M:%S"))
def_time = true_time2 - true_time1
struct_time = time.localtime(def_time)
print("时间差是: {0}年{1}月{2}日{3}小时{4}分钟{5}秒".format(struct_time.tm_year-1970, struct_time.tm_mon-1, struct_time.tm_mday-1, struct_time.tm_hour, struct_time.tm_min, struct_time.tm_sec))

# 执行结果:
# 时间差是: 0年0月1日10小时30分钟0秒

 

 

四. random模块 -- 所有与"随机"相关的内容都在random模块中

import random               # 引入模块

print(random.random())      # 拿到闭区间[0, 1]内的随机小数

print(random.uniform(a, b)) # 拿到闭区间[a, b]内的随机小数

print(random.randint(a, b)) # 拿到闭区间[a, b]内的随机整数

print(random.randrange(a, b, step))     # 拿到列表list(range(a, b, step))中的一个随机数
print(random.randrange(1, 10, 2))       # 拿到列表[1, 3, 5, 7, 9]中的一个随机数

print(random.choice(list(el1, el2, el3, ...)))     # 拿到列表list()中的一个随机元素
print(random.choice(["汪峰", "王力宏", ["白蛇传", "天龙八部"]]))      # 拿到列表["汪峰", "王力宏", ["白蛇传", 天龙八部]]中的一个随机元素

print(random.sample(list(el1, el2, el3, ...), num))    # 从列表list()中任意拿出num个元素,返回这num个元素组成的列表
print(random.sample([1, "23", [4, 5]], 2)   # 从列表[1, "23", [4, 5]]中任意拿出2个元素, 返回这2个元素组成的列表, 如[[4, 5], '23']

random.shuffle(list(el1, el2, el3, ...))    # 打乱列表中所有元素的顺序,返回打乱后的列表
lst = [1, 2, 3, 4, 5, 6, 7, 8, 9, 0]
random.shuffle(lst)
print(lst)
# 执行结果:
# [5, 0, 1, 7, 9, 6, 3, 4, 8, 2]            # 打乱了列表lst中所有元素的顺序, 最后返回的是乱序的列表

 

 

五. os模块 -- 所有和操作系统相关的内容都在os模块中(参考资料)

import os

os.makedirs("dirname1/dirname2")    # 可生成多层递归目录

os.removedirs("dirname1")       # 若目录为空,则删除, 并递归到上一级目录, 如若上一层也为空, 则删除, 以此类推

os.mkdir("dirname")     # 生成单级目录, 相当于shell中mkdir dirname

os.rmdir("dirname")     # 删除单级空目录, 若目录不为空则无法删除, 报错. 相当于shell中rmdir dirname

os.listdir("dirname")   # 列出指定目录下的所有文件和子目录, 包括隐藏文件, 并以列表方式打印

os.remove()             # 删除一个文件

os.rename("oldname", "newname")     # 重命名文件/目录

os.stat("path/filename")            # 获取文件/目录信息

os.system("bash command")           # 运行shell命令, 直接显示

os.popen("bash command").read()     # 运行shell命令, 获取执行结果

os.getcwd()                         # 获取当前工作目录, 即当前脚本工作目录. 相当于shell下cd

# os.path

os.path.abspath(path)               # 返回path规范化的绝对路径

os.path.split(path)                 # 将path分割成目录和文件名二元组返回

os.path.basename(path)              # 返回path最后的文件名,如果path以/或\结尾,那么就会返回空值, 即os.path.split(path)的第二个元素

os.path.exists(path)                # 如果path存在, 返回True, 如果path不存在, 返回False

os.path.isabs(path)                 # 如果path是绝对路径, 返回True

os.path.isfile(path)                # 如果path是一个存在的文件, 返回True, 否则返回False

os.path.isdir(path)                 # 如果path是一个存在的目录, 则返回True, 否则返回False

os.path.join(path1[, path2[, ...]]) # 将多个路径组合后返回, 第一个绝对路径之前的参数将被忽略

os.path.getatime(path)              # 返回path所指向的文件或者目录的最后访问时间

 

 

六. sys模块 -- 所有和Python解释器相关的操作都在sys模块

以下操作只能在命令提示符中使用

import sys

sys.argv        # 命令行参数列表, 第一个元素是程序本身路径

sys.version     # 获取Python解释器程序的版本信息

sys.path        # 返回模块的搜索路径, 初始化时使用PYTHONPATH环境变量的值

sys.platform    # 返回操作系统平台名称

sys.exit(1)     # 退出程序, 正常退出时使用exit(0), 错误退出时使用sys.exit(1)