python 不知道是啥

时间:2023-03-09 22:00:21
python 不知道是啥

1.判断两个大文件是否是同一个文件

import os
import hashlib
import time
start = time.time()
path1 = r"E:\视频资料\elk\1.zip"
path2 = r"E:\视频资料\elk\2.zip"
def file_hash(path):
    file_size = os.path.getsize(path)
    md5 = hashlib.md5()
    with open(path1,'rb') as info:
        while file_size >=8192:
            content = info.read(8192)
            md5.update(content)
            file_size -=8192
        else:
            content = info.read(file_size)
            if content:
                md5.update(content)
    return md5.hexdigest()
# def file_hash(path):
#     md5 = hashlib.md5()
#     with open(path1, 'rb') as info:
#         md5.update(info.read())
#     return md5.hexdigest()
def file(path1,path2):
    return file_hash(path1) ==file_hash(path2)
ret = file(path1,path2)
print(ret)
end =time.time()
print(end-start)

通过制定读取大小计算和直接读取计算的hash是一样的,但是使用时间会有所不同,直接将文件全部读入到内容中会占用时间更长,cpu使用率在一定时间内会飙升!

上面代码刚开始不懂得是:按照指定大写获取到的hash和直接读取到的hash的是一样的么?通过验证确定一样的

#以下两种犯法获取到的"helloworld"的hash是一样的
md5 = hashlib.md5()
md5.update(b'hello')
md5.update(b'world')
ret = md5.hexdigest()
print(ret)

md5 = hashlib.md5()
md5.update(b'helloworld')
ret = md5.hexdigest()
print(ret)

2.python处理大文件

def func():
    with open('t','r',encoding='utf-8')as f:
        for i in f:
            i = i.strip('\r\n')
            yield i
g = func()
for i in g:
    try:
        print(i)
    except StopIteration:
        # pass
        print(1)

3.模拟微信红包

import random
def red_pac(money,num):
    ret = random.sample(range(1,money*100),num-1)  #取出9个点,乘以100 是考虑小数的情况
    ret.sort()    #将结果从大到小排序
    ret.insert(0,0)
    #为什么将0和100放进去刚开始没想明白,后来发现加上sample的中是分成了9分,加上最小值0和最大值100之后是11个
    #11个数之间两两相减就是10个红包的金额,
    #因为sample是取一个范围之间的不重复数字,所以每个人的概率也是一样的
    ret.append(money*100)
    for i in range(len(ret)-1):
        value = ret[i+1] - ret[i]   #算出相邻节点之间的差,就是红包的金额,ret后一个减去前一个数字加起来除以100正好是100
        yield value/100
g = red_pac(100,10)   #发100块钱,发10个红包
for i in g:
    print(i)

 4.三级菜单

china_ditie = {
    "北京": {
        "一号线": ["四惠", "大望路", "*", "西单"],

        "二号线": ["北京站", "朝阳门", "东直门", "西直门"],

        "三号线": ["国贸", "三元桥", "知春路", "巴沟"]

    },
    "上海": {
        "四号线": ["徐家汇", "人民广场", "延长路", "共康路", "呼兰路"],

        "五号线": ["东昌路", "静安寺", "江苏路", "虹桥火车站"],

        "六号线": ["宝山路", "赤峰路", "曹阳路", "虹桥路", "宜山路"]

    },
    "广州": {
        "七号线": ["东山口", "农讲所", "烈士陵园", "公园前", "体育西路"],

        "八号线": ["黄边", "纪念堂", "三元里", "白云公园"],

        "九号线": ["沙河顶", "北京路", "一德路", "文化公园"]

    },
    "深圳": {
        "一号线": ["高新园", "桃园", "白石洲", "华侨城"],

        "四号线": ["白石龙", "明乐", "少年宫", "红山"],

        "五号线": ["大学城", "兴东", "西里", "深圳北站"]

    },
}

字典

for item in china_ditie:  #取出整个字典中的key,然后循环
    print(item)
key1 = input('>>>')       #接收的是循环出来的key,然后循环这个key所对应的值
for item1 in china_ditie[key1]:
    print(item1)
key2 = input('>>>')
for item2 in china_ditie[key1][key2]:
    print(item2)

#字典有几层,就应该有几个for循环

方法一

l = [china_ditie]
while l:
    for item in l[-1]:
        print(item)
    name = input(">>>")
    if name.upper() == "Q":
        l.clear()
    elif name.upper() == "B":
        l.pop()
    else:
        if l[-1].get(name):
            l.append(l[-1][name])
'''
这个解法是使用列表的pop()方法和append()方法,实现了一个简单的栈操作
将字典添加到列表里面,通过l[-1]取出字典,并将其键打印到屏幕上,通过用户输入的来判断
是否是屏幕上打印的出来的字符串,如果不是就让用户重新输入,如果是的话
就验证l[-1]中原始的字典中是否有这个键,如果有这个键,就将这个键所对应的二层字典加入到l列表中,这样l列表就有
两个以字典为元素的值了。在通过while循环取出l[-1]元素,就是我们刚刚添加进去的二层字典进行显示
如果输出b则返回上一层,就删除l[-1]这个列表中最后面的字典。就能显示其上一层。

主要是用列表的方法实现了后进先出的特点,当显示到最后n层的时候,列表里面就会有n个以字典为元素的值
'''

方法二

 5.计算文件夹大小

import os
def get_zise(path):
    li = [path]
    file_size = 0
    while li:
        path = li.pop()
        dirs = os.listdir(path)
        for item in dirs:
            path_dir = os.path.join(path,item)
            if os.path.isfile(path_dir):
                file_size +=os.path.getsize(path_dir)
            else:
                li.append(path_dir)
    return file_size
ret = get_zise(r'E:\oldboy\python 20\讲课\day01')
print(ret)

 6.python编写计算器

#^尖括号在[]里面表示非
def chengchu(res):
    if '*' in res:
        a,b = res.split('*')
        return str(float(a)*float(b))
    else:
        a, b = res.split('/')
        return str(float(a) / float(b))
import re
exp = '1 - 2 * ( (60-30 + (9-2*5/3 + 7 /3*99/4*2998 +10 * 568/14 )*(-40/5)) - (-4*3)/ (16-3*2) )'
exp =exp.replace(" ",'')

def format_exp(exp):
    '''
    完成表达式格式整理,将一些叠在一起的符号整理成一个符号
    :param exp: str数据类型的表达式 '1.23++3+-4--5'
    :return: 整理之后的str数据类型的字符串,'1.23+3-4+5'
    '''
    exp = exp.replace('++','+')
    exp = exp.replace('-+','-')
    exp = exp.replace('+-','-')
    exp = exp.replace('--','+')
    return exp
'''
#匹配出扩号最里面的表达式,(9-2*5/3+7/3*99/4*2998+10*568/14)
'''
ret = re.search('\([^()]+\)', exp)    #(9-2*5/3+7/3*99/4*2998+10*568/14)
ret5 = ret.group()
while True:
    '''
    \d+(\.\d+)?[*/]-?\d+(\.\d+)?
    \d+(\.\d+)?:匹配整数和小数,小数出现0次或1次
    [*/]:匹配乘法和除法
    -?\d+(\.\d+)?:匹配负数和负小数
    '''
    ret1 = re.search('\d+(\.\d+)?[*/]-?\d+(\.\d+)?',ret5)     #列出每一个乘除式子 2*5
    if ret1:
        ret2 = chengchu(ret1.group())                                      #计算每一个乘除10
        ret5 =ret5.replace(ret1.group(),ret2)
        no_bracket_exp = format_exp(ret5)
        # 再计算加减法
        res_lst = re.findall('[-+]?\d+(?:\.\d+)?', no_bracket_exp)
        sum_n = 0
        for i in res_lst:
            sum_n += float(i)
        print (sum_n)
    else:
        break

#有的时候,往往取不到变量的名字
#通过变量的字符串的名字,可以通过反射获取

返回系列