python 小数据池 is和 == 编码解码

时间:2022-12-10 12:50:48

########################总结#########################

今日主要内容
1. 小数据池, id()
小数据池针对的是: int, str, bool
在py文件中几乎所有的字符串都会缓存.
id() 查看变量的内存地址
2. is和==的区别

# s1 = "abc" # 内存中是没有"abc", 创建一个新的 0.0001
# s2 = "abc" # 内存中是已经有了"abc", 直接把abc拿来用 0.0000001
# print(id(s1), id(s2)) # 31096032 31096032 # lst1 = [1,2,3]
# lst2 = [1,2,3]
# # 列表没有小数据池
# print(id(lst1), id(lst2)) # 166167560 166126408
# print(lst1 == lst2) # True
# print(lst1 is lst2) # False

is 比较的是内存地址
== 比较的是内容
当两个变量指向同一个对象的时候. is是True, ==也是True

3. 再谈编码
回顾:
1. ascii. 有: 数字, 字母, 特殊字符. 8bit 1byte 128 最前面是0
2. gbk. 包含: ascii, 中文(主要), 日文, 韩文, 繁体文字. 16bit, 2byte.
3. unicode. 包含gbk,ascii,big5... 32bit, 4byte
4. utf-8. 可变长度的unicode.
1. 英文: 8bit,1byte
2. 欧洲文字: 16bit 2byte
3. 中文: 24bit 3byte
不同的编码之间不能随意转换. 中国人gbk和德国人utf-8骂 想要沟通必须通过英文(unicode)(媒介)

在python3中. 默认的编码是unicode,我们的字符串就是unicode
在python2中. 默认的编码是ASCII. Cpython.c语言的默认编码是ASCII

unicode弊端:在存储和传输的时候. 是很浪费的
在存储和传输的时候不能直接使用unicode. 必须要对字符串进行编码. 编码成bytes类型
bytes: 字节形式的字符串

1. encode(编码格式) 编码    gbk utf-8
2. decode(编码格式) 解码

字符串转换为bytes

s = '中国'
s1 = s.encode('utf-8')
print(s1)

执行输出:

b'\xe4\xb8\xad\xe5\x9b\xbd' #一个 \ 表示一位,输出,可以看出占用了6位

转换为gbk

s = 'hello girl'
s1 = s.encode('gbk')
print(s1)

执行输出:

b'hello girl'

bytes转换为str

s1 = b'\xe4\xb8\xad\xe5\x9b\xbd'
s2 = s1.decode(encoding='utf-8')
print(s2)

执行输出:

中国

#############################作业########################

1,老男孩好声音选秀秀赛评委在打分的时候呢, 可以进行输入.假设,

老男孩有10个评委.让10个评委进行打分, 要求, 分数必须大于5分, 小于10分.
# pingwei = ['alex', 'wusir', '麻花藤', '东风扇','西风扇','宝宝','太白','日天','女神','老弟']
# list=[]
# number=0
# while number < 10:#不确定输入次数 用while
# content=int(input(f'请第{number+1}位{pingwei[number]}评委输入打分:'))
# if content > 5 and content <10:
# print(f"{pingwei[number]}评委的分数是:{content}")
# list.append(content)
# else:
# print('请按要求输入分数')
# number -= 1
# number += 1
# print(f'10位评委的得分情况:{list}') # lst=[]
# index=0
# while index<len(pingwei):
# content=input('请%s评委打分:' % pingwei[index])
# if content.isdigit():
# fen=int(content)
# if fen >= 5 and fen <= 10:
# lst.append(fen)
# index+=1
# else:
# print("对不起,你的分数有问题,请重新输入")
# else:
# print('输入的问题,请重新输入')
# print(lst)
# 2. 念数字.  给出一个字典. 在字典中标识出每个数字的发音. 包括相关符号. 然后由用户输入一个数字. 让程序读出相对应的发音(不需要语音输出. 单纯的打印即可)


dic = {
'-':'fu',
'0':'ling',
'1':'yi',
'2':'er',
'3':'san',
'4':'si',
'5':'wu',
'6':'liu',
'7':'qi',
'8':'ba',
'9':'jiu',
'.':'dian'
}


content = input("请输入数字:") # 123
# 获取到字符串中的每一个字符

for c in content:
print(dic[c], end=" ")

#3. 车牌区域划分,现给出以下车牌.根据车牌的信息,分析出各省的车牌持有量.

cars = ['鲁A32444','鲁B12333','京B8989M','黑C46555','沪B25041']
locals = {'沪':'上海','黑':'黑龙江','鲁':'山东','鄂':'湖北','湘':'湖南'}
dic={}
for i in cars:
jianchen=i[0]#拿到城市首字母
chengshi=locals[jianchen]#去找对应的城市
if dic.get(chengshi):#判断新字典里面有没有城市
dic[chengshi]+=1 #如果有 就dic[城市]=dic[城市]+1
else:
dic[chengshi]=1 #如果新字典里面没有城市就等于1
print(dic)

5.干掉主播.现有如下主播收益信息, 按照要求, 完成相应操作:
zhubo = {'卢本伟': 122000, '冯提莫': 189999, '金老板': 99999, '吴老板': 25000000, 'alex': 126}
1.计算各位主播收益的平均值.
2.干掉收益小于平均值的主播.
3.干掉卢本伟.

zhubo = {'卢本伟': 122000, '冯提莫': 189999, '金老板': 99999, '吴老板': 25000000, 'alex': 126}
# 1.计算各位主播收益的平均值.
# 2.干掉收益小于平均值的主播.
# 3.干掉卢本伟.
sum =0
for i in zhubo.values():
sum=sum+i
avg=sum/len(zhubo) lis=[]
for k,v in zhubo.items():
if v < avg:
lis.append(k)
print(lis) # for el in lis:
# zhubo.pop(el)#for 新list 开始删除字典的可key
# print(zhubo) # zhubo.pop("卢本伟")
# print(zhubo)