python 小数据池 is和 == 编码解码

########################总结#########################

今日主要内容
1. 小数据池, id()
小数据池针对的是: int, str, bool
在py文件中几乎所有的字符串都会缓存.
id() 查看变量的内存地址
2. is和==的区别

# s1 = "abc" # 内存中是没有"abc", 创建一个新的 0.0001

# s2 = "abc" # 内存中是已经有了"abc", 直接把abc拿来用 0.0000001

# print(id(s1), id(s2)) # 31096032 31096032

# lst1 = [1,2,3]

# lst2 = [1,2,3]

# # 列表没有小数据池

# print(id(lst1), id(lst2)) # 166167560 166126408

# print(lst1 == lst2) # True

# print(lst1 is lst2) # False

is 比较的是内存地址
== 比较的是内容
当两个变量指向同一个对象的时候. is是True, ==也是True

3. 再谈编码
回顾:
1. ascii. 有: 数字, 字母, 特殊字符. 8bit 1byte 128 最前面是0
2. gbk. 包含: ascii, 中文(主要), 日文, 韩文, 繁体文字. 16bit, 2byte.
3. unicode. 包含gbk,ascii,big5... 32bit, 4byte
4. utf-8. 可变长度的unicode.
1. 英文: 8bit,1byte
2. 欧洲文字: 16bit 2byte
3. 中文: 24bit 3byte
不同的编码之间不能随意转换. 中国人gbk和德国人utf-8骂想要沟通必须通过英文(unicode)(媒介)

在python3中. 默认的编码是unicode,我们的字符串就是unicode
在python2中. 默认的编码是ASCII. Cpython.c语言的默认编码是ASCII

unicode弊端:在存储和传输的时候. 是很浪费的
在存储和传输的时候不能直接使用unicode. 必须要对字符串进行编码. 编码成bytes类型
bytes: 字节形式的字符串

1. encode(编码格式) 编码 gbk utf-8
2. decode(编码格式) 解码

字符串转换为bytes

s = '中国'

s1 = s.encode('utf-8')

print(s1)

执行输出：

b'\xe4\xb8\xad\xe5\x9b\xbd' #一个 \ 表示一位，输出，可以看出占用了6位

转换为gbk

s = 'hello girl'

s1 = s.encode('gbk')

print(s1)

执行输出：

b'hello girl'

bytes转换为str

s1 = b'\xe4\xb8\xad\xe5\x9b\xbd'

s2 = s1.decode(encoding='utf-8')

print(s2)

执行输出：

中国

#############################作业########################

1，老男孩好声音选秀秀赛评委在打分的时候呢, 可以进行输入.假设,

老男孩有10个评委.让10个评委进行打分, 要求, 分数必须大于5分, 小于10分.

# pingwei = ['alex', 'wusir', '麻花藤', '东风扇','西风扇','宝宝','太白','日天','女神','老弟']

# list=[]

# number=0

# while number < 10:#不确定输入次数 用while

#     content=int(input(f'请第{number+1}位{pingwei[number]}评委输入打分:'))

#     if content > 5 and content <10:

#         print(f"{pingwei[number]}评委的分数是:{content}")

#         list.append(content)

#     else:

#         print('请按要求输入分数')

#         number -= 1

#     number += 1

# print(f'10位评委的得分情况:{list}')

# lst=[]

# index=0

# while index<len(pingwei):

#     content=input('请%s评委打分:' % pingwei[index])

#     if content.isdigit():

#         fen=int(content)

#         if fen >= 5 and fen <= 10:

#             lst.append(fen)

#             index+=1

#         else:

#             print("对不起,你的分数有问题,请重新输入")

#     else:

#         print('输入的问题,请重新输入')

# print(lst)

# 2. 念数字.  给出一个字典. 在字典中标识出每个数字的发音. 包括相关符号. 然后由用户输入一个数字. 让程序读出相对应的发音(不需要语音输出. 单纯的打印即可)

dic = {
'-':'fu',
'0':'ling',
'1':'yi',
'2':'er',
'3':'san',
'4':'si',
'5':'wu',
'6':'liu',
'7':'qi',
'8':'ba',
'9':'jiu',
'.':'dian'
}

content = input("请输入数字:") # 123
# 获取到字符串中的每一个字符

for c in content:
print(dic[c], end=" ")

#3. 车牌区域划分,现给出以下车牌.根据车牌的信息,分析出各省的车牌持有量.

cars = ['鲁A32444','鲁B12333','京B8989M','黑C46555','沪B25041']

locals = {'沪':'上海','黑':'黑龙江','鲁':'山东','鄂':'湖北','湘':'湖南'}

dic={}
for i in cars:
    jianchen=i[0]#拿到城市首字母
    chengshi=locals[jianchen]#去找对应的城市
    if dic.get(chengshi):#判断新字典里面有没有城市
        dic[chengshi]+=1 #如果有 就dic[城市]=dic[城市]+1
    else:
        dic[chengshi]=1 #如果新字典里面没有城市就等于1
print(dic)

5.干掉主播.现有如下主播收益信息, 按照要求, 完成相应操作:
zhubo = {'卢本伟': 122000, '冯提莫': 189999, '金老板': 99999, '吴老板': 25000000, 'alex': 126}
1.计算各位主播收益的平均值.
2.干掉收益小于平均值的主播.
3.干掉卢本伟.

zhubo = {'卢本伟': 122000, '冯提莫': 189999, '金老板': 99999, '吴老板': 25000000, 'alex': 126}

# 1.计算各位主播收益的平均值.

# 2.干掉收益小于平均值的主播.

# 3.干掉卢本伟.

sum =0

for i in zhubo.values():

    sum=sum+i

    avg=sum/len(zhubo)

lis=[]

for k,v in zhubo.items():

    if v < avg:

        lis.append(k)

print(lis)

# for el in lis:

#     zhubo.pop(el)#for 新list 开始删除字典的可key

# print(zhubo)

# zhubo.pop("卢本伟")

# print(zhubo)

秒客网

python 小数据池 is和 == 编码解码

相关文章