浅论Python密文输入密码的方法

时间:2023-03-09 00:43:52
浅论Python密文输入密码的方法

近来做作业(老男孩那个9.9元的训练营)我想写一个装逼点的密文输入密码,类似于:

浅论Python密文输入密码的方法

这个东西我先前实现过,忘了获取一个字节的方法是什么,于是去网上找,发现网上的实现方式大部分都有问题。

一、网上(百度)的三种实现方式

网上的实现方式不外乎三种:

  1. 直接明文输入(这是扯淡)
  2. 使用getpass模块 覆盖输入,无法看到位数,没有退格。(不好用)
  3. 通过msvcrt模块的getch和putch实现(有问题)

我们重点研究第三种。

二、第三种实现方式的问题何在?

先看代码:

 def inputPassword():# 密码输入
try:
li = []
while True:
ch = msvcrt.getch()
if ch == b'\r': #回车键,确认输入
return ''.join(li) # 返回密码字符串
elif ch == b'\x08': #退格键,删除最后一个输出
del li[-1] #删除密码列表最后一位
msvcrt.putch(b'\b')
msvcrt.putch(b' ')
msvcrt.putch(b'\b')# 这相当于刷新
elif ch == b'\x1a': # ctrl+z 退出键,抛出异常
raise EOFError
else: #否则,就是密码
li.append(ch.decode()) # 加入列表
msvcrt.putch(b'*') # 遮盖符
except EOFError:
pass

看似没有问题,然而当实际运行的时候,获取到的密码会变成

"1 2 3 1 2 3"之类

而且可以发现,按下一个键后会出现两个*

这是为什么呢?

原来,当按下一个键时,实际上捕获到两个ch,一个是实际按下的键,另一个是b'\x00',这个东西造成了密码输入的不正确

怎么改?

只需要加入一个判断 处理b'\x00'就行了

正常的代码:

 def inputPassword():# 密码输入
try:
li = []
while True:
ch = msvcrt.getch()
if ch == b'\r': #回车键,确认输入
return ''.join(li) # 返回密码字符串
elif ch == b'\x08': #退格键,删除最后一个输出
del li[-1] #删除密码列表最后一位
msvcrt.putch(b'\b')
msvcrt.putch(b' ')
msvcrt.putch(b'\b')# 这相当于刷新
elif ch == b'\x00': #去除空字符
pass
elif ch == b'\x1a': # ctrl+z 退出键,抛出异常
raise EOFError
else: #否则,就是密码
li.append(ch.decode()) # 加入列表
msvcrt.putch(b'*') # 遮盖符
except EOFError:
pass

你只需要注意13行就可以。

事情并没用这么简单

在Python2中,不处理b'\x00'也是可以的,这是为何?

为此,我下载了python2和python3的源码,仔细研究

在..\Python-2.7.14\PC文件夹中(或者python3,也是这个文件夹),有一个名为msvcrtmodule.c的文件,这个就是msvcrt模块的源码

 static PyObject *
msvcrt_getch(PyObject *self, PyObject *args)
{
int ch;
char s[]; if (!PyArg_ParseTuple(args, ":getch"))
return NULL; Py_BEGIN_ALLOW_THREADS
ch = _getch();
Py_END_ALLOW_THREADS
s[] = ch;
return PyString_FromStringAndSize(s, );
}

python2

static int
msvcrt_getch_impl(PyObject *module)
/*[clinic end generated code: output=a4e51f0565064a7d input=37a40cf0ed0d1153]*/
{
int ch; Py_BEGIN_ALLOW_THREADS
ch = _getch();
Py_END_ALLOW_THREADS
return ch;
}

python3

比较这两个getch的代码,_getch方法我没有找到,可能在某个头文件中,这个方法的作用应该是获取输入的内容,python2和python3中,应该没有改变

然而在python2中,getch函数返回的是一个PyString_FromStringAndSize(s, 1)的返回值,而python3直接返回了_getch得到的东西。

但是由于笔者C语言拙劣,没用有找到PyString_FromStringAndSize的函数定义,只能推测,在这个函数中,处理掉了b'\x00',导致python2中压根没有获取到b'\x00',也就不用处理了

至于网上的文章,我怀疑msvcrt是最近更新的,python3的前几个版本中,应该还沿用了python2的这个函数。

为此我下载了python3.3的源码,发现getch函数和python2的完全一样。

因此网上没有处理b‘\x00’的方式,应该至少是3.3以前的版本(至于3.4、3.5我没有用过,也没有下载源码核实)

在python标准库网站中,我也没有看到什么解释。。(https://docs.python.org/3.7/library/msvcrt.html)

2019/6/8 更新

最近读C++的书籍,发现C的字符串(或者叫 char )类型,本质是一个数组。最后一个元素通常是以一个 “结束符” 结尾的。但是C++的字符串(C-style string)是一个对象。

或许python2 python3 之间处理数据的差距就在这里吧……