PYthon成长之路第一篇(1)__字符串初识

今天一起走进python的代码世界，一起领悟python的魅力

在很多学习python的书中都会以 print “Hello，world!” 这样的而一个程序为开始，那么其中的 hello，world 是什么？他就是本章要讲解的字符串

一、单引号，双引号和转义引号

（1）在一般的时候 ‘Hello，world!’ 和 “Hello，world!” 是没有什么区别的，那么为什么会两个都可以用呢？是因为在某些情况下，他们会排上用处
 >>> "Hellow,world"

 'Hellow,world'

 >>> 'Hellow,world'

 'Hellow,world'
（2）在下面的代码中，第一段字符串包含了单引号，所以呢整体就不能用单引号包括起来，如果这样做的话，解释器就会抱怨（它这么做也是对的）
 >>> "Let's go!"

 "Let's go!"

 >>> 'Ler's go!'

 SyntaxError: invalid syntax
（3）虽然上面的代码，用双引号执行时成功的，但是我们不一定要这么来去做，这里就涉及到转义（\），这样做Python就会明白其中一个单引号是一个字符

>>> 'Ler\'s go!'
"Ler's go!"

二、字符串拼

（1）如果我们想输出这样下例的字符，那么我们是不是需要用很多的（\），如果我们不想用反斜线怎么办？这里我们可以通过另外一种方法实现

我们只是接连写了两个字符串，Python会自动连成一个字符串（这种机制用的不多）
 >>> "\"Hellow\",world!"

 '"Hellow",world!'

 >>> #字符串拼接

 >>> '"Hellow"'',world!'

 '"Hellow",world!'
（2）另外一种方法就行+号一样将字符串拼接起来，下面是使用变量来定义字符
 >>> "Hellow,"+"world!"

 'Hellow,world!'

 >>> x = "Hellow,"

 >>> y = "world!"

 >>> x+y

 'Hellow,world!'
注！python中的字符串在C语言中体现为是一个字符数组，每次创建字符串时候需要在内存中开辟一块连续的空，并且一旦需要修改字符串的话，就需要再次开辟空间，万恶的+号每出现一次就会在内从中重新开辟一块空间。

（3）在我们想将字符串跟数字相连时我们需要使用反引号，例如
 >>> aa = 22

 >>> print "aaaa"+aa

 Traceback (most recent call last):

   File "<pyshell#51>", line 1, in <module>

     print "aaaa"+aa

 TypeError: cannot concatenate 'str' and 'int' objects

 >>> print "aaaa"+`aa`

 aaaa22

三、字符串表示str和repr

（1）在例子中我们发现，通过Pyrhon打印的字符串还是被引号括起来的，这是因为Python打印值的时候会保持在Python代码中的状态，如果你不想看见这个状态我们使用“Print”语句结果就不一样了
 >>> print"Hello,world"

 Hello,world

 >>> "Hello,world"

 'Hello,world'

 >>> print 1000L

 1000

 >>> 1000L

 1000L

（2）可以看到长整形数字1000L在print时候转换成1000，但是当我们想知道这个值是长整形还是整形怎么办，实际上字符串这两种机制都是由str和repr来实现的，srt我们称为对人类友好的也就是方便人类理解，repr对机器友好方便Python表达式下面我们举些例子

>>> print repr("Hello")
'Hello'

>>> print str("Hello")

Hello

注意！在Python3.0中，已经不在使用反引号了

四、input和raw_input的比较（用户交互）

（1）我们已经知道了“Hello，“+name+”！”是什么意思了，那么raw_input和input是什么区别呢我没看下面的例子，这个例子看似很合理但是执行是错误的
 >>> name = input("what is you name?")

 what is you name?xiaoyuan

 Traceback (most recent call last):

   File "<pyshell#59>", line 1, in <module>

     name = input("what is you name?")

   File "<string>", line 1, in <module>

 NameError: name 'xiaoyuan' is not defined
这是因为，要求我们输入用户名使用引号
 >>> name = input("what is you name?")

 what is you name?"xiaoyuan"

 >>>
所以呢我们尽量使用raw_input，在3.5版本中取消了raw_input

五、长字符串、原始字符串

（1）长字符串，如果需要写一个非常非常长的字符串，它需要跨多行，那么，可以使用3个引号代替普通的引号，
 >>> print ''' Hi there you are outside

 Please sign for it'''

 Hi there you are outside

 Please sign for it
对于普通的引号，可以使用\n来换行
 >>> print "Hi there you are outside \n Please sign for it"

 Hi there you are outside

 Please sign for it
（2）我们知道了，\n可以来换行，如果我们想要输出一个路径”C:\new”这样的字符串，我们该怎么办呢！
 >>> new = "C:\new"

 >>> print new

 C:

 ew
当然我们可以使用反斜线来转意，但是当路径非常长的时侯呢？所以这里我们使用原始字符串：以r开头
 >>> new = r"C:\new"

 >>> print new

 C:\new

六、字符编码

（1）在Python解释器加载.py 文件中的代码时，会对内容进行编码（默认ascill）ASCII（American Standard Code for Information Interchange，美国标准信息交换代码）是基于拉丁字母的一套电脑编码系统，主要用于显示现代英语和其他西欧语言，其最多只能用 8 位来表示（一个字节），即：2**8 = 256，所以，ASCII码最多只能表示 256 个符号。

（2）很显然显然ASCII码无法将世界上的各种文字和符号全部表示，所以，就需要新出一种可以代表所有字符和符号的编码，即：Unicode，Unicode（统一码、万国码、单一码）是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，规定虽有的字符和符号最少由 16 位来表示（2个字节），即：2 **16 = 65536，
注：此处说的的是最少2个字节，可能更多

（3）UTF-8，是对Unicode编码的压缩和优化，他不再使用最少使用2个字节，而是将所有的字符和符号进行分类：ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存，东亚的字符用3个字节保存...所以，python解释器在加载 .py 文件中的代码时，会对内容进行编码（默认ascill），如果是代码当中有中文就会报错。
#!/usr/bin/env python
print "你好明天"
File "E:/pycharm/exercise/date_1/��˵�/ceshi-2.py", line 2
SyntaxError: Non-ASCII character '\xe4' in file E:/pycharm/exercise/date_1/��˵�/ceshi-2.py on line 2, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details

所以应该告诉Python解释器用什么编码来执行源代码

#!/usr/bin/env python

# -*- coding: utf-8 -*-

print "你好明天"

七、注释

当行注视：# 被注释内容

多行注释：""" 被注释内容 """

八、Python内部执行过程

（1）当我们执行某个.py的文件时，我们Python内部时这样执行的

秒客网

PYthon成长之路第一篇(1)__字符串初识

相关文章