【语言处理与Python】1.2将文本当作词链表

时间:2022-12-01 23:23:34

链表
-sent1=['Call','me','Ishmael','.']
  这个方括号内的东西在Python中叫做链表(list,也叫做列表),他就是我们存储文本的方式。
  我们可以对链表使用加法运算,创造一个新的链表。
  也可以对链表进行追加操作。sent1.append("Some")
索引列表
-使用数字位置索引text4[173]
-使用index,返回第一次出现的索引。text4.index('awaken')
-切片:子链表。从大文本中任意抽取语言片段,术语叫做切片。
 text5[16715:16735],text6[1600:1625],sent[:3],text2[141525:]
 text[m:n]指的是从m到n-1
变量
-变量名命名规则:开头由字母开始,总体可以有数字、下划线组成。大小写敏感。在排序中,大写字母总是出现在小写字母之前。
字符串
-给字符串赋值,name='Monty',可以通过下标单独访问name[0]
-乘法和加法操作,name*2,name+'!'
-链表连接组成单个字符串,''.join(['Monty','Python']),最终效果为'Monty Python'
-字符串分割操作'Monty Python'.split()