"python 字符串操作 2008 年 04 月 15 日星期二 01:32 在python有各种各样的 string 操作函数。在历史上 string 类在python中经历了一段轮回的历史。在最开始的时候，python有一个专门的 string 的 module，要使用 string 的方法要 ...."

someone1
AI专业者开发社区 1 号成员
AI开发者社区 • 0 回帖 • 13 浏览 • 5 个月前

python字符串操作

python 字符串操作

2008 年 04 月 15 日星期二 01:32

在python有各种各样的 string 操作函数。在历史上 string 类在python中经历了一段轮回的历史。在最开始的时候，python有一个专门的 string 的 module，要使用 string 的方法要先 import，但后来由于众多的python使用者的建议，从python2.0 开始， string 方法改为用 S.method() 的形式调用，只要 S 是一个字符串对象就可以这样使用，而不用 import。同时为了保持向后兼容，现在的 python中仍然保留了一个 string 的 module，其中定义的方法与 S.method()是相同的，这些方法都最后都指向了用 S.method () 调用的函数。要注意，S.method()能调用的方法比 string 的 module 中的多，比如 isdigit()、istitle()等就只能用 S.method() 的方式调用。
对一个字符串对象，首先想到的操作可能就是计算它有多少个字符组成，很容易想到用 S.len()，但这是错的，应该是 len(S)。因为 len() 是内置函数，包括在 __builtin__ 模块中。python不把 len()包含在 string 类型中，乍看起来好像有点不可理解，其实一切有其合理的逻辑在里头。len() 不仅可以计算字符串中的字符数，还可以计算 list 的成员数，tuple 的成员数等等，因此单单把 len()算在 string 里是不合适，因此一是可以把 len() 作为通用函数，用重载实现对不同类型的操作，还有就是可以在每种有 len()运算的类型中都要包含一个 len() 函数。 python选择的是第一种解决办法。类似的还有 str(arg) 函数，它把 arg 用 string 类型表示出来。
字符串中字符大小写的变换：
S.lower() #小写
S.upper() #大写
S.swapcase() #大小写互换
S.capitalize() #首字母大写
String.capwords(S)
#这是模块中的方法。它把 S 用 split()函数分开，然后用 capitalize() 把首字母变成大写，最后用 join() 合并到一起
S.title() #只有首字母大写，其余为小写，模块中没有这个方法
字符串在输出时的对齐：
S.ljust(width,[fillchar])
#输出 width 个字符，S 左对齐，不足部分用 fillchar 填充，默认的为空格。
S.rjust(width,[fillchar]) #右对齐
S.center(width, [fillchar]) #中间对齐
S.zfill(width) #把 S 变成 width 长，并在右对齐，不足部分用 0 补足
字符串中的搜索和替换：
S.find(substr, [start, [end]])
#返回 S 中出现 substr 的第一个字母的标号，如果 S 中没有 substr 则返回 -1。start 和 end 作用就相当于在 S[start:end] 中搜索
S.index(substr, [start, [end]])
#与 find() 相同，只是在 S 中没有 substr 时，会返回一个运行时错误
S.rfind(substr, [start, [end]])
#返回 S 中最后出现的 substr 的第一个字母的标号，如果 S 中没有 substr 则返回 -1，也就是说从右边算起的第一次出现的 substr 的首字母标号
S.rindex(substr, [start, [end]])
S.count(substr, [start, [end]]) #计算 substr 在 S 中出现的次数
S.replace(oldstr, newstr, [count])
#把 S 中的 oldstar 替换为 newstr，count 为替换次数。这是替换的通用形式，还有一些函数进行特殊字符的替换
S.strip([chars])
#把 S 中前后 chars 中有的字符全部去掉，可以理解为把 S 前后 chars 替换为 None
S.lstrip([chars])
S.rstrip([chars])
S.expandtabs([tabsize])
#把 S 中的 tab字符替换没空格，每个 tab 替换为 tabsize 个空格，默认是 8 个
字符串的分割和组合：
S.split([sep, [maxsplit]])
#以 sep 为分隔符，把 S 分成一个 list。maxsplit 表示分割的次数。默认的分割符为空白字符
S.rsplit([sep, [maxsplit]])
S.splitlines([keepends])
#把 S 按照行分割符分为一个 list，keepends 是一个 bool 值，如果为真每行后而会保留行分割符。
S.join(seq) #把 seq 代表的序列──字符串序列，用 S 连接起来
字符串的 mapping，这一功能包含两个函数：
String.maketrans(from, to)
#返回一个 256 个字符组成的翻译表，其中 from 中的字符被一一对应地转换成 to，所以 from 和 to 必须是等长的。
S.translate(table[,deletechars])
# 使用上面的函数产后的翻译表，把 S 进行翻译，并把 deletechars 中有的字符删掉。需要注意的是，如果 S 为 unicode 字符串，那么就不支持 deletechars 参数，可以使用把某个字符翻译为 None 的方式实现相同的功能。此外还可以使用 codecs 模块的功能来创建更加功能强大的翻译表。
字符串还有一对编码和解码的函数：
S.encode([encoding,[errors]])
# 其中 encoding 可以有多种值，比如 gb2312 gbk gb18030 bz2 zlib big5 bzse64 等都支持。errors 默认值为 "strict"，意思是 UnicodeError。可能的值还有 'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' 和所有的通过 codecs.register_error 注册的值。这一部分内容涉及 codecs 模块，不是特明白
S.decode([encoding,[errors]])
字符串的测试函数，这一类函数在 string 模块中没有，这些函数返回的都是 bool 值：
S.startwith(prefix[,start[,end]])
#是否以 prefix 开头
S.endwith(suffix[,start[,end]])
#以 suffix 结尾
S.isalnum()
#是否全是字母和数字，并至少有一个字符
S.isalpha() #是否全是字母，并至少有一个字符
S.isdigit() #是否全是数字，并至少有一个字符
S.isspace() #是否全是空白字符，并至少有一个字符
S.islower() #S 中的字母是否全是小写
S.isupper() #S 中的字母是否便是大写
S.istitle() #S 是否是首字母大写的
字符串类型转换函数，这几个函数只在 string 模块中有：
string.atoi(s[,base])
#base 默认为 10，如果为 0, 那么 s 就可以是 012 或 0x23 这种形式的字符串，如果是 16 那么 s 就只能是 0x23 或 0X12 这种形式的字符串
string.atol(s[,base]) #转成 long
string.atof(s[,base]) #转成 float
这里再强调一次，字符串对象是不可改变的，也就是说在python创建一个字符串后，你不能把这个字符中的某一部分改变。任何上面的函数改变了字符串后，都会返回一个新的字符串，原字串并没有变。其实这也是有变通的办法的，可以用 S=list(S) 这个函数把 S 变为由单个字符为成员的 list，这样的话就可以使用 S[3]='a' 的方式改变值，然后再使用 S=" ".join(S) 还原成字符串

python字符串操作

相关帖子

随便看看

python字符串操作