python逐个遍历字符串(含汉字)

s = "中国china"for j in s:print j首先一个，你这个’a’是什么编码？可能不是你所想的gbk>>> a='中国'>>> a这样试试看，如果出来是6个字（word)，说明是utf-8，如果是4个字，说明gbk。另外，不管是utf-8还是gbk，都不能这样遍历，因为这里它会

曹显顺

22528人浏览 · 2018-08-11 20:13:55

曹显顺 · 2018-08-11 20:13:55 发布

s = "中国china"
for j in s:
    print j

首先一个，你这个’a’是什么编码？可能不是你所想的gbk

>>> a='中国'
>>> a

这样试试看，如果出来是6个字（word)，说明是utf-8，如果是4个字，说明gbk。
另外，不管是utf-8还是gbk，都不能这样遍历，因为这里它会一个字一个字拿出来。虚拟机把a当成一个长度为len(a)的字符串了。
接下来是遍历问题。
linux的shell大都默认是utf-8，所以一个中文字符是三个字，所以要三个三个地读，你可以试下：

>>> a[:3]

出来就是个”中”字
windows的command的默认是cp936，也就是gbk，一个中文字符是两个字，所以两个字两个字地读(a[:2])。

还有另一种遍历的方法，把字符串转换成unicode，这样中文英文都是一个字，就可以用你的for i in a的方法遍历了。这个的好处是中文英文字符都是一个字，而utf-8和gbk里，英文字母只占一个字。

s = u"中国china"
for j in s:
    print j

输出如下：

中
国
c
h
i
n
a

华为开发者空间

华为开发者空间，是为全球开发者打造的专属开发空间，汇聚了华为优质开发资源及工具，致力于让每一位开发者拥有一台云主机，基于华为根生态开发、创新。

更多推荐

华为“行业AI应用创新孵化营”走进中国医科大学，共探人才培养新模式

华为开发者空间

拦截烂SQL，解读GaussDB(DWS)查询过滤器过滤规则原理

华为开发者空间

深化产教融合协同创新，华为云HCSD校园沙龙走进山西职业技术学院

华为开发者空间

所有评论(0)

查看更多评论

曹显顺

@iceshu123

已为社区贡献1条内容