python对utf-8的中文转换

python3默认支持utf-8，因此对于\uXXXX这种格式的中文，可以直接转换，但经常爬虫抓取回来的中文是\\uXXXX格式，因此需要进行转换s1='\u65f6\u4e0d\u53ef\u5931\uff0c\u65f6\u4e0d\u518d\u6765\uff01'print('s1=',s1)s2='\\u65f6\\u4e0d\\u53ef\\u5931\\uff0c\\u65f6\

追丰少年

140808人浏览 · 2022-05-19 11:33:10

追丰少年 · 2022-05-19 11:33:10 发布

python3默认支持utf-8，因此对于\uXXXX这种格式的中文，可以直接转换，但经常爬虫抓取回来的中文是\\uXXXX格式，因此需要进行转换

s1='\u65f6\u4e0d\u53ef\u5931\uff0c\u65f6\u4e0d\u518d\u6765\uff01'
print('s1=',s1)

s2='\\u65f6\\u4e0d\\u53ef\\u5931\\uff0c\\u65f6\\u4e0d\\u518d\\u6765\\uff01'
print('s2=',s2)

s3=s2.encode('utf-8').decode('unicode_escape')
print('s3=',s3)

s1= 时不可失，时不再来！
s2= \u65f6\u4e0d\u53ef\u5931\uff0c\u65f6\u4e0d\u518d\u6765\uff01
s3= 时不可失，时不再来！

华为云开发者联盟

为开发者提供学习成长、分享交流、生态实践、资源工具等服务，帮助开发者快速成长。

更多推荐

cover

如何基于香橙派AIpro对视频/图像数据进行预处理？

华为云开发者联盟

cover

HAS2024：华为云以系统性创新加速千行万业智能化升级

华为云开发者联盟

cover

数仓的两种轻量级数据交换格式：json与jsonb

华为云开发者联盟

所有评论(0)

查看更多评论

追丰少年

已为社区贡献13条内容