手抄报 安全手抄报 手抄报内容 手抄报图片 英语手抄报 清明节手抄报 节约用水手抄报

Python爬虫中的中文网址转译

时间:2024-10-22 03:20:49

、Python不支持中文, 它是解释性语言;解析器只支持 ascii 0 - 127爬取带有中文的网址, 会报错UnicodeEncodeError: 'ascii' codec can't encode characters in position 10-11: ordinal not in range(128)

工具/原料

python3.x

报错信息

1、执行代码

Python爬虫中的中文网址转译

2、报错信息

Python爬虫中的中文网址转译

3、网址里面包含了汉字ascii是没有汉字的需要进行url转译将包含汉字的网址进行转译

urllib.parse, string

1、在python3中, 用到2个转译模块: urllib.parse, string珑廛躬儆导入新的模块, 然后对网址进行转译, 这样才能正确识别

Python爬虫中的中文网址转译

2、运行以后, 查看输出结果"嫩滑" 这个中文被进行了转译

Python爬虫中的中文网址转译
© 手抄报圈