Ryen's Blog

知识就是力量

Python爬虫编码格式问题GB2312转换utf8

在最近的图片爬虫中遇到的问题是：爬取网页得到的结果如下（部分）里面的中文出现乱码。 <!DOCTYPE html> <html lang='zh-CN'> <head> <meta charset='gb2312'> <meta content='IE=edge' http-equiv='X-UA-Compatible'> <title>2017Äê

Posted by Ryen's Blog on Thursday, March 4, 2021