Ryen's Blog

知识就是力量

Python爬虫编码格式问题GB2312转换utf8

在最近的图片爬虫中遇到的问题是:爬取网页得到的结果如下(部分) 里面的中文出现乱码。 <!DOCTYPE html> <html lang='zh-CN'> <head> <meta charset='gb2312'> <meta content='IE=edge' http-equiv='X-UA-Compatible'> <title>2017Äê