当前位置: 首页 > news >正文

维护网站需要什么技术公司做网站主机是什么用途

维护网站需要什么技术,公司做网站主机是什么用途,手机网站的必要性,深圳推广公司网络爬虫过程中三种中文乱码的处理方案,希望对大家的学习有所帮助 一、思路 其实解决问题的关键点就是在于一点,就是将乱码的部分进行处理,而处理的方案主要可以从两个方面进行出发。其一是针对整体网页进行提前编码,其二是针对…

网络爬虫过程中三种中文乱码的处理方案,希望对大家的学习有所帮助

一、思路

其实解决问题的关键点就是在于一点,就是将乱码的部分进行处理,而处理的方案主要可以从两个方面进行出发。其一是针对整体网页进行提前编码,其二是针对局部具体中文乱码的部分进行编码处理。

二、分析

1、当出现网页编码为gbk,获取到的内容在控制台打印类似如下情况的时候:

ÃÀÅ® µçÄÔ×À ¼üÅÌ »ú·¿ ¿É°® С½ã½ã4k±ÚÖ½

虽然看上去控制台输出正常,没有报错, 但是输出的中文内容,却不是普通人能看得懂的。

2、当出现网页编码为gbk,获取到的内容在控制台打印类似

�װŮ�� ��Ů ˮ СϪ Ψ��
 这种情况下的话,就可以通过使用本文给出的三种方法进行解决,屡试不爽!

三、具体实现

1)方法一:将requests.get().text改为requests.get().content
我们可以看到通过text()方法获取到的源码,之后进行打印输出的话,确实是会存在乱码的,如下图所示。
在这里插入图片描述
此时可以考虑将请求变为.content,得到的内容就是正常的了。
在这里插入图片描述
2)方法二:手动指定网页编码
#手动设定响应数据的编码格式

response.encoding = response.apparent_encoding

如果觉得上面的方法很难记住,或者你可以尝试直接指定gbk编码也可以进行处理,如下图所示:
在这里插入图片描述 这个方法稍微复杂一些,但是比较好理解,对于初学者来说,还是比较好接受的。
如果觉得上面的方法很难记住,或者你可以尝试直接指定gbk编码也可以进行处理,如下图所示:
在这里插入图片描述
上面介绍的两种方法都是针对网页进行整体编码,效果显著,接下来的第三种方法就是针对中文局部乱码部分使用通用编码方法进行处理。

3)方法三:使用通用的编码方法

img_name.encode('iso-8859-1').decode('gbk')

在这里插入图片描述

http://www.yayakq.cn/news/86447/

相关文章:

  • 江西住房和城乡建设信息网站十天学会网站建设
  • 怎样注册网站卖东西新公司如何做推广
  • 国外设计网站导航重庆市建设工程信息网络
  • 咋自己做网站世界著名办公室设计
  • 昆山公司网站建设昆明网站设计制作公司
  • ui的含义网站建设伪静态网站
  • 靖江建设局网站国家信用信息公示系统官网山东
  • 哪里有网站模板下载中秋节ppt模板免费下载
  • 中信建设有限责任公司年报南宁百度seo
  • 相亲网站排名前十名榆林网站建设公司电话
  • 做开发房地产网站可行吗广告制作公司属于什么行业类别
  • 保健品网站源码互联网装饰网站
  • 做网站视频的赚钱吗好看的网站页面
  • 营销型网站建设菲凡网2024年还会有新冠吗
  • 2018年做网站赚钱做照片的网站
  • 公司网站一年费用建设互联网站机房需要哪些设备
  • 电商网站策划阿里巴巴外贸圈
  • 关系建设的网站wordpress固定链接标签加上页面
  • 昆明云南微网站搭建郸城建设银行网站
  • 有一个网站叫浪什么网络广告的发布方式包括
  • 个人网站开发与实现开题报告百度站长平台网站提交
  • 宿豫网站建设制作打开一个网站
  • mip网站设计网站案例展示
  • 响应式中文网站模板网站开发外包计入什么科目
  • 阿里云怎样做公司网站wordpress wp_editor
  • 合肥网站维护公司国内可用的免费云端服务器
  • 学徒制下的课程网站建设市场营销策划ppt免费模板
  • icp备案网站名称是什么意思云南百度小程序开发公司
  • 上海网站推广优化公司江苏省城乡建设厅网站
  • 网站后台有哪些南通市城乡和住房建设局网站