微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

最近更新

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 后端开发 > Python教程 > 正文

python 采集中文乱码问题的方法

高洛峰

发布： 2017-02-24 15:31:42

原创

1536人浏览过

近几日遇到采集某网页的时候大部分网页ok,少部分网页出现乱码的问题,调试了几日,终于发现了是含有一些非法字符造成的..特此记录

1. 在正常情况下..可以用

import chardet

thischarset = chardet.detect(strs)["encoding"]

登录后复制

来获取该文件或页面的编码方式

立即学习“Python免费学习笔记（深入）”；

或直接抓取页面的charset = xxxx 来获取

2. 遇到内容中有特殊字符时指定的编码一样会造成乱码..即内容中非法字符造成的,可以采用编码忽略非法字符的方式来处理.

MATLAB与VB混合编程技术研究 WORD版

MATLAB与VB混合编程技术研究 WORD版

本文档主要讲述的是MATLAB与VB混合编程技术研究；着重探讨了在VB应用程序中集成MATLAB实现程序优化的四种方法，即利用Matrix VB、调用DLL动态链接库、应用Active自动化技术和动态数据交换技术,并分析了集成过程中的关键问题及其基本步骤。这种混合编程实现了VB的可视化界面与MATLAB强大的数值分析能力的结合。希望本文档会给有需要的朋友带来帮助；感兴趣的朋友可以过来看看

MATLAB与VB混合编程技术研究 WORD版

0

MATLAB与VB混合编程技术研究 WORD版

strs = strs.decode("UTF-8","ignore").encode("UTF-8")

登录后复制

decode的第二个参数表示遇到非法字符时所采取的方式

该参数默认为抛出异常.

以上就是小编为大家带来的python 采集中文乱码问题的完美解决方法的全部内容了，希望对大家有所帮助，多多支持PHP中文网

更多python 采集中文乱码问题的方法相关文章请关注PHP中文网！

大家都在看：

Python 文件历史版本的保存与管理 python中doctest模块如何使用？ python中bytearray函数的作用是什么？ Python中如何编写辅助模块module？ python中global是什么意思？

python速学教程(入门到精通)

python速学教程(入门到精通)

python怎么学习？python怎么入门？python在哪学？python怎么学才快？不用担心，这里为大家提供了python速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

来源：php中文网

上一篇：Python黑帽编程 3.4 跨越VLAN 下一篇：20招让你的Python飞起来

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

实现一个 Java 版的 Redis

1970-01-01 08:00:00
Asp.net使用SignalR实现发送图片

1970-01-01 08:00:00
HTML5:使用Canvas实时处理Video

1970-01-01 08:00:00
最简单的微信小程序Demo

1970-01-01 08:00:00
Python构造自定义方法来美化字典结构输出

1970-01-01 08:00:00
html设置加粗、倾斜、下划线、删除线等字体效果示例介绍

1970-01-01 08:00:00
微信小程序：如何实现tabs选项卡效果示例

1970-01-01 08:00:00
微信小程序开发教程-App()和Page()函数概述

1970-01-01 08:00:00
python中pandas.DataFrame（创建、索引、增添与删除）的简单操作方法介绍

1970-01-01 08:00:00
详解python redis使用方法

1970-01-01 08:00:00

最新问题

Python yield 与异常传播的关系 yield是生成器内外交互的核心，可传递值和异常；通过throw()方法能将外部异常注入生成器并在yield处抛出，内部未捕获异常会向上传播并终止生成器，而close()会触发GeneratorExit用于清理资源。

2025-11-23 05:09:18

931

python中str内置函数总结归纳 Python字符串方法丰富，用于高效处理文本。1.大小写转换：upper()、lower()、capitalize()、title()、swapcase()实现字母格式调整；2.查找与判断：find()、index()、count()定位子串，startswith()、endswith()检查前缀后缀；3.去除与填充：strip()、lstrip()、rstrip()清理空白，center()、ljust()、rjust()、zfill()格式化对齐；4.分割与连接：split()、rsplit

2025-11-23 00:21:26

889

如何使用python中threadpool模块？答案是推荐使用concurrent.futures.ThreadPoolExecutor。Python标准库中无官方threadpool模块，常用的是concurrent.futures.ThreadPoolExecutor，支持submit提交任务和map批量处理，适用于I/O密集型任务，如网络请求，并发下载等，而第三方threadpool库已过时不推荐使用。

2025-11-22 23:59:35

976

python对象有几种类型 Python对象主要分为内置数据类型（如int、str、list、dict）、可变与不可变对象（如list可变，str不可变）、用户自定义类型（如class实例）及函数、模块等特殊对象，一切皆对象，可通过type()查看类型。

2025-11-22 23:57:05

461

python中缺少module怎么办？缺少module通常因未安装或环境不匹配，需用pip或conda安装并确保python与pip路径一致，使用python-mpipinstall可避免环境错乱，注意模块安装名与导入名可能不同。

2025-11-22 23:54:11

411

python delattr函数如何使用？ delattr用于删除对象属性，语法为delattr(object,name)，需传入对象和字符串形式的属性名；若属性不存在则抛出AttributeError，可配合hasattr检查避免异常；支持通过循环动态批量删除属性，适用于需动态调整对象结构的场景。

2025-11-22 23:54:11

366

Python中Operator计算函数 operator模块将Python操作符封装为函数，便于在高阶函数中使用。1.算术运算如add、sub对应+、-；2.比较运算如eq、lt对应==、

2025-11-22 23:53:02

660

Python 常见错误类型一览 Python错误分为三类：1.语法错误（如缺少冒号、括号不匹配）导致程序无法运行；2.运行时异常（如NameError、TypeError）在执行中触发，可用try-except捕获；3.逻辑错误（如条件写反、循环错误）不报错但结果错误，需仔细排查。

2025-11-22 23:51:06

871

python中如何用split()函数实现分割字符串？ split()用于将字符串按分隔符拆分为列表，默认以空白字符分割，语法为str.split(separator,maxsplit)，可指定分隔符和最大分割次数，不修改原字符串，返回新列表。

2025-11-22 23:49:02

460

python mmap()函数是什么？ mmap是内存映射文件的方法，通过将文件映射到虚拟内存，使程序能像操作内存一样读写文件。使用时需以二进制模式打开文件，调用mmap.mmap()创建映射，支持随机访问和修改，适用于大文件处理如日志分析、数据库索引等，可提升效率并节省内存。注意映射大小不超过文件长度，操作后及时关闭对象以防资源泄露。

2025-11-22 23:47:33

642

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部