python 文本文件的编码格式:ASCII编码和UNICODE编码

189 篇文章 293 订阅
订阅专栏

欢迎关注博主 python老鸟 或 前往 『 Python自学网』, 从基础入门免费课程开始,逐步深入学习python全栈体系课程,适合新手入门到精通全栈开发。


免费专栏传送门:《 Python基础教程》

文本文件存储的内容是基于字符编码的文件,常见的编码有ASCII、UNICODE等

  1. Python2.x默认使用ASCII编码
  2. Python3.x默认使用UTF-8编码

一、ASCII编码和UNICODE编码

1.1》ASCII编码

ASCII编码可以说是最古老的编码了,是因为计算机最早是美国人发明的,美国人为了在计算机中使用自己的英语就制定了ASCII编码。

  1. 计算机中只有256个ASCII字符
  2. 一个ASCII在内存中占用一个字节的空间
  3. 8个0/1的排列组合方式一共有256种,也就是2**8

ASCCI编码只有256个字符,虽然可以涵盖26个英文,但是汉子有数以万计的字符,ASCII编码并不能满足我们,因此UNICODE编码诞生。

1.2》UNICODE编码

UTF-8编码格式:

  1. UTF-8是UNICODE编码的一种编码格式
  2. 计算机中使用1~6个字节表示一个UTF-8字符,涵盖了地球上几乎所有地区的文字
  3. 大多数汉子会使用3个字节表示


二、在Python2.x中如何使用中文

1、在python2.x文件的第一行增加以下代码,解释器会以UTF-8编码来处理Python文件

# *-* coding:utf8 *-*

提示:这种方式是官方推荐使用过的。

2、也可这样,=号两边不要空格

# coding=utf8

问题:

在python2.x中,即使指定了文件使用UTF-8的编码格式,但是在遍历字符串时,仍然会以字节为单位遍历字符串

答:

要能够正确的遍历字符串,在定义字符串时,需要在字符串的引导前增加一个小写字母u,告诉解释器这事一个unicode字符串(是使用UTF-8编码更是的字符串)

代码:这段代码在python2.x中汉子会出现很多符号

str = u"Python自学网"

for a in str:
    print(a)

代码优化:加u

# 引号前面的u告诉解释器这事一个utf-8编码格式的字符串
str = u"Python自学网"

for a in str:
    print(a)


三、万一Python3.x中不能读取文件里面的中文怎么办?

Python3.X 源码文件默认使用utf-8编码,所以可以正常解析中文,无需指定 UTF-8 编码。

python3查看默认编码:

模块:python3 sys.getdefaultencoding().py

作用:获取系统默认编码方式

代码:

import sys
print(sys.getdefaultencoding())

结果:utf-8

万一Python3.x中不能读取文件里面的中文怎么办?

解决:编写encoding=UTF-8

例如:

file = open("HELLO", encoding="UTF-8")

Python_文件编码
weixin_52073430的博客
09-15 819
1. 文本文件编码方式ASCLL和UTF-8 2. 怎么在Python 2.x使用文 3. Python 2.x 处理文字符串
PythonASCII
热门推荐
qq_43146264的博客
12-19 2万+
pythonASCII
Python应用—获得汉字的unicode编码
最新发布
weixin_55144746的博客
08-07 480
在编程有时需要获得汉字的unicode 16进制编码,比如正则达式。该小程序可以输入汉字后返回其Unicode编码,十分方便。
Python | 文本编码
hhhxykeke的博客
12-22 878
文本文件存储的内容是基于字符编码的文件,常见的编码ASCII码、UNICODE编码等 1、ASCII编码 一个ASCII编码在内存占用1个字节的空间,计算机只有256个ASCII字符 (2的8次方) 2、UNICODE编码 计算机使用1-6个字节来示一个UTF-8字符,涵盖了地球上几乎所有地区的文字 大多数汉字会使用3个字节标识 UTF-8是UNICODE的一种编码格式 <python2默认使用ASCIIpython3默认使用UNICODE> 如何在pyt..
Python----File 编码
Damys
02-23 369
乱码的原因 字符A,ASCII编码:01000001, Unicode编码00000000 01000001 字符A,ASCII编码:01000001, UTF-8编码01000001 一般读写 一般读取:文件(uncode)到电脑需要转为(utf-8) 一般写入:电脑(uncode)到文件需要转为(uncode) Python3 字符串默认使用unicode编码, 所以他支持国际...
C++宽字符类型wchar_t
Wangguang_的博客
09-20 1万+
C++宽字符类型wchar_t 传统的字符数据类型为char,占用一个字节,存放的数据内容为ASCII编码,最多可以存放255种字符,基本的英文以及常用字符都可以涵盖 随着计算机在国际范围内普及,大量使用其它语言的计算机用户也纷纷出现,传统的ASCII编码已经无法满足人们的使用,因此一种新的字符存放类型wchar_t应运而生 wchar_t为宽字符类型或双字符类型,它占用两个字节,因此能够存放更多的字符 wchar_t的使用实例如下所示: #include <iostream> using na
python 设置文件编码格式的实现方法
09-20
Python编程,文件编码格式的设置至关重要,特别是在处理包含非ASCII字符(如文)的文本时。Python 2和Python 3对待编码的方式有所不同。在Python 2,默认的源代码编码ASCII,而在Python 3,默认编码是...
Python字符串编码详解:ASCIIUnicode与UTF-8
首先,它解释了计算机处理文本的基本原理,即早期的计算机使用ASCII编码,该编码仅支持127个字符,包括大小写字母、数字和一些符号。ASCII编码每个字符占用1个字节,但无法满足处理如文等非拉丁字母语言的需求,...
python 读写文件包含多种编码格式的解决方式
09-18
Python编程,处理包含不同编码格式的文件是一项常见的任务,特别是当涉及到读取和合并来自不同来源的数据时。本文将详细介绍如何使用Python解决读写文件时遇到的多种编码格式问题。 首先,我们需要理解编码的...
Python字符编码详解:从ASCIIUnicode
1. ASCII编码是最早期的单字节编码,用于示英语和其他一些控制符号,占用1字节,共256个字符。ASCII编码最初仅使用了0-127的范围,后续的扩展如MBCS出现是为了处理非英文字符。 2. MBCS(Multi-Byte Character ...
python ASCII编码
CVAIDL的博客
04-24 1626
bytes >>> type(b'xxxxx') <class 'bytes'> >>> type('xxxxx') <class 'str'> bytes是byte的序列,而str是unicode的序列。 1、str 转换成 bytes 用 encode() 方法:(注意:这有个坑,str1.encode不加括号和加括号...
Python:文件、编码
qq_43494793的博客
11-03 196
文件 File 文件是用于存储数据的基本单位 文件通常用来长期存储数据 文件数据是以字节为单位进行顺序存储的 文件的操作流程 1. 打开文件 2. 读/写文件 3. 关闭文件 注: 任何的操作系统,一个应用程序同时打开文件的数量 有最大数限制 文件的打开函数 open(filename, mode='rt') 用于打开一个文件,返回 此用来操作此文件的文件流对象,...
python ascii
weixin_35748288的博客
07-05 211
Python相关视频讲解:python的or运算赋值用法用python编程Excel有没有用处?011_编程到底好玩在哪?查看python文件_输出py文件_cat_运行python文件_shel#render_0_2377194870-svg{font-family:"trebuchet ms",verdana,a...
chatgpt赋能pythonPython查看Unicode编码
reilust的博客
06-22 653
Unicode编码是一种用于示字符和文本的标准编码方式,包含了世界上所有语种所使用的字符。Unicode编码为每个字符分配了一个唯一的数字代码,这些代码可以示为十六进制值。Unicode编码记录了所有字符所对应的代码值及其相关信息。本文由chatgpt生成,文章没有在chatgpt生成的基础上进行任何的修改。以上只是chatgpt能力的冰山一角。作为通用的Aigc大模型,只是展现它原本的实力。对于颠覆工作方式的ChatGPT,应该选择拥抱而不是抗拒,未来属于“会用”AI的人。
Python——ASCII编码Unicode(UTF-8,UTF-16 和 UTF-32)编码
qq_45794091的博客
10-02 1179
Python——ASCII编码Unicode(UTF-8,UTF-16 和 UTF-32)编码
Python文本编码问题
lianghuihaoKing的博客
01-28 480
Python文本编码问题 使用Python读文件,有时会出现gbk,utf-8的编码格式读取都不对,可以按以下方法解决: 1.选择编码范围更广的gb18030 file = open('abc.txt',encoding='gb18030') 2.仍不能解决,可以使用‘ignore’属性进行忽略 file = open('abc.txt',encoding='gb18030',errors='i...
python文本编码总结
我乐飞的技术博客
08-17 282
日后完善
pythonunicode码是什么_pythonUnicode编码初探
weixin_39758041的博客
11-29 404
上一篇文章主要讨论了字符编码的不同方式,这一篇文章着重谈谈对python编码解码的理解。python2在python2主要有两种类型的字符类型,一个是str,一个是Unicode。平时我们默认操作的字符串类型是str,在字符串前面加一个u就是Unicode类型。这两个类型有相应的工厂方法:str()和unicode()上图的例子可以看出,unicode方法将传入的string,利用传入的en...
写文章

热门文章

  • PyCharm使用教程(详细版 - 图文结合) 204741
  • Python中while循环讲解【详细】 61373
  • python中 for...else【详细讲解】 50846
  • Python字典查找数据的5个操作方法 41705
  • 安装Ubuntu系统教程(图文结合-详细步骤) 40496

分类专栏

  • python基础教程 189篇
  • python模块 3篇
  • HTML & CSS 6篇

最新评论

  • 安装Ubuntu系统教程(图文结合-详细步骤)

    vesafe: 下一步

  • PyCharm使用教程(详细版 - 图文结合)

    gt.ao: 如何做到那么多图文内容,一句有用的没有的表情包

  • Python中while...else【详细讲解】

    励筶: 我理解成了任意一遍不真诚可以再道歉:z=0 i=1 while i<=5: new=input('道歉态度:') if new!=('真诚'): z+=1 i+=1 if new==('真诚'): i+=1 if new!=('真诚')and z>1: break else: print('hhh,媳妇原谅我了')

  • Python列表推导式(更有风格的Python代码写法)

    拉蕉蕉的奥德彪: 所以列表推导式 只有在需要append数据的时候,才可以用嘛

  • 安装Ubuntu系统教程(图文结合-详细步骤)

    Y_Y_C_U_L_T_J_X: 8》》 点击“内存”,设置参数为2048MB,——> 选择“新CD/DVD(SATA)”——> 选择“使用ISO镜像文件”——> 点击“浏览”,找到当时下载的Ubuntu镜像路径——>移除“USB控制器”和“打印机”,移除后点击“关闭”——>点击“完成”。 这一步的Ubuntu镜像咋整,没看到怎么下载Ubuntu镜像啊

最新文章

  • 【Python Pillow模块】 使用Pillow库中open()和new()方法创建Image对象(详细介绍)
  • 【Pillow模块】Python Pillow模块详细介绍
  • Python模块和包的介绍(模块含义、用模块好处、模块分类、包和模块的创建)
2023年2篇
2022年129篇
2021年67篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

王子玉博客

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或 充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家浙江玻璃钢海豚雕塑厂家固原玻璃钢雕塑定制山东玻璃钢动物雕塑艺术小品贵州玻璃钢动物雕塑艺术摆件雕塑翻了玻璃钢还能修改吗长春市玻璃钢雕塑公司标识玻璃钢雕塑定制广东玻璃钢花盆售价深圳玻璃钢卡通人物雕塑榆树玻璃钢雕塑厂家40公分高的玻璃钢人雕塑广安玻璃钢雕塑摆件施工团队徐州玻璃钢雕塑景观设计鞍山玻璃钢花盆花器玻璃钢牛梨田雕塑厂家广东商场创意商业美陈哪家好周口玻璃钢雕塑定做价格水母玻璃钢雕塑上海商场美陈装饰玻璃钢花盆厂家在哪儿郴州吉首玻璃钢雕塑价格商场环艺美陈国内雕塑什么时候用玻璃钢新疆库尔勒玻璃钢雕塑厂家不锈钢水景玻璃钢雕塑厂丹东玻璃钢雕塑制作厂家玻璃钢树雕塑北海玻璃钢雕塑排名汕尾户外景观玻璃钢雕塑商场情人节美陈方案香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化