编码集---解码和编码

18 篇文章 2 订阅
订阅专栏
13 篇文章 0 订阅
订阅专栏

一、字节串和字符串 

        字符是人类能够识别的符号,而这些符号要保存到计算的存储中就需要用计算机能够识别的字节来表示。

二、编码集

1. ASCII编码:

    127个字母 8个数据位足够存储字母、数字、符号,最大支持到0x7F

 

2. GB2312编码  

    每个汉字占据2个字节(高位和低位),16个数据。GB2312是对ASCII的中文扩展,共包含7000多个汉字。是计算机发展到中国后发展起来的编码,检测高位和低位,如果同时大于0x7F,则认为是GB2312,否则认为是ASCII编码

 

3. GBK(1995)和GB18030(2005/2000)

      每个汉字占据2个字节,由于汉字的数量太大,GB2312不能满足需求。GBK包括了GB2312的所有内容,
  同时增加了近20000个新的汉字(包括繁体)和符号 。只要求高位大于0x7F,低位可以小于0x7F,认为是中文。 
      >  国家标准GB18030-2000《信息交换用汉字编码字符集基本集的补充》是我国继GB2312-1980和

GB13000-1993之后最重要的汉字编码标准,包含多种我国少数民族文字,其中收入汉字70000余个。

 

4.Unicode编码 

        > 定长存储, 将所有语言都统一到一套编码集,通常使用2个字节,有的是4个字节。收录很全。

分为17个面,基本面采用2个字节,普通中文子也在基本面中,另外16个面是4个字节。

  不兼容ASCII码,即存储的时候,对ASCII码前面补0,导致存储的数据变大。

 

5. utf-8---变长存储

        > 国际标准组织(ISO)制定英文字符使用1个字节,沿用原来的ASCII码
        > 使用1~4个字节表示一个符号,中文存储使用3个字节(ascii码中的内容用1个字节保存\欧洲的字符
用2个字节保存\东亚的字符用3个字节保存\特殊符号用4个字节)
        > Unicode是内存编码表示方案(规范),而utf-8是如何保存和传输Unicode的方案(实现)
        > 优点:虽然内存汇总的数据都是Unicode,但当数据保存到磁盘或者用于网络传输时,使用utf-8会节省更
多的流量和硬盘空间。

如何判断几个字节表示一个字符:

每个字节添加识别位,其中高位识别位为4位,低位识别位为2位。判断高位字节开头有几个1,可以确定共有几个字节来表示一个字符。

 

6. utf-8和Unicode对应关系

utf-8去掉识别位,变成unicode

 

三、编码和解码

  •         编码 将字符转换为对应的二进制序列的过程叫做字符编码;
  •         解码 将二进制序列转换为对应的字符的过程叫做字符解码.

        

 

  • py文件的创建:

      文本编辑器在内容没有保存前,内容以编辑器默认编码形式保存在内存中。pycharm默认UTF-8,查看方法:

import sys
print(sys.getdefaultencoding())
  • py文件的编译:

        如果我们点击运行按钮或者在命令行运行该文件时,py解释器这个软件就会被调用,打开文件,然后解码存在磁盘上的bytes数据成unicode数据,这个过程和编辑器是一样的,不同的是解释器会再将这些unicode数据翻译成C代码再转成二进制的数据流,最后通过控制操作系统调用cpu来执行这些二进制数据,整个过程才算结束。       

#coding:utf8

         因为如果py2解释器去执行一个utf8编码的文件,就会以默认地ASCII去解码utf8,一旦程序中有中文,自然就解码错误了,所以我们在文件开头位置声明 #coding:utf8,其实就是告诉解释器,你不要以默认的编码方式去解码这个文件,而是以utf8来解码。而py3的解释器因为默认utf8编码,所以就方便很多了。

四、字符编码转换

        图片转载自云游道士的博客

 

Python基础-编码解码
weixin_30478757的博客
04-02 209
一、什么是编码 编码是指信息从一种形式或格式转换为另一种形式或格式的过程。 在计算机中,编码,简而言之,就是将人能够读懂的信息(通常称为明文)转换为计算机能够读懂的信息。众所周知,计算机能够读懂的是高低电平,也就是二进制位(0,1组合)。 而解码,就是指将计算机的能够读懂的信息转换为人能够读懂的信息。 二、 编码的发展渊源 之前的博客中已经提过,由于计算机最早在美国发明和使用,所以...
ASCII、Unicode、UCS-2、UTF-8互转编码原理
港城大白鲨
09-13 1395
Unicode的范围为 【0-0x10FFFF】,换算成10进制为【0-1114111】有0-1,114,112个字符,所以100多万个字符是足以支持世界上的任何语言的世界上存在着多种编码方式, 同一个二进制数字可以被解释成不同的符号. 因此, 要想打开一个文本文件, 就必须知道它的编码方式, 否则用错误的编码方式解读, 就会出现乱码.为什么电子邮件常常出现乱码?就是因为发信人和收信人使用的编码方式不一样.
浅谈编码
weixin_34015566的博客
02-01 609
一、名词解释在聊编码之前,我们先来了解一些名词解释:字符:所谓字符编码就是一个系统支持的所有抽象字符的合,也就是说我们平常使用的文字,标点符号,图形符号等都是字符。我们知道,计算机无法识别我们平时说的文字,只能识别二进制的数字系统,那么就需要一套规则,将我们所说的字符转换为数字系统,那么这种操作,就是字符编码。官方解释如下:字符编码:将符号转换为计算机可以接受的数字系...
编码
HMing的博客
11-04 183
public static final Charset US_ASCII = Charset.forName("US-ASCII"); public static final Charset ISO_8859_1 = Charset.forName("ISO-8859-1"); public static final Charset UTF_8 = Charset....
混合LSTM和编码器-解码器结构的图像伪造检测
02-19
本文提出了一种利用重采样特征、LSTM (Long-Short - Term Memory)单元和编码器-解码器网络分割操作区域和非操作区域的高置信度操作定位体系结构。重采样特性用于捕获JPEG质量损失、上采样、下采样、旋转和剪切等工件...
python3的url编码解码,自定义gbk、utf-8的例子
09-18
因此,在进行URL编码解码时,确保正确识别和使用正确的字符至关重要。 总结来说,Python 3提供了`urllib.parse`模块来进行URL编码解码,这在处理含有非ASCII字符的URL时非常有用。通过创建自定义的`Urlchuli`...
C#中的编码解码是如何实现的
最新发布
09-14
C#提供了强大的编码解码功能,使得处理不同字符编码格式变得简单。通过使用Encoding、Encoder、Decoder类以及适当的异常处理策略,可以确保数据在不同系统和应用程序之间的正确传输和显示。 在C#中,编码和...
ffmpeg-qt视频编码解码-macOS
08-14
FFmpeg 是一个强大的开源工具,用于处理音频和视频文件,包括编码解码、转换、流媒体等任务。在 macOS 系统上,FFmpeg 可以与 Qt 框架结合,为应用程序提供多媒体处理功能。Qt 是一个跨平台的应用程序开发框架,...
基于编码器-解码器模型的人群移动预测分析.pdf
11-22
该方法使用长短期记忆神经网络(LSTM)作为编码器和解码器,分别对历史轨迹和当前轨迹进行编码解码,以便更好地捕捉人群移动模式。 在该方法中,首先将每个用户的整个轨迹分成历史轨迹和当前轨迹两个部分。然后,...
Java中的ASCII、Unicode和UTF-8字符编码
iteye_7290的博客
11-06 161
http://page.renren.com/600882494/note/776248067?ref=hotnewsfeed&sfet=2012&fin=0&ff_id=600882494&feed=page_blog&tagid=776248067&statID=page_600882494_2&level=1     有Ja...
java基础知识(二)编码
m0_51053250的博客
05-12 455
编码 概述: 数据类型的时候有字符和字符串类型 两种类型代表了语言的文字,计算机不认识 文字,只认 识0和1,人为了计算机可以认识文字,给每一个文字字符设计了一个 十进制的数字编码。把编 码转换为二进制的数字给计算机进行识别存储。 编码:把文字转换为对应的数字存储到计算机中的过程叫编码【文字变数字】。 解码:把计算机中存储的数字取出来变为编码时对应的文字叫解码【数字变文 】。 编码:就是一个语言对应的数字编码的关系的合表 。 ASCII表 特殊字符的编码需要记忆: ASCII码表:最早期的纯英文的
汉字编码
core的博客
10-18 794
汉字编码
什么是编码解码
热门推荐
杨思默
04-02 1万+
举例说明
字符编码
学要致用的专栏
09-25 491
计算机中,数据存储是以二进制来存储的(bit),而人们所理解的常见的字符数据等都需要进行编码为二进制,因此边有了字符编码,不同字符编码合便构成了字符。Java编程过程中,常见的字符主要有:ASCII编码、ISO8859、GBK和Unicode编码。 ASCII编码 ASCII(美国信息互换标准代码)编码用一个字节(1byte=8bit)来表示字符,是现今最通用的单字节编码
编码解码
BlackEn ▪ Lee
12-31 323
编码解码
一文带你了解编码
hakesashou的博客
02-04 602
是计算机发展到中国后发展起来的编码,检测高位和低位,如果同时大于0x7F,则认为是GB2312,否则认为是ASCII编码。> 使用1~4个字节表示一个符号,中文存储使用3个字节(ascii码中的内容用1个字节保存\欧洲的字符用2个字节保存\东亚的字符用3个字节保存\特殊符号用4个字节)每个字节添加识别位,其中高位识别位为4位,低位识别位为2位。分为17个面,基本面采用2个字节,普通中文子也在基本面中,另外16个面是4个字节。不兼容ASCII码,即存储的时候,对ASCII码前面补0,导致存储的数据变大。
写文章

热门文章

  • 七层网络结构 56245
  • Python库: PrettyTable 模块 47330
  • Python - 经典程序示例 22935
  • Python中 各种数字类型的判别(numerica, digital, decimal) 12576
  • IPV4闪退 7903

分类专栏

  • Python基础 13篇
  • 吴恩达-斯坦福CS229机器学习课程笔记总结
  • 毕业
  • Preparatory class 10篇
  • Linux 6篇
  • Manjaro 4篇
  • 小知识 5篇
  • Python 18篇
  • 递归
  • 文件 1篇
  • 前端 5篇
  • SQL 6篇
  • 后端 1篇
  • 算法 2篇
  • C++ 4篇

最新评论

  • 编码集---解码和编码

    杨思默: 请问博主你是怎么锻炼自己能写出逻辑实现的呢?求指教

  • 编码集---解码和编码

    杨思默: 请问博主你是怎么锻炼自己能写出逻辑实现的呢?求指教

  • Python库: PrettyTable 模块

    pu_713: 表头怎么和下面数据对齐呀

  • Python库: PrettyTable 模块

    qq_52375137: 直接报错不能输出是这么回事from common.trainstation import train_stations # 静态车站信息编码表

  • Python中 各种数字类型的判别(numerica, digital, decimal)

    讲梦: 汉子哈哈哈哈哈哈哈

最新文章

  • 让虚拟环境识别pycaffe(ModuleNotFoundError: No module named 'caffe')
  • CSDN搬家到博客园
  • MongoDB 安装和配置
2019年1篇
2018年63篇

目录

目录

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家来宾玻璃钢雕塑作品商场美陈吊灯厂家电话无锡拉丝玻璃钢雕塑哪家专业北京玻璃钢蓝精灵雕塑信阳哪里有玻璃钢人物雕塑商场美陈生产厂家玻璃钢艳后雕塑定制四川季节性商场美陈供货商重庆个性化玻璃钢雕塑图片米老鼠玻璃钢雕塑南京商场大型美陈环保玻璃钢雕塑销售厂家武汉玻璃钢动物雕塑玻璃钢造型雕塑哪吒鹤壁发光玻璃钢雕塑商家电话路边圆形玻璃钢花盆玻璃钢雕塑设计哪家便宜北京商场主题创意商业美陈公司价值观玻璃钢彩绘雕塑定制玻璃钢泡沫雕塑商场美陈布置图片素材商场夏季美陈布置图合浦玻璃钢雕塑价格宁波玻璃钢金属雕塑设计江西创意玻璃钢雕塑优势季节性商场美陈批发欧式花盆白色玻璃钢花盆商场美陈氛围包装原则重庆渝北玻璃钢雕塑郑州铸铜玻璃钢彩绘雕塑定做香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化