GB2312中的汉字编码规则 2008-07-26 21:56:10 标签:GB2312 汉字编码规则 休闲 职场 01-09区为特殊符号。
16-55区为一级汉字,按拼音排序。 56-87区为二级汉字,按部首/笔画排序。
每个汉字及符号以两个字节来表示。第一个字节称为“高位字节”,第二个字节称为“低位字节”。
“高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。 例如“啊”字在大多数程序中,会以0xB0A1储存。
(与区位码对比:0xB0=0xA0+16,0xA1=0xA0+1)。 在附送你个 GB2312 编码表。
(1)二进制、十进制和十六进制等常用数制及其相互转换: 由于计算机的存储器和寄存器是两态部件,所以各种信息在计算机中是以二进制的方式存储和计算的。
数制是由基数和基数个不同的数码组成的。 BCD码:十进制的二进制表示, 0:0000 1:0001 2:0010 3:0011 4:0100 5:0101 6:0110 7:0111 8:1000 9:1001 十进制的202可以表示成BCD码为0010 0000 0010; 十六进制 二进制:十六进制表示法是用16位二进制数字组成的,每4位二进制数字表示一位十六进制数,十六进制的数字表示从0-9,A,B,C,D,E,F共十六个字符。
十六进制与二进制相互转换就是一位十六进制字符与四位二进制数字的相互转换过程。 十进制 二进制:十进制向二进制转换分两步进行:首先把该数的整数部分和小数部分转换为二进制数;然后再把这两部分合并起来即可。
十进制的整数部分向二进制转换是通过对十进制不断的除2取余数得到,十进制小数部分通过乘2取整的方法获得,直到小数部分为0,所得到的整数部分就形成了二进制编码;同样的,二进制向十进制转换如下所示: 十进制数 N=(RnRn-1。 。
R1R0R-1。
R-m) = Rn *2n+Rn-1*2n-1+。
+R1*2+R0+R-1*2-1。
R-m*2-m 八进制 二进制:二进制向八进制转换的方法是从小数点开始分别向左右每3位二进制数编成一组,若不够3位,则小数点左侧的最高位和右侧的最低位用0补充,每一组用对应的八进制的数码表示即可;八进制向二进制转换的方法是从小数点开始,把每一位八进制的数码转换成对应的3位二进制即可。 其小数点左侧的最高位或右侧的最低位的0可以省去。
⑵ 计算机中的二进制数运算方法: 1.定点数运算:要判断是否溢出?( ) 加法:[X+Y]=([X]补+[Y]补) MOD 2 减法:[X-Y]=([X]补+[-Y]补)MOD 2 乘法: 采用原码比较方便,使用原码一位乘法来求两个定点数的乘积。 运算规则为: 乘积的符号位等于乘数和被乘数的符号位进异或; 乘积的值等于两数绝对值之积,即乘数和被乘数的绝对值进行移位相加; 除法: 采用原码比较方便。
运算规则为: 商的符号位同定点数原码乘法的处理方法,由两数的符号位进行异或 两数的绝对值部分进行相除。 2. 浮点运算 1) 加减法: a) 对阶 b) 尾数进行加、减运算 c) 规格化 d) 舍入 e) 溢出判断 2) 乘除法: 浮点相乘,其积的阶码为两数阶码相加,积的尾数为两尾数相乘。
浮点数相除,其商的阶码为两数阶码之差,商的尾数为两尾数相除。 其结果都需要进行规格化处理,同时还需要进行溢出判断。
⑶ 逻辑代数的基本运算和逻辑表达式的化简: 逻辑表达式就是以逻辑运算符把若干逻辑变量连接在一起表示某种关系的表达式。一个逻辑函数往往有多种不同的表达式。
可以利用其本逻辑运算规律和一些常用的逻辑恒等式对逻辑表达式进行合并项、吸收项、配项、消去项等操作来化简。 基本的逻辑运算有“与”、“或”、“非”、“异或”。
常用的逻辑运算公式: 交换律:A+B=B+A A*B=B*A 结合律:A+(B+C)=(A+B)+C 分配律:A*(B+C)=A*B+A*C A+(B*C)=(A+B)*(A+C) 反演律:A+B= A * B 重叠律:A+A=A A*A=A 互补律:A+ A =1 A* A =0 对合律: A =A 0-1律:0+A=A A*A=0。
在计算机硬件中,编码(coding)是在一个主题或单元上为数据存储,管理和分析的目的而转换信息为编码值(典型的如数字)的过程。
在软件中,编码意味着逻辑地使用一个特定的语言如C或C++来执行一个程序字符编码:使用二进制数对字符进行的编码称字符编码。 ASCII码:美国标准信息交换码的英文简称,是计算机中用二进制表示字母、数字、符号的一种编码标准。
ASCII码有两种,使用7位二进制数的称为基本ASCII码;使用8位二进制数的称为扩展ASCII码。 汉字编码:用于表示汉字字符的二进制字符编码。
汉字编码根据其用途不同可分为输入码、内部码、字型码和地址码等。
计算机常用的信息编码有文字编码、语义编码、电子编码、PCM编码、神经编码等。
一、文字编码
文字编码(Text encoding)使用一种标记语言来标记一篇文字的结构和其他特征,以方便计算机进行处理。
二、语义编码
语义编码(Semantics encoding),以正式语言乙对正式语言甲进行语义编码,即是使用语言乙表达语言甲所有的词汇(如程序或说明)的一种方法。
三、电子编码
电子编码(Electronic encoding)是将一个信号转换成为一个代码,这种代码是被优化过的以利于传输或存储。转换工作通常由一个编解码器完成。
四、PCM编码
PCM脉冲编码调制是Pulse Code Modulation的缩写(又叫脉冲编码调制):数字通信的编码方式之一。主要过程是将话音、图像等模拟信号每隔一定时间进行取样,使其离散化,同时将抽样值按分层单位四舍五入取整量化,同时将抽样值按一组二进制码来表示抽样脉冲的幅值。
五、神经编码
神经编码(Neural encoding)是指信息在神经元中被如何描绘的方法。
声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
蜀ICP备2020033479号-4 Copyright © 2016 学习鸟. 页面生成时间:3.061秒