信息编码表示

阅读量: 128 编辑

计算机要处理的数据除了数值数据以外,还有各类符号、图形、图像和声音等非数值数据。

而计算机只能识别两个数字(1和0)。要使计算机能处理这些信息,首先必须将各类信息转换成“0”和“1”表示的代码,这一过程成为编码。

1、基本概念

数据存储

比特(Bit:二进制数位)是指1位二进制的数码(即0或1)。比特是计算机中表示信息的数据编码中的最小单位。

字节:字节表示被处理的一组连续的二进制数字。通常用8位二进制数字表示一个字节,即一个字节由8个比特组成。

字符的表示

字符是人与计算机交互过程中不可缺少的重要信息。要使计算机能处理、存储字符信息,首先也必须用二进制“0”和“1”代码对字符进行编码(键盘上的都是字符)。下面以西文字符和汉字字符为例,介绍常用的编码标准。

1574824885354528.png

2、ASCII编码

全称叫美国国家信息交换标准代码(American StandardCode for Information Interchange)。

ASCII编码是由美国国家标准委员会制定的一种包括数字、字母、通用符号和控制符号在内的字符编码集。

ASCII码是一种7位二进制编码,能表示27=128种国际上最通用的西文字符,是目前计算机中,特别是微型计算机中使用最普遍的字符编码集。

ASCII码是一种7位编码,它存时必须占全一个字节,即占用8位。

ASCII编码包括4类最常用的字符

  • 数字“0”~“9”。ASCII 编码的值分别为 0110000B ~ 0111001B ,对应十六进制数为 30H~39H

  • 26个英文字母。大写字母“A”~“Z”的ASCII编码值为 41H~5AH,小写字母“a”~“z”的 ASCII编码值为 61H ~ 7AH

  • 通用符号。如“+”、“-”、“=”、“*”和“/”等共32个。

  • 控制符号。如空格符和回车符等共34个。

3、内码和外码

内码: 对于输入计算机的文本文件,机器是存储其相应的字符的ASCII码(用一个ASCII码存储一个字符需8个二进制位,即一个字节),这些可被计算机内部进行存储和运算使用的数字代码称内码。如输入字符“A”,计算机将其转成内码65后存于内存。

外码: 计算机与人进行交换的字形符号称为外码,如字符"A"的外码是"A"。通常一个西文字符占一个字节(半角),一个中文字符占二个字节。

4、汉字信息编码

汉字交换码 是指不同的具有汉字处理功能的计算机系统之间在交换汉字信息时所使用的代码标准。国家标准GB2312-80公布以来,我国一直延用该标准所规定的国标码作为统一的汉字信息交换码(GB5007-85图形字符代码)。

GB2312-80标准包括了6763个汉字,按其使用频度分为一级汉字3755个和二级汉字3008个。一级汉字按拼音排序,二级汉字按部首排序。该标准还包括标点符号、数种西文字母、图形、数码等符号682个。

字形存储码 是指供计算机输出汉字(显示或打印)用的二进制信息,也称字模。通常,采用的是数字化点阵字模。

1574825006989344.png

一般的点阵规模有16×16,24×24等,每一个点在存储器中用一个二进制位(bit)存储。在16×16的点阵中,需要8 bit ×32 的存储空间,需32字节的存储空间。在相同点阵中,不管其笔划繁简,每个汉字所占的字节数相等。

爱码岛编程公众号
微信扫码关注
爱码岛编程小程序
微信扫码打开
苏ICP备13052010号
©2023 南京匠成信息科技有限公司