2010年9月
« 8    
 12345
6789101112
13141516171819
20212223242526
27282930  

UTF8与GBK转换函数

工作需要,自己写了一个UTF8与GBK转换函数,放在:[http://code.google.com/p/zzgan/downloads/list]
基本思路很简单,就用两个大数组:
UTF8 ->GBK
先从UTF8中解读出unicode值,再从数组中读出GBK值。
GBK->UTF8
直接以GBK的值为下标,查找数组中对应的UTF8值。
现在解决的问题:
1.可从UTF8转换到GBK编码
2.可对UTF8的编码格式作出判断,如某个UTF8不合要求或字节数不足,会自动跳过。
3.可从GBK编码转换到UTF8编码
未完成的问题:
1.计算字符串长度
2.在调用函数给要分配一定的缓存空间,如分配的空间不够大,会产生core down

字符编码简介:ASCII,Unicode,UTF-8,GB2312

字符编码简介:ASCII,Unicode,UTF-8,GB2312
1. ASCII码

我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和 1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号…

沪ICP备10001285号