如何判断文本文件编码

| |
[不指定 2006/03/01 23:31 | by ipaddr ]
根据不同编码的特点和标志,对一个文本文件判断编码方法如下
1 . UTF7 所有字节的内容不会大于127,也就是不大于&HFF
2 . UTF8 起始三个字节为"EF BB BF"
3 . UTF16BigEndian 起始三个字节为"FE FF"
4 . UTF16SmallEndian 起始三个字节为"FF FE"

注: BigEndian 和SmallEndian 表示存储方式的高位在前或者低位
   在前,高位在前叫BigEndian 反之叫SmallEndian

OS | 评论(0) | 引用(0) | 阅读(10073)