本篇内容介绍了“.NET Compact Framework中解码GB2312怎么实现”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
代码如下:
Imports System.Text Imports System.IO Module Module1Module Module1 Sub Main()Sub Main() Dim sr As New StreamReader("D:gb2312.txt") Dim fs As New FileStream("D:gb2312.dat", FileMode.Create) Dim sw As New BinaryWriter(fs) For i As Integer = 1 To 70 sr.ReadLine() Next Do Until sr.EndOfStream Dim ss As String() = sr.ReadLine.Split Dim HEX As Short = CShort(Val(ss(1).Replace("0x", "&H"))) Dim offset As Integer = (CInt(Val(ss(0).Replace("0x", "&H"))) - &H2121) * 2 sw.BaseStream.Position = offset sw.Write(HEX) Loop sw.Close() End Sub End Module
使用的时候将欲解码的GB2312编码减去0x8080,再减去0x2121(偏移),也就是说减去0xA1A1,然后将 FileStream.Position指向所得到的结果的2倍(两个字节一个码)并读取一个Int16就可以得到对应的Unicode码。下面是我在掌 心IP通中的一段代码。
public class GB2312ToUnicode { private FileStream fs; private BinaryReader br; public GB2312ToUnicode(string index) { fs=new FileStream(index, FileMode.Open); br = new BinaryReader(fs); } public char Convert(byte[] b) { int index = ((b[0] << 8) + b[1] - 0xa1a1)*2; fs.Position = index; int tmp = (int)br.ReadInt16() & 0xFFFF; return System.Convert.ToChar(tmp); } ~GB2312ToUnicode() { br.Close(); } }
这样就方便的得到了GB2312的解码器。
另外,如果打开GB2312.DAT文件可以看到,数据中有很多的0。本来可以通过重新计算偏移的方法来压缩数据,但是考虑到PocketPC上面的速度,尤其是要解码大量文本的时候,就只好用空间换取时间了。
“.NET Compact Framework中解码GB2312怎么实现”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。