汉字转unicode 汉字转换unicode转换器
易语言汉字转unicode源码,谁给我个!!!
.版本 2
.支持库 commobj
.子程序 _按钮1_被单击
编辑框2.内容=字节集到十六进制文本(A2W(编辑框1.内容))
.子程序 A2W,字节集
.参数参数_Ansi文本,文本型
.参数参数_代码页,整数型,可空,默认为:#CP_ACP= 0
.局部变量局部_Ansi长度,整数型
.局部变量局部_Unicode长度,整数型
.局部变量 ret,字节集
局部_Ansi长度=取文本长度(参数_Ansi文本)+ 1
局部_Unicode长度= MultiByteToWideChar(参数_代码页, 0,参数_Ansi文本,局部_Ansi长度, ret, 0)× 2
ret=取空白字节集(局部_Unicode长度)
.如果真(MultiByteToWideChar(参数_代码页, 0,参数_Ansi文本,局部_Ansi长度, ret,局部_Unicode长度)= 0)
返回({ 0, 0})
.如果真结束
返回(ret)
.子程序字节集到十六进制文本,文本型
.参数字节集,字节集
.局部变量变量,整数型
.局部变量临时文本,文本型
.局部变量长度,整数型
.局部变量文本,快速文本对象
.局部变量 a,整数型
长度=取字节集长度(字节集)
.计次循环首(长度,变量)
临时文本=取十六进制文本(字节集 [变量])
文本.添加(“”)
文本.添加(取重复文本(2-取文本长度(临时文本),“0”))
文本.添加(临时文本)
.如果真(变量% 16= 0)'一行显示16字节
文本.添加(#换行符)
.如果真结束
处理*()
.计次循环尾()
返回(文本.取文本(,))
.DLL命令 MultiByteToWideChar,整数型,”kernel32.dll”,”MultiByteToWideChar”,,将多媒体字符串映像为通配字符串
.参数代码页,整数型
.参数标志,整数型
.参数双字节文本,文本型
.参数双字节文本长度,整数型
.参数宽字符文本,字节集
.参数宽字符文本长度,整数型
易语言汉字转换成unicode编码10进制
.版本 2
.支持库 ePY
.子程序取汉字区位码,文本型
.参数 _字,文本型,,只取第一个字
.局部变量高字节,整数型
.局部变量低字节,整数型
.局部变量区码,整数型
.局部变量位码,整数型
.如果真(取字符串长度(_字)= 0)
返回(“0”)
.如果真结束
高字节=位与(取代码(_字, 1), 255)
低字节=位与(取代码(_字, 2), 255)
区码=高字节- 160
位码=低字节- 160
返回(到文本(区码× 100+位码))
utf8转换成unicode的方法
这里以txt文件中的汉字为例,介绍文本编辑器如何显示汉字的过程:
1.二进制(文件,你可以把一个文件理解为一串1+0构成的内容.也可以叫落地码编码的内容)——
2.通过落地码识别出每个字符(落地码,就是utf-8/utf-16/gbk这一类编码,它们能够将连续的1/0组成的数字串切割(解码过程)成能n个小块(块的长度不一定相同!),每块表示一个字符(一个汉字).而如何切割,就是这一类编码的意义所在,具体参考每个编码定义)——
3.每个小块转成对应的unicode值(unicode也是一种码,他是用来区分字符和字符之间的唯一性.即每一个不同的字符的unicode都是不同的.它一般有固定的长度.从落地码转成unicode码,有固定的对应关系,具体参考落地码的编码规范)——
4.每个unicode值映射到字体库中对应的文字图案()——
5.读取并显示含有文字的图片
注:
从2开始,每取下一个块,就可以立即执行345,或者取特定个之后再一起执行345.
英文也可以参照这个过程,只是比中文更加简单,比如2的时候,每一个英文字符的块长都是一样的.
一个文件只能有一种落地码,并且编辑器需要知道这个落地码是哪一个码.如果不匹配,就会看到所谓的乱码.也不是说一定只能一种码…除非你知道你在搞什么..
落地码无处不在.比如windows系统的默认编码,这个会影响你的粘帖板.有时候粘帖板中也会包含字体信息.
特别要注意的是, unicode其实也算是一种落地码,只是现在一般用的不多.当作为落地码时,格式有ucs-2/ucs-4这两种.比如windows记事本保存的时候有unicode选项,它默认是ucs-2.
如果有错误的地方忘指出,谢谢!
附上两个工具:
unicode查询-网页链接
utf8转二进制等-网页链接
如何将汉字转换为10位unicode编码
unicode编码不需要转换成汉字,因为unicode就是和字符关联的终极编码。
windows中只有unicode码可以和字符直接关联,也就是使用国际标准的unicode字符集。
中文windowsXp默认的内码是gbk(装过gb18030补丁的话也就变成gb18030),日文系统就是JIS,不同语言版本的windows都有不同的默认内码,这是每个*的标准化管理局规定的。
然后就是页码表的概念,所谓页码表就是把一个用系统默认编码(比如gbk,gb2312)表示的字符映射到对应unicode编码,而每个unicode编码对应着唯一确定的字符。这样就完成了地域性编码到国际标准码再到字符的对应关系。
在控制面板->区域和语言选择->高级,里面可以看到window提供的所有页码表。
Word将汉字转换成为Unicode码
①汉字转换成为Unicode字符编码
首先选择汉字,然后切换到英文输入法状态,按下下列组合键即可。
Alt+X
青山的“青”字,选中该“青”字以后,按下Alt+X,即可得到9752,这就是该字所对应的Unicode字符编码
②将Unicode字符编码转换为汉字
同样,按下下列组合键即可。
Alt+X
比如,选中Unicode字符编码9752,按下Alt+X,即可得到汉字“青”字。
本文链接:http://www.ahdhgm.com/html/87965326.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件举报,一经查实,本站将立刻删除。