本文章向大家介绍使用Java怎么将String字符串和Unicode字符进行转换,主要包括使用Java怎么将String字符串和Unicode字符进行转换的使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
Java是一门面向对象编程语言,可以编写桌面应用程序、Web应用程序、分布式系统和嵌入式系统应用程序。
字符串转换unicode java方法代码片段:
/** * 字符串转换unicode * @param string * @return */ public static String string2Unicode(String string) { StringBuffer unicode = new StringBuffer(); for (int i = 0; i < string.length(); i++) { // 取出每一个字符 char c = string.charAt(i); // 转换为unicode unicode.append("\\u" + Integer.toHexString(c)); } return unicode.toString(); }
unicode转换字符串java方法代码片段:
/** * unicode 转字符串 * @param unicode 全为 Unicode 的字符串 * @return */ public static String unicode2String(String unicode) { StringBuffer string = new StringBuffer(); String[] hex = unicode.split("\\\\u"); for (int i = 1; i < hex.length; i++) { // 转换出每一个代码点 int data = Integer.parseInt(hex[i], 16); // 追加成string string.append((char) data); } return string.toString();
结合正则实现的代码:
混有普通字符的Unicode转换为字符串:
/** * 含有unicode 的字符串转一般字符串 * @param unicodeStr 混有 Unicode 的字符串 * @return */ public static String unicodeStr2String(String unicodeStr) { int length = unicodeStr.length(); int count = 0; //正则匹配条件,可匹配“\\u”1到4位,一般是4位可直接使用 String regex = "\\\\u[a-f0-9A-F]{4}"; String regex = "\\\\u[a-f0-9A-F]{1,4}"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(unicodeStr); StringBuffer sb = new StringBuffer(); while(matcher.find()) { String oldChar = matcher.group();//原本的Unicode字符 String newChar = unicode2String(oldChar);//转换为普通字符 // int index = unicodeStr.indexOf(oldChar); // 在遇见重复出现的unicode代码的时候会造成从源字符串获取非unicode编码字符的时候截取索引越界等 int index = matcher.start(); sb.append(unicodeStr.substring(count, index));//添加前面不是unicode的字符 sb.append(newChar);//添加转换后的字符 count = index+oldChar.length();//统计下标移动的位置 } sb.append(unicodeStr.substring(count, length));//添加末尾不是Unicode的字符 return sb.toString(); }
完整代码:
package util; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * * <p>Title: String 与 Unicode 互相转换的工具类</p> * <p>Description: </p> * <p>Company: SCAU@Copyright</p> * @Copyright 1.0 * @author jodenhe (824923282@qq.com) * @version 1.0 * @since 2017年8月17日 下午9:42:50 */ public class StringUnicodeUtil { /** * 含有unicode 的字符串转一般字符串 * @param unicodeStr 混有 Unicode 的字符串 * @return */ public static String unicodeStr2String(String unicodeStr) { int length = unicodeStr.length(); int count = 0; //正则匹配条件,可匹配“\\u”1到4位,一般是4位可直接使用 String regex = "\\\\u[a-f0-9A-F]{4}"; String regex = "\\\\u[a-f0-9A-F]{1,4}"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(unicodeStr); StringBuffer sb = new StringBuffer(); while(matcher.find()) { String oldChar = matcher.group();//原本的Unicode字符 String newChar = unicode2String(oldChar);//转换为普通字符 // int index = unicodeStr.indexOf(oldChar); // 在遇见重复出现的unicode代码的时候会造成从源字符串获取非unicode编码字符的时候截取索引越界等 int index = matcher.start(); sb.append(unicodeStr.substring(count, index));//添加前面不是unicode的字符 sb.append(newChar);//添加转换后的字符 count = index+oldChar.length();//统计下标移动的位置 } sb.append(unicodeStr.substring(count, length));//添加末尾不是Unicode的字符 return sb.toString(); } /** * 字符串转换unicode * @param string * @return */ public static String string2Unicode(String string) { StringBuffer unicode = new StringBuffer(); for (int i = 0; i < string.length(); i++) { // 取出每一个字符 char c = string.charAt(i); // 转换为unicode unicode.append("\\u" + Integer.toHexString(c)); } return unicode.toString(); } /** * unicode 转字符串 * @param unicode 全为 Unicode 的字符串 * @return */ public static String unicode2String(String unicode) { StringBuffer string = new StringBuffer(); String[] hex = unicode.split("\\\\u"); for (int i = 1; i < hex.length; i++) { // 转换出每一个代码点 int data = Integer.parseInt(hex[i], 16); // 追加成string string.append((char) data); } return string.toString(); } public static void main(String[] args) { String str = "abc"; String str2 = string2Unicode(str); System.out.println(str2); System.out.println(unicodeStr2String(str2)); System.out.println(unicodeStr2String("\\u61HJ\\u62\\u63(sfkfdsl)")); } }
代码运行结果图:
重要代码讲解:
代码的实现其实很简单,因此只对核心主要代码进行讲解,如对代码有疑惑可私信或留下评论!
1、正则匹配规则:
String regex = \\\\u[a-f0-9A-F]{1,4};
这个是正则匹配的规则,可能你会疑惑为什么使用“\\\\u”来匹配javan字符串的“\\u”,原因很简单,因为这样才匹配得上嘛(开个玩笑)直接看测试图1-2
测试图1:
测试图2:
很明显在菜鸟上使用两种匹配方式匹配到的结果是不同的,而java字符串需要转义,上图的“\u”java就应该是“\\u”,因此就要使用“\\\\u”来进行匹配!
[a-f0-9A-F]{1,4}
”[a-f0-9A-F]“ :这个意思就是a到f,0到9,A到F出现的数都符合要求,“{1,4}”意思是前面的字符出现1到4个(其实一般的Unicode都是“\u”后面家4个字符的,如“\u0061”代表“a”,因此该式子可改为“\\\\u[a-f0-9A-F]{4}”,这样可能更符合实际要求)
到此这篇关于使用Java怎么将String字符串和Unicode字符进行转换的文章就介绍到这了,更多相关的内容请搜索亿速云以前的文章或继续浏览下面的相关文章希望大家以后多多支持亿速云!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。