这篇文章主要介绍“怎么用js正则匹配html标签中的内容”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“怎么用js正则匹配html标签中的内容”文章能帮助大家解决问题。
一、正则表达式
是使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。
简单来说,是一种匹配字符串的方法,通过一些特殊符号,实现快速查找、删除、替换某个特定字符串。
二、匹配方法:replace()方法
参数为正则表达式,如果找到匹配时,返回匹配字符串的开始位置,否则,返回-1;不支持全文检索。
三、使用:匹配html标签中的内容
匹配html标签,例如"<p>xxx</p>"这种格式
获取html中的数据并预处理
private static Pattern HTML_TAG_PATTERN = Pattern.compile("<[a-zA-Z]+.*?>([\\s\\S]*?)</[a-zA-Z]*?>"); /** * 获取html中的数据 * @param htmlString * @return */ public static List<String> getResultsFromHtml(String htmlString) { List<String> results = new ArrayList<>(); // 数据预处理 htmlString = replaceStyle(removeBrTag(htmlString)); if (htmlString != null && htmlString.length() > 0) { Matcher imageTagMatcher = HTML_TAG_PATTERN.matcher(htmlString);
1、针对多个并列的标签的情况,对应正则表达式中的圆括号括起来的数据
while (imageTagMatcher.find()) { String result = ""; // group(1) result = imageTagMatcher.group(1).trim();
2、针对多个标签嵌套的情况进行处理
if (result != null && result.length() > 0) { result = replaceStartTag(result); } results.add(result); } } return results; }
关于“怎么用js正则匹配html标签中的内容”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注亿速云行业资讯频道,小编每天都会为大家更新不同的知识点。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。