• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

HTML字符Java转义和amp;nbsp|和amp;quot|和amp;amp|和amp;lt|和amp;gt等

武飞扬头像
cbigchaos
帮助1

清洗数据时,发现数据中有一些HTML未转义的字符。需要先将其转义,在看这些符号是过滤还是保留。于是就找到了这个StringEscapeUtils工具类,这边记录一下。

StringEscapeUtils是在java.commons.lang3的2.0版本中加入的工具类,在3.6版本中被标注为@Deprecated,表明在之后的版本中则为过时状态,之后StringEscapeUtils类被移到java.commons.text包下。

功能用途

StringEscapeUtils的主要功能就是为Java,JavaScript,HTML,XML进行转义与反转义。

  • escapeJava(String input) / unescapeJava(String unionCodeString)
    将输入字符串转为unicode编码 / 将unicode字符串转为Utf-8格式的字符串
  • escapeHtml4(String input) / unescapeHtml4(String input)
    转义/反转义html脚本
  • escapeEcmaScript(String input) / unescapeEcmaScript(String input)
    转义/反转义js脚本
  • escapeXml(String input) / unescapeXml(String input)
    转义/反转义xml脚本

我这边主要使用的是HTML的转义

标题引入依赖

<!-- https://mvnrepository.com/artifact/org.apache.commons/commons-lang3 -->
        <dependency>
            <groupId>org.apache.commons</groupId>
            <artifactId>commons-lang3</artifactId>
            <!--选一个用的人多的版本-->
            <version>x.x</version>
        </dependency>

样例:


import org.apache.commons.lang3.StringEscapeUtils;

public class HtmlTest {
    public static void main(String[] args) {
        String str = "&nbsp;&quot;&amp;&lt;&gt;";
        System.out.println(StringEscapeUtils.unescapeHtml3(str));
    }
}

结果:
学新通

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanhgfaghg
系列文章
更多 icon
同类精品
更多 icon
继续加载