标签:jtextpane character-encoding utf-8 html-entities java
我使用JTextPane作为简单的html编辑器.
jtp=new JTextPane();
jtp.setContentType("text/html;charset=UTF-8");
jtp.setEditorKit(new HTMLEditorKit());
当我调用jtp.getText()时,我得到了漂亮的html代码,其中转义了所有特殊字符.但我不想转义国家字符(波兰语),而只希望使用&,<,>
当我进入编辑器时
<foo>ą ś &
我懂了
<foo>ą ś &
但我想得到
<foo>ą ś &
可能性如何?
解决方法:
不幸的是,那是不可能的.
javax.swing.text.html.HTMLWriter内部存在缺陷-对其进行了硬编码,以将非ASCII的任何符号转换为其数字表示形式:
default:
if (chars[counter] < ' ' || chars[counter] > 127) {
if (counter > last) {
super.output(chars, last, counter - last);
}
last = counter + 1;
// If the character is outside of ascii, write the
// numeric value.
output("&#");
output(String.valueOf((int)chars[counter]));
output(";");
}
break;
}
不能以任何方式控制此逻辑.
但是,如果您确实需要该功能,则可以执行疯狂的操作:
>将HTMLWriter源代码复制并粘贴到HTMLWriterHack中(在同一包javax.swing.text.html中,并重命名其中的所有字符串)
>用诸如output(String.valueOf(chars [counter]));之类的东西替换上面列出的三行输出;
>将HTMLDocument源代码复制并粘贴到HTMLDocumentHack中(在同一包javax.swing.text.html中,重命名其中的所有字符串,使其扩展HTMLDocument并删除冲突方法)
>使用下面列出的CustomEditorKit代替HTMLEditorKit
class CustomEditorKit extends HTMLEditorKit {
@Override
public void write(Writer out, Document doc, int pos, int len) throws IOException, BadLocationException {
HTMLWriterHack writer = new HTMLWriterHack(out, (HTMLDocumentHack) doc);
writer.write();
}
@Override
public Document createDefaultDocument() {
StyleSheet styles = getStyleSheet();
StyleSheet ss = new StyleSheet();
ss.addStyleSheet(styles);
HTMLDocumentHack doc = new HTMLDocumentHack(ss);
doc.setParser(getParser());
doc.setAsynchronousLoadPriority(4);
doc.setTokenThreshold(100);
return doc;
}
}
尽管上面的步骤可以工作(我已经测试过),但是我当然不建议这样做.
标签:jtextpane,character-encoding,utf-8,html-entities,java 来源: https://codeday.me/bug/20191102/1987611.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。