ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

java-Apache通用CSV格式程序:IOException:封装的令牌和定界符之间的无效字符

2019-11-09 02:03:14  阅读:11  来源: 互联网

标签:opencsv csv apache-commons java apache-commons-csv



我正在尝试使用JakartaCommons-csv解析CSV文件

样本输入文件

Field1,Field2,Field3,Field4,Field5
"Ryan, R"u"bianes","  dummy@gmail.com","29445","626","South delhi, Rohini 122001"

格式化程序:CSVFormat.newFormat(‘,’).withIgnoreEmptyLines().withQuote(‘“’)
CSV_DELIMITER为,

输出量

> CSV解析后的Field1值应为:Ryan,R“ u” bianes
> CSV解析后的Field5值应为:South delhi,Rohini 122001

异常:由以下原因引起:java.io.IOException:(第2行)封装的令牌和定界符之间的无效char

解决方法:

问题是您的文件未遵循CSV文件中引用的可接受标准.表示带引号的字符串中的引号的正确方法是重复引号.例如.

Field1,Field2,Field3,Field4,Field5
"Ryan, R""u""bianes","  dummy@gmail.com","29445","626","South delhi, Rohini 122001"

如果将自己限制为CSV引用的标准形式,则Apache Commons CSV解析器应该可以工作.

不幸的是,为您的变体格式编写一致的解析器是不可行的,因为如果需要表示包含“ Ryan R”,“ baines”的字段,则无法消除嵌入式逗号和字段分隔符的歧义.

CSV文件中的引用规则在包括RFC 4180在内的许多地方都有列出.



标签:opencsv,csv,apache-commons,java,apache-commons-csv

专注分享技术,共同学习,共同进步。侵权联系[admin#icode9.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有