ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

TinyXML2的基本使用之遍历和文本提取

2021-05-21 23:03:53  阅读:433  来源: 互联网

标签:XML 遍历 PARSING TinyXML2 FirstChildElement XMLElement ERROR 文本 节点


XML是一种标记语言,被广泛用来作为跨平台之间交互数据的形式,主要针对数据的内容,通过不同的格式化描述手段(XSLT,CSS等)可以完成最终的形式表达(生成对应的HTML,PDF或者其他的文件格式)。

而TinyXML2是一个开源、简单、小巧、高效的C++ XML解析器,由于XML是由节点组成的,节点之间是树形结构,有根节点、父节点、子节点、兄弟节点等。所以可以把其当做树来处理和使用。

下面我们来看一下在C++中使用TinyXML2对XML文件进行遍历和提取信息的方法。

1.TinyXML2的相关数据类型

  • XMLDocument:代表整个XML文件。
  • XMLNode:XML文件是由节点组成的,节点之间是树形结构,所以就有根节点、父节点、子节点、兄弟节点。
  • XMLElement:对应于XML的元素
  • XMLAttribute:对应于XML中的元素的属性。
  • XMLText:对应于XML的文字部分
  • XMLComment:XML中的注释。
  • XmlUnknown:对应于XML的未知部分。
  • XmlHandler:定义了针对XML的一些操作。

可以根据需要使用上面的类型来定义对象。

2.TinyXML2查看的相关函数

  1. 加载文件信息,即要处理哪个文件
XMLDocument doc; 
doc.LoadFile(filename);//加载要处理的xml文档
if(doc.ERROR()){
	//检查是否打开成功
	cout << "open failed!" << endl;
}

类似C语言中文件打开fopen后,需要检查打开是否失败,有函数ErrorID。正常打开返回XML_SUCCESS=0,函数原型为:

XMLError  ErrorID() const {
    return _errorID;
}

XMLError:错误信息使用枚举值。

enum XMLError {
    XML_SUCCESS = 0,
    XML_NO_ATTRIBUTE,
    XML_WRONG_ATTRIBUTE_TYPE,
    XML_ERROR_FILE_NOT_FOUND,
    XML_ERROR_FILE_COULD_NOT_BE_OPENED,
    XML_ERROR_FILE_READ_ERROR,
    XML_ERROR_PARSING_ELEMENT,
    XML_ERROR_PARSING_ATTRIBUTE,
    XML_ERROR_PARSING_TEXT,
    XML_ERROR_PARSING_CDATA,
    XML_ERROR_PARSING_COMMENT,
    XML_ERROR_PARSING_DECLARATION,
    XML_ERROR_PARSING_UNKNOWN,
    XML_ERROR_EMPTY_DOCUMENT,
    XML_ERROR_MISMATCHED_ELEMENT,
    XML_ERROR_PARSING,
    XML_CAN_NOT_CONVERT_TEXT,
    XML_NO_TEXT_NODE,
    XML_ELEMENT_DEPTH_EXCEEDED,

    XML_ERROR_COUNT
};
  1. 获取根节点:(因为获取跟节点其实底层调用的还是FirstChildElement,所以直接使用FirstChildElement),因为xml文件是树形结构的文件,所以势必会有根节点、父子节点、兄弟节点。
XMLElement *root = doc.RootElement(); //获取根节点
  1. 获取孩子节点
//函数声明:
XMLElement *FirstChildElement();//获取第一个孩子结点
XMLElement *FirstChildElement(string label);//获取第一个标签为label的孩子结点
//实际使用:
//获取根节点下的第一个节点
XMLElement *curNode1 = root->FirstChildElement();
//获取根节点下的第一个节点的第一个"item"节点
XMLElement *curNode2 = root->FirstChildElement()->FirstChildElement("item");

因为FirstChildElement返回值还是XMLElement类型的指针(类似输出流运算符返回流对象引用一样),所以还可以继续使用FirstChildElement获取接下来的孩子节点。

  1. 使用NextSiblingElement函数获取兄弟节点,从而实现遍历
//返回下一个为item的的兄弟节点
XMLElement *nextNode = curNode->NextSiblingElement("item");
  1. 获取节点的文本信息,使用函数GetText()
//获取当前节点下的title节点中的文本信息,存放到string字符串中
string title = curNode->FirstChildElement("title")->GetText();

通过上面的几个函数,就可以实现对整个xml文档的遍历和文本提取了。

标签:XML,遍历,PARSING,TinyXML2,FirstChildElement,XMLElement,ERROR,文本,节点
来源: https://blog.csdn.net/weixin_42565760/article/details/117135825

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有