ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

python – ElementTree:Element.remove()跳转迭代

2019-10-02 04:58:15  阅读:277  来源: 互联网

标签:python iteration xml-parsing elementtree


我有这个xml输入文件:

<?xml version="1.0"?>
<zero>
  <First>
    <second>
      <third-num>1</third-num>
      <third-def>object001</third-def>
      <third-len>458</third-len>
    </second>
    <second>
      <third-num>2</third-num>
      <third-def>object002</third-def>
      <third-len>426</third-len>
    </second>
    <second>
      <third-num>3</third-num>
      <third-def>object003</third-def>
      <third-len>998</third-len>
    </second>
  </First>
</zero>

我的目标是删除任何第二级< third-def>这不是一个价值.为此,我写了这段代码:

try:
    import xml.etree.cElementTree as ET
except ImportError:
    import xml.etree.ElementTree as ET
inputfile='inputfile.xml'
tree = ET.parse(inputfile)
root = tree.getroot()

elem = tree.find('First')
for elem2 in tree.iter(tag='second'):
    if elem2.find('third-def').text == 'object001':
        pass
    else:
        elem.remove(elem2)
        #elem2.clear()

我的问题是elem.remove(elem2).它会跳过其他所有第二级.以下是此代码的输出:

<?xml version="1.0" ?>
<zero>
  <First>
    <second>
      <third-num>1</third-num>
      <third-def>object001</third-def>
      <third-len>458</third-len>
    </second>
    <second>
      <third-num>3</third-num>
      <third-def>object003</third-def>
      <third-len>998</third-len>
    </second>
  </First>
</zero>

现在,如果我取消注释elem2.clear()行,脚本运行完美,但输出不太好,因为它保留了所有删除的第二级:

<?xml version="1.0" ?>
<zero>
  <First>
    <second>
      <third-num>1</third-num>
      <third-def>object001</third-def>
      <third-len>458</third-len>
    </second>
    <second/>
    <second/>
  </First>
</zero>

有没有人知道为什么我的element.remove()语句错了?

解决方法:

你正在循环实况树:

for elem2 in tree.iter(tag='second'):

然后在迭代时更改.迭代的’计数器’将不会被告知元素的更改数量,因此当查看元素0并删除该元素时,迭代器将继续移动到元素编号1.但是元素编号1现在是元素编号0.

首先捕获所有元素的列表,然后循环遍历:

for elem2 in tree.findall('.//second'):

.findall()返回结果列表,在您更改树时不会更新.

现在迭代不会跳过最后一个元素:

>>> print ET.tostring(tree)
<zero>
  <First>
    <second>
      <third-num>1</third-num>
      <third-def>object001</third-def>
      <third-len>458</third-len>
    </second>
    </First>
</zero>

这种现象不仅限于ElementTree树;见Loop “Forgets” to Remove Some Items

标签:python,iteration,xml-parsing,elementtree
来源: https://codeday.me/bug/20191002/1841197.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有