python编程:配置文件xml的读取写入

XML,全称为ExtentsibleMarkup Language,即可扩展标记语言,是用来定义其它语言的一种元语言,使用自定义的标签对文档内容进行描述。被设计用来传输和存储数据。

XML和HTML类似,都是一种文本标记语言,与HTML不同的是,XML是一种可扩展标记语言,它极其简单易于掌握和使用。XML的简单使其易于在任何应用程序中读写数据,这使XML很快成为数据交换的唯一公共语言。

XML文档的语法要求非常严格,要求每一个标记都必须匹配一个结束符,每一个标记的出现次数也有严格的要求,规则制定者可以编写相应的DTD或Schema文件来限制XML文档的组成。

在程序开发中,经常使用xml文件作为配置文件,本文重点介绍xml.etree.ElementTree读写xml文件的方法。

xml.etree.ElementTree读写xml文件

Python标准库中有两种实现:一种是纯Python实现的,如xml.etree.ElementTree,另一种是速度快一点的xml.etree.cElementTree。注意:尽量使用C语言实现的那种,因为它速度更快,而且消耗的内存更少。

(1)Python3.3版本以前

下面例子是一个让Python不同的库使用相同API的一个比较常用的办法。

#Python3.3版本以前,
try: 
        import xml.etree.cElementTree as ET 
except ImportError: 
        import xml.etree.ElementTree as ET

(2)Python3.3版本以后

从Python3.3开始,ElementTree模块会自动寻找可用的C库来加快速度,所以只需要import xml.etree.ElementTree就可以了。

#Python3.3版本以后,
import xml.etree.ElementTree as ET

(3)解析的xml文件

解析的xml文件(demo.xml),具体内容如下:

 
 
  8 cs_forecast
http://www.weather.com.cn/weather/%%s.shtml 北京,武汉,合肥,南京

读配置文件demo.xml里面的四个参数,num、tablename、urlstr、citystr

import xml.etree.ElementTree as ET 

tree = ET.parse("demo.xml")     #打开xml文档 
root = tree.getroot()         #获得root节点  
 
for table in root.findall('table'): #找到root节点下的所有table节点, 其实配置文件里只有一个节点 
  num = table.find('num').text   #子节点下节点rank的值 
  table = table.find('tablename').text      #子节点下属性name的值 
  print(num, table) #8 cs_forecast

for city in root.findall('url'): #找到root节点下的所有url节点, 其实配置文件里只有一个节点  
  urlstr = city.find('urlstr').text   #子节点下节点rank的值 
  citystr = city.find('citystr').text      #子节点下属性name的值 
  print(urlstr, citystr) #http://www.weather.com.cn/weather/%%s.shtml 北京,武汉,合肥,南京

上面例子使用findall查找所有节点,上例中配置文件里只有一个节点,如果是多个节点,可以按照数组的方式进行处理。

可以采用下面的方法:

# 查找table里面的num和tablename标签,找第一个
table = root.find('table')
num = table.find('num').text
tablename = table.find('tablename').text

# 查找url里面的urlstr和citystr标签,找第一个
url = root.find('url')
urlstr = url.find('urlstr').text)
citystr = url.find('citystr')

还可以采用下面的方法:

#也可以下面表达
num = root.find('table').find('num').text
tablename =root.find('table').find('tablename').text

urlstr = root.find('url').find('urlstr').text
tablename =root.find('url').find('citystr).text

(4)修改xml文件、保存

#修改xml文件 
for table in root.findall('table'): 
    num = int(table.find('num').text) 
    if num > 5: 
       root.remove(table)  #删除节点
#保存修改后的xml文件 output.xml
tree.write('output.xml')

(5)修改和删除节点

修改和删除内容只在内存中修改,没有存到文件中,都要重新保存文件

修改节点内容

#修改节点内容 
root.find('url').find('urlstr').text = "http://www.sina.com"
tree.write('output.xml')

修改节点属性

#修改节点属性
root.find('url').find('urlstr').set('update', '2022-11-11')
tree.write('output.xml')

修改节点属性

#删除节点
root.remove( root.find('table') )
tree.write('output.xml')

相关文章

Python 解析 XML

1 简介XML 全称 Extensible Markup Language,中文译为可扩展标记语言。XML 之前有两个先行者:SGML 和 HTML,率先登场的是 SGML, 尽管它功能强大,但文档结...

Python 读写XML文件

在Python中,可以使用内置的xml.etree.ElementTree模块来读取和写入XML文件。这个模块提供了一种简单而有效的方式来解析和操作XML文档。下面是使用xml.etree.Eleme...

深入解析:Python中的XML处理技巧与实践

解析XML文件是Python编程中的一项重要技能,特别是在处理配置文件、数据交换格式或web服务响应时。Python提供了多种库来实现这一功能,其中xml.etree.ElementTree和lxml...

Python和XML

XML 是一种可移植的开源语言,它允许程序员开发可由其他应用程序读取的应用程序,而不管操作系统和/或开发语言如何。什么是 XML?可扩展标记语言 (XML) 是一种与 HTML 或 SGML 非常相似...

20.2 PyQt5-【XML操作】-QXmlStreamWriter

1.QXmlStreamWriter简介在 PyQt5 中,QXmlStreamWriter用于逐步生成 XML 数据。支持以流的形式写入XML,适合处理较大或复杂的XML文件2.QXmlStream...