С Новым годом! Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.63/8: Рейтинг темы: голосов - 8, средняя оценка - 4.63
 Аватар для nobless1368
14 / 14 / 2
Регистрация: 04.06.2012
Сообщений: 124
Записей в блоге: 1

Разбор XML

05.02.2013, 14:55. Показов 1581. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Дана строка следующего вида с переменной длиной:

HTML5
1
<reply><process id="3135"/><threads><thread id="-1233097872" name="Storage Writer"/><thread id="-1297089680" name="Local Server"/><thread id="-1242563728" name="File Manager Writer"/><thread id="-1288701072" name="Watcher"/><thread id="-1271923856" name="Mailer"/><thread id="-1305478288" name="Web Server"/><thread id="-1263535248" name="XML Synchronizer"/><thread id="-1224709264" name="Logger"/><thread id="-1250952336" name="Session Cleaner"/><thread id="-1218574656" name="Main"/><thread id="-1280312464" name="Backup"/></threads><garbagecollector><objects>37847</objects><garbage>0</garbage><collection><generation>134</generation><generation>4</generation><generation>1</generation></collection></garbagecollector></reply>
Мне нужно и нее выцепить id и name.
делаю следующее:
Python
1
2
3
message #строка
pattern = re.compile(r'<reply><process\s+id="([^"]+)"/><thread\s+id="([^"]+)"\s+name="([^"]+)"\s*/>')
ids,ident,name = pattern.match(message).groups()
Но не знаю как мне сделать шаблон на строку из n-ного числа пар id и name.
Покорно прошу помощи.
Если кто-то знает как это сделать проще - милости прошу
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
05.02.2013, 14:55
Ответы с готовыми решениями:

Создать файл xml schema на основе корректного xml
Вообщем есть следующая задача. Корректный XML файл results.xml содержит результаты прохождения теста студентами в виде: &lt;?xml...

Python 3.8 заголовок xml <?xml version=“1.0” encoding=“utf-8”?>
Прошу помощи. Необходимо создать xml файл с заголовком &lt;?xml version=“1.0” encoding=“utf-8”?&gt;?.Код уже написан, но проблема с заголовком...

Подскажите, как парсить все xml файлы, вложенные в дочерние директории с исп. xml.dom.minidom?
Всем привет. Есть следующая структура папок: &lt;img src=&quot;https://habrastorage.org/webt/5d/0b/8f/5d0b8f031f86c050844094.png&quot;...

2
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
06.02.2013, 02:20
Python
1
2
3
4
5
6
7
8
>>> import re
>>> 
>>> s = """<reply><process id="3135"/><threads><thread id="-1233097872" name="Storage Writer"/><thread id="-1297089680" name="Local Server"/><thread id="-1242563728" name="File Manager Writer"/><thread id="-1288701072" name="Watcher"/><thread id="-1271923856" name="Mailer"/><thread id="-1305478288" name="Web Server"/><thread id="-1263535248" name="XML Synchronizer"/><thread id="-1224709264" name="Logger"/><thread id="-1250952336" name="Session Cleaner"/><thread id="-1218574656" name="Main"/><thread id="-1280312464" name="Backup"/></threads><garbagecollector><objects>37847</objects><garbage>0</garbage><collection><generation>134</generation><generation>4</generation><generation>1</generation></collection></garbagecollector></reply>"""
>>> 
>>> lst = re.findall(r'<thread id="(.+?)" name="(.+?)"/>', s)
>>> print(lst)
[('-1233097872', 'Storage Writer'), ('-1297089680', 'Local Server'), ('-1242563728', 'File Manager Writer'), ('-1288701072', 'Watcher'), ('-1271923856', 'Mailer'), ('-1305478288', 'Web Server'), ('-1263535248', 'XML Synchronizer'), ('-1224709264', 'Logger'), ('-1250952336', 'Session Cleaner'), ('-1218574656', 'Main'), ('-1280312464', 'Backup')]
>>>
вообще, это xml, есть специальный модуль
Python
1
2
3
4
5
6
7
8
9
>>> import xml.etree.ElementTree
>>> 
>>> s = """<reply><process id="3135"/><threads><thread id="-1233097872" name="Storage Writer"/><thread id="-1297089680" name="Local Server"/><thread id="-1242563728" name="File Manager Writer"/><thread id="-1288701072" name="Watcher"/><thread id="-1271923856" name="Mailer"/><thread id="-1305478288" name="Web Server"/><thread id="-1263535248" name="XML Synchronizer"/><thread id="-1224709264" name="Logger"/><thread id="-1250952336" name="Session Cleaner"/><thread id="-1218574656" name="Main"/><thread id="-1280312464" name="Backup"/></threads><garbagecollector><objects>37847</objects><garbage>0</garbage><collection><generation>134</generation><generation>4</generation><generation>1</generation></collection></garbagecollector></reply>"""
>>> 
>>> root = xml.etree.ElementTree.fromstring(s)
>>> lst = [(thr.attrib['id'], thr.attrib['name']) for thr in root.find('threads')]
>>> print(lst)
[('-1233097872', 'Storage Writer'), ('-1297089680', 'Local Server'), ('-1242563728', 'File Manager Writer'), ('-1288701072', 'Watcher'), ('-1271923856', 'Mailer'), ('-1305478288', 'Web Server'), ('-1263535248', 'XML Synchronizer'), ('-1224709264', 'Logger'), ('-1250952336', 'Session Cleaner'), ('-1218574656', 'Main'), ('-1280312464', 'Backup')]
>>>
1
 Аватар для nobless1368
14 / 14 / 2
Регистрация: 04.06.2012
Сообщений: 124
Записей в блоге: 1
06.02.2013, 02:25  [ТС]
Уже нашел и сделал спасибо за отзыв!
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
06.02.2013, 02:25
Помогаю со студенческими работами здесь

Разбор xml
Добрый день. Подскажите, пожалуйста, почему разбор не работает foreach (XElement level1Element in...

Разбор XML
Доброго времени суток. Ребята подскажите как получить значение в этой части XML &lt;Direction Number=&quot;1&quot;&gt; ...

Разбор XML
Начинаю разбираться с прочтением XML нашёл пример и он не хочет работать жалуется компилятор на функции xmlParseFile, xmlDocGetRootElement,...

Разбор XML
Добрый день подскажите пожалуйста есть большой xml файл разбивая его с помощью xmlreader, затем каждый узел при помощи simplexml ...

Разбор xml
Здравсвтуйте! Есть xml, в котором для преобразования используется xsl файл. Когда открываешь xml в браузере, всё красиво, хотя искать...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi ветка по-частям. коммит Create переделка под биомассу. txt вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ * Дана цепь постоянного тока с сопротивлениями и источниками (напряжения, ЭДС и тока). Найти токи и напряжения во всех элементах. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru