Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.75/8: Рейтинг темы: голосов - 8, средняя оценка - 4.75
0 / 0 / 0
Регистрация: 02.04.2015
Сообщений: 1

Парсинг xml по кусочкам

05.05.2016, 06:50. Показов 1825. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброе утро!Дали такую задачу на PYTHON: Надо взять большой xml файл(несколько мб),разбить его на примерно одинаковые куски(по сколько-то кбайт каждый) и каждый кусок надо распарсить так,чтобы от каждого куска в выводной txt файл выводилась информация из этого куска следующим образом:вначале теги,потом значение для этих тегов.И для каждого куска эти данные должны выводиться в одну строку txt,при этом для каждого куска отдельная строка.
То есть,если изначальный xml имел вид
<тег1>
<тег2>
<тег3>
Информация
</тег3>
<тег 3>
Информация1
</тег3>
</тег2>
</тег1>
В output.txt чтобы было нечто подобное
Тег1—>тег2—>тег3: информация; тег1—>тег2—>тег3:информация1
И при этом: если получается так,что при разбиении файла на 500 кбайт(к примеру) закрывающие теги не влезли,то необходимо продлить этот кусок до закрытого тега,то есть чтобы в этом куске все теги были закрыты.
Я пытался кое-что сделать,и на данный момент удалось сделать так,чтобы это все выводилось как надо.Проблема с разбиением файла,и с последним пунктом(если не влезли закрывающие теги).Есть такая идея,что надо разбивать на куски,и каждый кусок делать отдельным xml файлом,а дальше уже написанной частью программы делать.Но вот как это сделать,я,увы, не знаю.Заранее спасибо
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
05.05.2016, 06:50
Ответы с готовыми решениями:

Парсинг XML
Есть один или несколько xml файлов, которые будут иметь примерно вот такую структуру : &lt;?xml version='1.0' ?&gt; &lt;element&gt; ...

парсинг xml
Я новичок. Не получается никак пропарсить xml. Подскажите что не так. Я хочу получить содержимое тега teg3. Просто присвоить переменной...

Парсинг xml на Python 3
Доброго времени суток, стоит задача извлечения текста из приложенного файла xml. Код которым я пытаюсь это сделать требует пример...

2
Заблокирован
06.05.2016, 12:41
Использывать модуль xml нельзя?
0
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
06.05.2016, 12:49
tweller, несколько мб это сколько? Думаю lxml съест его целиком и не поперхнется (он на си написан, по этому работает очень быстро).
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
06.05.2016, 12:49
Помогаю со студенческими работами здесь

Парсинг xml c кириличными тегами на Python3
Доброго времени суток, уважаемы питонисты! Мне нужно распарсить xml файлик. Для этого я использовал xml.etree.ElementTree из ET в...

Парсинг XML
Здравствуйте! У меня имеется XML выгрузка в которой необходимо изменить атрибут ns10:capacity в теге &lt;rasd:HostResource... на новое...

Парсинг XML
Помогите распарсить документ (прикреплён к сообщению). Долго пробовал, но ничего не получилось. Предполагаю, что дело в кодировке...

Парсинг xml файла
Нужно парсить xml-файл. Вводится начальная и конечная даты, затем вывести отсортированную(по возрастанию значения текста внутри тегов...

Парсинг xml файла
Изучаю python, пробую парсить xml Файл следующего вида &lt;?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot; ?&gt; &lt;DeviceStatus version=&quot;1.0&quot;...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях. Задача: при копировании документа очищать определенные реквизиты и табличную. . .
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели 8ATzM_2aurI
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2. Задача: запретить редактирование документа, если он открыт у другого пользователя. / / . . .
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои. А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20% kYBz3eJf3jQ
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
Использование значений реквизитов справочника в документе, с определенными условиями и правами
Maks 07.04.2026
1. Контроль срока действия договора Алгоритм из решения ниже реализован на примере нетипового документа "ЗаявкаНаРаботу", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru