|
0 / 0 / 0
Регистрация: 02.04.2015
Сообщений: 1
|
|
Парсинг xml по кусочкам05.05.2016, 06:50. Показов 1825. Ответов 2
Метки нет (Все метки)
Доброе утро!Дали такую задачу на PYTHON: Надо взять большой xml файл(несколько мб),разбить его на примерно одинаковые куски(по сколько-то кбайт каждый) и каждый кусок надо распарсить так,чтобы от каждого куска в выводной txt файл выводилась информация из этого куска следующим образом:вначале теги,потом значение для этих тегов.И для каждого куска эти данные должны выводиться в одну строку txt,при этом для каждого куска отдельная строка.
То есть,если изначальный xml имел вид <тег1> <тег2> <тег3> Информация </тег3> <тег 3> Информация1 </тег3> </тег2> </тег1> В output.txt чтобы было нечто подобное Тег1—>тег2—>тег3: информация; тег1—>тег2—>тег3:информация1 И при этом: если получается так,что при разбиении файла на 500 кбайт(к примеру) закрывающие теги не влезли,то необходимо продлить этот кусок до закрытого тега,то есть чтобы в этом куске все теги были закрыты. Я пытался кое-что сделать,и на данный момент удалось сделать так,чтобы это все выводилось как надо.Проблема с разбиением файла,и с последним пунктом(если не влезли закрывающие теги).Есть такая идея,что надо разбивать на куски,и каждый кусок делать отдельным xml файлом,а дальше уже написанной частью программы делать.Но вот как это сделать,я,увы, не знаю.Заранее спасибо
0
|
|
| 05.05.2016, 06:50 | |
|
Ответы с готовыми решениями:
2
Парсинг XML парсинг xml Парсинг xml на Python 3 |
|
Заблокирован
|
|
| 06.05.2016, 12:41 | |
|
Использывать модуль xml нельзя?
0
|
|
|
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
|
|
| 06.05.2016, 12:49 | |
|
tweller, несколько мб это сколько? Думаю lxml съест его целиком и не поперхнется (он на си написан, по этому работает очень быстро).
0
|
|
| 06.05.2016, 12:49 | |
|
Помогаю со студенческими работами здесь
3
Парсинг xml c кириличными тегами на Python3
Парсинг xml файла Парсинг xml файла Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях.
Задача: при копировании документа очищать определенные реквизиты и табличную. . .
|
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git
main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели
8ATzM_2aurI
|
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2.
Задача: запретить редактирование документа, если он открыт у другого пользователя.
/ / . . .
|
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои.
А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
|
|
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20%
kYBz3eJf3jQ
|
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
|
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
|
Использование значений реквизитов справочника в документе, с определенными условиями и правами
Maks 07.04.2026
1. Контроль срока действия договора
Алгоритм из решения ниже реализован на примере нетипового документа "ЗаявкаНаРаботу", разработанного в конфигурации КА2.
Задача: уведомлять пользователя, если. . .
|