0 / 0 / 0
Регистрация: 14.02.2016
Сообщений: 3
|
|||||||||||
1 | |||||||||||
ElementTree & Unicode20.02.2016, 02:29. Показов 1247. Ответов 4
Привет,
Пытаюсь разобрать вот такой XML
Черточка между словами workforce и digital - символ UNICODE "Среднее тире", U+2013 Этот символ не запрещен стандартом( согласно https://en.wikipedia.org/wiki/... ers_in_XML ), но для него есть альтернативный код - entity – Хотя, проверил и вставил русскую букву ы в XML-документ выше - так же вылетает. Вопрос, точнее 2: 1. Как читать Iron - Питоном Юникодные XML-документы правильно, и 2. Как рекомендуете почистить входные тексты, раз я их читаю вручную ( а делаю это из-за гигантского размера входных файлов, тут пропущен код, где я вручную выделяю крупные секции для парсинга )
0
|
20.02.2016, 02:29 | |
Ответы с готовыми решениями:
4
Lxml назначение etree.ElementTree Создание XML через ElementTree ElementTree и FB2: ParseError в файлах cp1251 Работа с модулем xml.etree.ElementTree Не работает tostring в xml.etree.ElementTree |
21 / 34 / 14
Регистрация: 23.07.2014
Сообщений: 148
|
|
20.02.2016, 22:19 | 2 |
Не нужно забывать указывать версию питона!
Для теста убери except и посмотри какая точно ошибка. Не понятно для чего ты еще раз добавляешь строку '<?xml version="1.0" encoding="UTF-8"?>', если она уже есть в файле.
0
|
0 / 0 / 0
Регистрация: 14.02.2016
Сообщений: 3
|
|
21.02.2016, 23:41 [ТС] | 3 |
Тип не знаю, как посмотреть.
Возможно, Error. Поле Код
ex._type: Python Type: "Error" ex.message: "Syntax error at line 10: illegal character in content" Код
D:\texts>"C:\Program Files (x86)\IronPython 2.7\ipy.exe" IronPython 2.7.5 (2.7.5.0) on .NET 4.0.30319.18063 (32-bit) Type "help", "copyright", "credits" or "license" for more information. >>>
0
|
0 / 0 / 0
Регистрация: 14.02.2016
Сообщений: 3
|
||||||
23.02.2016, 01:01 [ТС] | 4 | |||||
Воспользовался System.Xml.Linq заместо этого корявого ElementTree
Тему можно закрывать.
0
|
2740 / 2339 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
|
|
23.02.2016, 09:09 | 5 |
anonimouse, у меня все нормально работает. Возможно глюк альтернативной реализации. Лучше использовать оригинальный cpython.
0
|
23.02.2016, 09:09 | |
23.02.2016, 09:09 | |
Помогаю со студенческими работами здесь
5
query='SELECT * FROM resume WHERE ' & ''' & RecSet('place')& ''' & '=' & '''& s_loc &''' & - что не так? MASM & Unicode ANSI & UNICODE MFC CEdit & unicode Unicode & Ansi в XE2 Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |