|
0 / 0 / 0
Регистрация: 05.12.2019
Сообщений: 2
|
||||||
Как правильно парсить комментарии из docx, используя IronPython и .NET Framework (dotnet API)?26.11.2020, 13:04. Показов 1427. Ответов 1
Метки comment, comments, doc, docs, docx, dotnet, ironpython, microsoft, net framework, openxml, parse, parse xml, parser, parser python, parsing, word 2013, word 2016, word c#, word interop (Все метки)
Всем привет.
Пишу парсер для word-документов. Использую официальную Microsoft SDK (.NET API, .NET Framework, dotnet, Официальная документация) и IronPython2.7. Многие мои документы содержат в себе комментарии и исправления (комментарии добавляются через "INSERT->COMMENTS->NEW COMMENTS"). Мне необходимо спарсить документ так, чтобы я знал где начинается комментарий и где он заканчивается. Я использую такой код:
9 17 scope_text: "ordinary" text_between_indexes: "ordinary" ___________________ 19 23 scope_text: "text" text_between_indexes: "ext." ___________________ На скриншоте (в прикрепленных файлах) видна проблема - если вывести тест документа между индексами комментария, то в первом комментарии все хорошо, а во втором уже заметно смещение на один символ. Сам пример документа также есть в прикрепленных файлах. Поначалу это не сильно мешает, но когда документ на 30 и более страниц, то смещение может привести к ошибкам (например, когда в комментарии выделен всего один символ, пусть будет 'a'). Такая буква может встречать несколько раз. И нельзя будет точно сказать, какая их них была помечена в комментарии. Это лишь малая часть. Потом возникают проблемы, когда индексы начала и конца комментария съезжаю не только вправа по строке, но и влево. Я две недели изучал документацию, думаю, что допустил ошибку. Но у меня не встретил возможные причины таких проблем. Прошу помощи и заранее благодарю за нее.
0
|
||||||
| 26.11.2020, 13:04 | |
|
Ответы с готовыми решениями:
1
Как удалить приложение dotNet Framework 1.0-2.0.-3.5 и прочие из операционной системы Windows XP Как правильно объявлять API в VB .NET |
|
14314 / 9399 / 1355
Регистрация: 21.01.2016
Сообщений: 35,437
|
|||
| 27.11.2020, 08:19 | |||
|
0
|
|||
| 27.11.2020, 08:19 | |
|
Помогаю со студенческими работами здесь
2
dotnet DocX библиотека и работа с ней dotnet DocX библиотека и работа с ней В списке Target Framework не выбирается .NET Framework 4 только .NET Framework 4 Client Profile
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Установка Qt Creator для C и C++: ставим среду, CMake и MinGW без фреймворка Qt
8Observer8 05.04.2026
Среду разработки Qt Creator можно установить без фреймворка Qt. Есть отдельный репозиторий для этой среды: https:/ / github. com/ qt-creator/ qt-creator, где можно скачать установщик, на вкладке Releases:. . .
|
AkelPad-скрипты, структуры, и немного лирики..
testuser2 05.04.2026
Такая программа, как AkelPad существует уже давно, и также давно существуют скрипты под нее. Тем не менее, прога живет, периодически что-то не спеша дополняется, улучшается. Что меня в первую очередь. . .
|
Отображение реквизитов в документе по условию и контроль их заполнения
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеСпецтехники", разработанного в конфигурации КА2.
Данный документ берёт данные из другого нетипового документа. . .
|
Фото всей Земли с борта корабля Orion миссии Artemis II
kumehtar 04.04.2026
Это первое подобное фото сделанное человеком за 50 лет. Снимок называют новым вариантом легендарной фотографии «The Blue Marble» 1972 года, сделанной с борта корабля «Аполлон-17». Новое фото. . .
|
|
Вывод диалогового окна перед закрытием, если документ не проведён
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2.
Задача: реализовать программный контроль на предмет проведения документа. . .
|
Программный контроль заполнения реквизитов табличной части документа
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2.
Задача:
1. Реализовать контроль заполнения реквизита. . .
|
wmic не является внутренней или внешней командой
Maks 02.04.2026
Решение:
DISM / Online / Add-Capability / CapabilityName:WMIC~~~~
Отсюда: https:/ / winitpro. ru/ index. php/ 2025/ 02/ 14/ komanda-wmic-ne-naydena/
|
Программная установка даты и запрет ее изменения
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2.
Задача: при создании документов установить период списания автоматически. . .
|