Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.72/141: Рейтинг темы: голосов - 141, средняя оценка - 4.72
0 / 0 / 0
Регистрация: 17.03.2009
Сообщений: 10

Считывание из doc/docx файла

17.03.2009, 16:05. Показов 26927. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте.
Решил таки написать диплом и собственно возник затык в программной части.
Пишу что то типа АСУ по обработке док файлов определенной структуры по типу:
<Заголовок 1>
текст
<Заголовок 2>
текст
<Заголовок 3>
текст
...

Что то типа анкет (заявки на университетские гранты).

Программа должна считывать данные из файла, распихивать блоки текста к примеру в ричтекстбоксы и после предпросмотра записывать все в базу. С базой проблем нету а вот со считыванием мучаюсь уже третий день.
С вордом работаю первый раз поэтому навскидку пытаюсь считывать вот таким образом.

C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
object start = 0;
object end = word.Characters.Count;
worddocument.Range wordrange = word.Range(ref start, ref end);
wordrange.TextRetrievalMode.IncludeHiddenText = true;
wordrange.TextRetrievalMode.IncludeFieldCodes = true;
string stext = "на издание учебника/учебного пособия/научной монографии автора (ов)";
string st = wordrange.Text.IndexOf(stext).ToString();
if (st != "-1")
                {
                    ActiveForm.Text = "Тип проекта - Пособие";
                    stext = "(первым указывается ответственный исполнитель)";
                    start = wordrange.Text.IndexOf(stext) + stext.Length + 1;
                    stext = "Факультет, кафедра";
                    end = wordrange.Text.IndexOf(stext);
                    wordrange = word.Range(ref start, ref end);
                    richTextBox1.Text = wordrange.Text;
                }
Но при считывании похоже цепляются непечатные символы и получается криво. Если есть какой другой метод для работы с содержимым документа - подскажите пожалста
Или решение в рамках этого способа.

Добавлено через 50 секунд
Кстати изменение параметров
C#
1
2
wordrange.TextRetrievalMode.IncludeHiddenText = true;
wordrange.TextRetrievalMode.IncludeFieldCodes = true;
видимых результатов не дало.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
17.03.2009, 16:05
Ответы с готовыми решениями:

Открытие и чтение файлов .doc/.docx
помогите. как средствами visual studio на C# открыть файлы .doc/.docx и прочитать все содержимое файла. или мне еще подходит вариант...

Создание отчета .doc / .docx на основе шаблона
Есть шаблон .dot / .dotx, в нем поля с именами. Необходимо из C# создавать файл на основе шаблона, заполнив поля. В рунете никакой свежей...

Чтение doc/docx без использования MS Office
Здравствуйте. Подскажите пожалуйста, есть ли какие-нибудь бесплатные компоненты для чтения файлов Microsoft Word?

5
0 / 0 / 0
Регистрация: 17.03.2009
Сообщений: 10
06.04.2009, 09:53  [ТС]
Рискну апнуть тему. Неужели никто подобными вещами не занимался?
Весь диплом на это методе практически завязан и подвижек все еще нету

Вопще ошибка странная, изначально весь документ считывается в wordrange и поиск с уточнением дальше идет только в нем, соответственно расхождений никаких быть не должно.
0
37 / 32 / 4
Регистрация: 23.01.2009
Сообщений: 141
06.04.2009, 11:15
Ну так удаляй непечатные символы. Проверяй коды символов, если они не те, что тебе нужны, то удаляй. Хотя это не очень хороший вариант. Возможно есть и встроенные средства.
0
0 / 0 / 0
Регистрация: 17.03.2009
Сообщений: 10
02.06.2009, 11:17  [ТС]
Цитата Сообщение от FizZ Посмотреть сообщение
Tsugaru,
постучись мне в аську 201407607
Fizz, стучался но ты вечно оффлайн. Проблема в силе.

Может можно как нибудь файл в веб браузер считать а потом оттуда данные выдирать? Правда у меня оно так и не заработало.
0
Комбайнёр
 Аватар для MAcK
1606 / 704 / 77
Регистрация: 27.05.2008
Сообщений: 2,535
02.06.2009, 13:59
Скиньте мне на мыло пример файла.
А также примерв тектовом файле, что вы хотите получить ан форме
0
0 / 0 / 0
Регистрация: 17.03.2009
Сообщений: 10
02.06.2009, 14:54  [ТС]
Цитата Сообщение от IT-Skyline Посмотреть сообщение
Скиньте мне на мыло пример файла.
А также примерв тектовом файле, что вы хотите получить ан форме
У вас мыло скрыто, а через форум в письмо аттачи делать нельзя. Скиньте адрес пожайлуста в личку.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
02.06.2009, 14:54
Помогаю со студенческими работами здесь

Работа с файлами в формате .doc, .docx, .xls, .xlsx
Добрый день! Подскажите, есть ли какая-то альтернатива COM-объектам для извлечения текста из форматов .doc, .docx, .xls, .xlsx? ...

Бесплатные либы для создания, редактирования PDF, DOCX, XLSX, XLS, DOC и конвертации их между собой
Существует ли бесплатная библиотека, которая позволяет делать все и сразу - создавать, редактировать и конвертировать документы форматов...

Чтение *.doc и *.docx
Здравствуйте. Помогите пожалуйста решить проблему: как прочитать *.doc и *.docx файлы в wpf приложении? Нужно чтобы при нажатии на кнопку...

Создание отчетов в формате doc,docx WPF
Добрый день. Такой стал вопрос,созадется приложение что то вроде программы учета,есть в бумажном виде документ куда люди вписывают свои...

Показ docx файла в RichTextBox
Как отобразить файл что бы сохранилось форматирование? И где это легче сделать(WPF или WinForms)?


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка. Рецензия / Мнение Это мой обзор планшета X220 с точки зрения школьника. Недавно я решила попытаться уменьшить свой. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru