Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.98/121: Рейтинг темы: голосов - 121, средняя оценка - 4.98
0 / 0 / 0
Регистрация: 17.03.2009
Сообщений: 10
1

Считывание из doc/docx файла

17.03.2009, 16:05. Показов 23087. Ответов 5
Метки нет (Все метки)

Здравствуйте.
Решил таки написать диплом и собственно возник затык в программной части.
Пишу что то типа АСУ по обработке док файлов определенной структуры по типу:
<Заголовок 1>
текст
<Заголовок 2>
текст
<Заголовок 3>
текст
...

Что то типа анкет (заявки на университетские гранты).

Программа должна считывать данные из файла, распихивать блоки текста к примеру в ричтекстбоксы и после предпросмотра записывать все в базу. С базой проблем нету а вот со считыванием мучаюсь уже третий день.
С вордом работаю первый раз поэтому навскидку пытаюсь считывать вот таким образом.

C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
object start = 0;
object end = word.Characters.Count;
worddocument.Range wordrange = word.Range(ref start, ref end);
wordrange.TextRetrievalMode.IncludeHiddenText = true;
wordrange.TextRetrievalMode.IncludeFieldCodes = true;
string stext = "на издание учебника/учебного пособия/научной монографии автора (ов)";
string st = wordrange.Text.IndexOf(stext).ToString();
if (st != "-1")
                {
                    ActiveForm.Text = "Тип проекта - Пособие";
                    stext = "(первым указывается ответственный исполнитель)";
                    start = wordrange.Text.IndexOf(stext) + stext.Length + 1;
                    stext = "Факультет, кафедра";
                    end = wordrange.Text.IndexOf(stext);
                    wordrange = word.Range(ref start, ref end);
                    richTextBox1.Text = wordrange.Text;
                }
Но при считывании похоже цепляются непечатные символы и получается криво. Если есть какой другой метод для работы с содержимым документа - подскажите пожалста
Или решение в рамках этого способа.

Добавлено через 50 секунд
Кстати изменение параметров
C#
1
2
wordrange.TextRetrievalMode.IncludeHiddenText = true;
wordrange.TextRetrievalMode.IncludeFieldCodes = true;
видимых результатов не дало.
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
17.03.2009, 16:05
Ответы с готовыми решениями:

Открытие и чтение файлов .doc/.docx
помогите. как средствами visual studio на C# открыть файлы .doc/.docx и прочитать все содержимое...

Создание отчета .doc / .docx на основе шаблона
Есть шаблон .dot / .dotx, в нем поля с именами. Необходимо из C# создавать файл на основе шаблона,...

Чтение doc/docx без использования MS Office
Здравствуйте. Подскажите пожалуйста, есть ли какие-нибудь бесплатные компоненты для чтения файлов...

Работа с файлами в формате .doc, .docx, .xls, .xlsx
Добрый день! Подскажите, есть ли какая-то альтернатива COM-объектам для извлечения текста из...

5
0 / 0 / 0
Регистрация: 17.03.2009
Сообщений: 10
06.04.2009, 09:53  [ТС] 2
Рискну апнуть тему. Неужели никто подобными вещами не занимался?
Весь диплом на это методе практически завязан и подвижек все еще нету

Вопще ошибка странная, изначально весь документ считывается в wordrange и поиск с уточнением дальше идет только в нем, соответственно расхождений никаких быть не должно.
0
37 / 32 / 4
Регистрация: 23.01.2009
Сообщений: 141
06.04.2009, 11:15 3
Ну так удаляй непечатные символы. Проверяй коды символов, если они не те, что тебе нужны, то удаляй. Хотя это не очень хороший вариант. Возможно есть и встроенные средства.
0
0 / 0 / 0
Регистрация: 17.03.2009
Сообщений: 10
02.06.2009, 11:17  [ТС] 4
Цитата Сообщение от FizZ Посмотреть сообщение
Tsugaru,
постучись мне в аську 201407607
Fizz, стучался но ты вечно оффлайн. Проблема в силе.

Может можно как нибудь файл в веб браузер считать а потом оттуда данные выдирать? Правда у меня оно так и не заработало.
0
Комбайнёр
1590 / 688 / 77
Регистрация: 27.05.2008
Сообщений: 2,535
02.06.2009, 13:59 5
Скиньте мне на мыло пример файла.
А также примерв тектовом файле, что вы хотите получить ан форме
0
0 / 0 / 0
Регистрация: 17.03.2009
Сообщений: 10
02.06.2009, 14:54  [ТС] 6
Цитата Сообщение от IT-Skyline Посмотреть сообщение
Скиньте мне на мыло пример файла.
А также примерв тектовом файле, что вы хотите получить ан форме
У вас мыло скрыто, а через форум в письмо аттачи делать нельзя. Скиньте адрес пожайлуста в личку.
0
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
02.06.2009, 14:54

Заказываю контрольные, курсовые, дипломные работы и диссертации здесь.

Бесплатные либы для создания, редактирования PDF, DOCX, XLSX, XLS, DOC и конвертации их между собой
Существует ли бесплатная библиотека, которая позволяет делать все и сразу - создавать,...

Чтение *.doc и *.docx
Здравствуйте. Помогите пожалуйста решить проблему: как прочитать *.doc и *.docx файлы в wpf...

Создание отчетов в формате doc,docx WPF
Добрый день. Такой стал вопрос,созадется приложение что то вроде программы учета,есть в бумажном...

Показ docx файла в RichTextBox
Как отобразить файл что бы сохранилось форматирование? И где это легче сделать(WPF или WinForms)?


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2021, vBulletin Solutions, Inc.