Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
 
 
Рейтинг 4.79/308: Рейтинг темы: голосов - 308, средняя оценка - 4.79
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
1

Открытие и чтение файлов .doc/.docx

03.06.2009, 13:14. Показов 60787. Ответов 21
Метки нет (Все метки)

помогите. как средствами visual studio на C# открыть файлы .doc/.docx и прочитать все содержимое файла. или мне еще подходит вариант программного сохранения фалов .doc/.docx в txt
0
Лучшие ответы (1)
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
03.06.2009, 13:14
Ответы с готовыми решениями:

Чтение doc/docx без использования MS Office
Здравствуйте. Подскажите пожалуйста, есть ли какие-нибудь бесплатные компоненты для чтения файлов...

Считывание из doc/docx файла
Здравствуйте. Решил таки написать диплом и собственно возник затык в программной части. Пишу что...

Создание отчета .doc / .docx на основе шаблона
Есть шаблон .dot / .dotx, в нем поля с именами. Необходимо из C# создавать файл на основе шаблона,...

Работа с файлами в формате .doc, .docx, .xls, .xlsx
Добрый день! Подскажите, есть ли какая-то альтернатива COM-объектам для извлечения текста из...

21
106 / 106 / 9
Регистрация: 02.06.2009
Сообщений: 578
03.06.2009, 13:43 2
На форуме уже была подобная тема. Поищите в разделе по сишарпу ниже тему с названием:

С# Считывание из doc/docx файла.
0
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
03.06.2009, 13:47  [ТС] 3
Цитата Сообщение от Veyron Посмотреть сообщение
На форуме уже была подобная тема. Поищите в разделе по сишарпу ниже тему с названием:

С# Считывание из doc/docx файла.
что-то там я не нашла как открыть файл. они друг с другом по мылу пообщались и все
0
106 / 106 / 9
Регистрация: 02.06.2009
Сообщений: 578
03.06.2009, 14:20 4
http://msdn.microsoft.com/ru-r... 78746.aspx

Посмотрите на MSDN, там вроде всё написано, только у меня почему-то не работает - нету пространства имен Microsoft.Office... :-(
0
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
03.06.2009, 15:00  [ТС] 5
Цитата Сообщение от Veyron Посмотреть сообщение
http://msdn.microsoft.com/ru-r... 78746.aspx

Посмотрите на MSDN, там вроде всё написано, только у меня почему-то не работает - нету пространства имен Microsoft.Office... :-(
а что же делать? у меня тоже нет? Вы не нашли решения этой проблемы?
0
106 / 106 / 9
Регистрация: 02.06.2009
Сообщений: 578
03.06.2009, 15:34 6
Я работой с вордовскими документами как-то не занимался, посмотрю что да как...
0
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
03.06.2009, 17:01  [ТС] 7
Цитата Сообщение от Veyron Посмотреть сообщение
Я работой с вордовскими документами как-то не занимался, посмотрю что да как...
если найдете решение этой проблемы, то я буду Вам очень благодарна. параллельно сама буду этим заниматься. если будут результаты, то опубликую здесь.

Добавлено через 27 минут 43 секунды
в msdn написано, что необходимо использовать Visual Studio Tools for Office, но я не пойму как установить это средство. написано, что идет вместе с visual studio, но у меня нет.
0
106 / 106 / 9
Регистрация: 02.06.2009
Сообщений: 578
03.06.2009, 18:30 8
Цитата Сообщение от lil Посмотреть сообщение
в msdn написано, что необходимо использовать Visual Studio Tools for Office, но я не пойму как установить это средство. написано, что идет вместе с visual studio, но у меня нет.
Visual Studio Tools For Office поставляются в комплекте Visual Studio 2008 Team System или Professional. в VS2005 такого нет вроде...
0
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
04.06.2009, 10:37  [ТС] 9
Да в 2005 нет, а в 2008 студии нашла Tools for Office. в одном из форумов нашла класс для работы с Word, без необходимости создания проекта Office. есть следующий метод:
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
Type objClassType;
objClassType = Type.GetTypeFromProgID("Word.Applic ation");
internalWord = Activator.CreateInstance(objClassTy pe);
 
//Открытие файла
object objDocs_Late = internalWord.GetType().InvokeMember (
"Documents", BindingFlags.GetProperty, null, internalWord, null);
 
object[] Parameters;
Parameters = new Object[1];
Parameters[0] = FileName;
objCurDoc = objDocs_Late.GetType().InvokeMember ("Open",
BindingFlags.InvokeMethod, null, objDocs_Late, Parameters);
 
//Сохранение файла 
public bool SaveAs(string filename)
{
if (objCurDoc == null) return false;
object[] Parameters = new Object[2];
Parameters[0] = filename; //find text
try
{
objCurDoc.GetType().InvokeMember("S aveAs",
BindingFlags.InvokeMethod, null, objCurDoc, Parameters);
return true;
}
catch
{
return false;
}
}
Он сохраняет, но только в формате doc или docx, а как явно здесь задать формат сохранения файла?
1
106 / 106 / 9
Регистрация: 02.06.2009
Сообщений: 578
04.06.2009, 11:25 10
А какой вам нужен тип? TXT? если ТХТ, то тут просто
File.WriteAllText("путь_к_Файлу", содержимое_в_формате_string);
1
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
04.06.2009, 11:40  [ТС] 11
Цитата Сообщение от Veyron Посмотреть сообщение
А какой вам нужен тип? TXT? если ТХТ, то тут просто
File.WriteAllText("путь_к_Файлу", содержимое_в_формате_string);
да. именно это и нужно. сохранить в txt, но начальный файл, который я читаю он в формате .doc. ниже код. он создает txt, но кодировка не подходит наверно. одни закарючки в файле
string str="";
str = File.ReadAllText("c:/123.doc");
File.WriteAllText("c:/123.txt", str, System.Text.Encoding.Default);
0
106 / 106 / 9
Регистрация: 02.06.2009
Сообщений: 578
04.06.2009, 11:52 12
Цитата Сообщение от lil Посмотреть сообщение
str = File.ReadAllText("c:/123.doc");
это неверно: вордовский документ - не текстовый, а бинарный байл. Просто его не считать.
0
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
04.06.2009, 12:02  [ТС] 13
вот в этом-то и проблема. мне нужно считать содержимое вордовского файла. выше я приводила код работы с документом word, но без использования Tools for Office. но не могу понять как считать содержимое. или может без считывания просто пересохранить в txt. что посоветуете в этом случае?
0
106 / 106 / 9
Регистрация: 02.06.2009
Сообщений: 578
04.06.2009, 12:26 14
Если честно, я пока не смотрел ваш код. )) ща гляну и скажу...

Добавлено через 15 минут 10 секунд
http://www.textcontrol.com/

ссылка на компонент работы с вордовскими документами. Два минуса - триальный,на 60 дней. второе - весит 16 мб.
0
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
04.06.2009, 14:04  [ТС] 15
а других вариантов нет? только через эти компоненты можно работать с word?
0
106 / 106 / 9
Регистрация: 02.06.2009
Сообщений: 578
04.06.2009, 14:18 16
Лучший ответ Сообщение было отмечено как решение

Решение

Для работы с документами Office необходимо наличие Visual Studio Tools For Office. Visual Studio 2008 имеет этот компонент. Итак, суть. Для начала нужно подключить сборки (открываем Solution Explorer->References->Add References. Там на вкладке .NET ищем Microsoft.Office.Interop.Word и Office, добавляем их. Если у вас Visual Studio 2005, можете воспользоваться сборками из архива, только нет гарантии что они заработают. Для добавления сборок из архива также откройте Add References, а там жмите вкладку Browse, затем найдите эти библиотеки на жестком диске.) Далее, в самом начале кода, где подключать модули, дописываем
C#
1
2
using Word = Microsoft.Office.Interop.Word;
using Office = Microsoft.Office.Core;
Далее вставляем куда надо следующий код:
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
Object filename = "C:\\Word.doc";
            Object confirmConversions = Type.Missing;
            Object readOnly = Type.Missing;
            Object addToRecentFiles = Type.Missing;
            Object passwordDocument = Type.Missing;
            Object passwordTemplate = Type.Missing;
            Object revert = Type.Missing;
            Object writePasswordDocument = Type.Missing;
            Object writePasswordTemplate = Type.Missing;
            Object format = Type.Missing;
            Object encoding = Type.Missing;
            Object visible = Type.Missing;
            Object openConflictDocument = Type.Missing;
            Object openAndRepair = Type.Missing;
            Object documentDirection = Type.Missing;
            Object noEncodingDialog = Type.Missing;
            Word.Application Progr = new Microsoft.Office.Interop.Word.Application();
            Progr.Documents.Open(ref filename,
                ref confirmConversions,
                ref readOnly,
                ref addToRecentFiles,
                ref passwordDocument,
                ref passwordTemplate,
                ref revert,
                ref writePasswordDocument,
                ref writePasswordTemplate,
                ref format,
                ref encoding,
                ref visible,
                ref openConflictDocument,
                ref openAndRepair,
                ref documentDirection,
                ref noEncodingDialog);
            Word.Document Doc= new Microsoft.Office.Interop.Word.Document();
            Doc = Progr.Documents.Application.ActiveDocument;
            object start = 0;
            object stop = Doc.Characters.Count;
            Word.Range Rng = Doc.Range(ref start, ref stop);
            string Result = Rng.Text;
            object sch = Type.Missing;
            object aq = Type.Missing;
            object ab = Type.Missing;
            Progr.Quit(ref sch, ref aq, ref ab);
Вместо "C:\\Word.doc" введите свой путь к файлу. В итоге работы данного кода в переменной Result будет весь текст из документа, путь к которому вы ввели.
3
Вложения
Тип файла: rar WordAddins.rar (190.4 Кб, 594 просмотров)
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
04.06.2009, 15:23  [ТС] 17
Цитата Сообщение от Veyron Посмотреть сообщение
Для добавления сборок из архива также откройте Add References, а там жмите вкладку Browse, затем найдите эти библиотеки на жестком диске.) Далее, в самом начале кода, где подключать модули, дописываем
а как называются библиотеки, которые нужно добавить ?

Добавлено через 1 минуту 38 секунд
а поняла, они в архиве
0
106 / 106 / 9
Регистрация: 02.06.2009
Сообщений: 578
04.06.2009, 15:26 18
Две сборки лежат в архиве WordAddins. Он прикреплен к моему предыдущему сообщению.
1
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
04.06.2009, 15:58  [ТС] 19
Спасибо большое, нет огромное спасибо, Veyron!!!
все работает! очень выручили.
Вот еще добавила к Вашему коду сохранение файла в формате txt:
C#
1
2
3
4
5
6
7
8
9
10
       object Target = "c:\\123.txt";// куда сохранить
            object Unknown = Type.Missing;
            object format_ = Word.WdSaveFormat.wdFormatText;
            //Сохранение файла в формате txt
            Doc.SaveAs(ref Target, ref format_,
                    ref Unknown, ref Unknown, ref Unknown,
                    ref Unknown, ref Unknown, ref Unknown,
                    ref Unknown, ref Unknown, ref Unknown,
                    ref Unknown, ref Unknown, ref Unknown,
                    ref Unknown, ref Unknown);
Добавлено через 2 минуты 10 секунд
Работаю в Visual Studio 2005. так, что гарантия работы уже есть
0
0 / 0 / 0
Регистрация: 17.03.2009
Сообщений: 10
14.06.2009, 14:07 20
Цитата Сообщение от Veyron Посмотреть сообщение
Для работы с документами Office необходимо наличие Visual Studio Tools For Office...
Veyron, вы пробовали делать поиск внутри Word.Range с последующим выдиранием оттуда искомого отрезка?
Тут где то была ссылка на мою тему...так и не смог решить проблему со сдвигом границ range изза скрытых символов.
0
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
14.06.2009, 14:07

Заказываю контрольные, курсовые, дипломные работы и диссертации здесь.

Открытие doc файла, имя которого в фигурных скобках
Здравствуйте Ниже представлен код, который открывает doc файл и сохраняет его в txt формат. Код...

Открытие неизвестных файлов, например файлов ресурсов игры для распаковки
Хочу научиться писать программы для открытия неизвестных файлов. например, вышла какая-нибудь...

Открытие нескольких файлов
Как при помощи компонента OpenFileDialog открыть несколько файлов?:confused: Ставлю свойство...

Открытие текстовых файлов на кириллице...
Дамы и господа! Следуя кипричеобразному учебнику по C# "Пять счастливых лиц" (Морган, Ивьен и...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
20
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2021, vBulletin Solutions, Inc.