Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
 
Рейтинг 4.83/359: Рейтинг темы: голосов - 359, средняя оценка - 4.83
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10

Открытие и чтение файлов .doc/.docx

03.06.2009, 13:14. Показов 74570. Ответов 21
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
помогите. как средствами visual studio на C# открыть файлы .doc/.docx и прочитать все содержимое файла. или мне еще подходит вариант программного сохранения фалов .doc/.docx в txt
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
03.06.2009, 13:14
Ответы с готовыми решениями:

Чтение doc/docx без использования MS Office
Здравствуйте. Подскажите пожалуйста, есть ли какие-нибудь бесплатные компоненты для чтения файлов Microsoft Word?

Считывание из doc/docx файла
Здравствуйте. Решил таки написать диплом и собственно возник затык в программной части. Пишу что то типа АСУ по обработке док файлов...

Создание отчета .doc / .docx на основе шаблона
Есть шаблон .dot / .dotx, в нем поля с именами. Необходимо из C# создавать файл на основе шаблона, заполнив поля. В рунете никакой свежей...

21
 Аватар для Veyron
107 / 107 / 9
Регистрация: 02.06.2009
Сообщений: 578
03.06.2009, 13:43
На форуме уже была подобная тема. Поищите в разделе по сишарпу ниже тему с названием:

С# Считывание из doc/docx файла.
0
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
03.06.2009, 13:47  [ТС]
Цитата Сообщение от Veyron Посмотреть сообщение
На форуме уже была подобная тема. Поищите в разделе по сишарпу ниже тему с названием:

С# Считывание из doc/docx файла.
что-то там я не нашла как открыть файл. они друг с другом по мылу пообщались и все
0
 Аватар для Veyron
107 / 107 / 9
Регистрация: 02.06.2009
Сообщений: 578
03.06.2009, 14:20
http://msdn.microsoft.com/ru-r... 78746.aspx

Посмотрите на MSDN, там вроде всё написано, только у меня почему-то не работает - нету пространства имен Microsoft.Office... :-(
0
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
03.06.2009, 15:00  [ТС]
Цитата Сообщение от Veyron Посмотреть сообщение
http://msdn.microsoft.com/ru-r... 78746.aspx

Посмотрите на MSDN, там вроде всё написано, только у меня почему-то не работает - нету пространства имен Microsoft.Office... :-(
а что же делать? у меня тоже нет? Вы не нашли решения этой проблемы?
0
 Аватар для Veyron
107 / 107 / 9
Регистрация: 02.06.2009
Сообщений: 578
03.06.2009, 15:34
Я работой с вордовскими документами как-то не занимался, посмотрю что да как...
0
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
03.06.2009, 17:01  [ТС]
Цитата Сообщение от Veyron Посмотреть сообщение
Я работой с вордовскими документами как-то не занимался, посмотрю что да как...
если найдете решение этой проблемы, то я буду Вам очень благодарна. параллельно сама буду этим заниматься. если будут результаты, то опубликую здесь.

Добавлено через 27 минут 43 секунды
в msdn написано, что необходимо использовать Visual Studio Tools for Office, но я не пойму как установить это средство. написано, что идет вместе с visual studio, но у меня нет.
0
 Аватар для Veyron
107 / 107 / 9
Регистрация: 02.06.2009
Сообщений: 578
03.06.2009, 18:30
Цитата Сообщение от lil Посмотреть сообщение
в msdn написано, что необходимо использовать Visual Studio Tools for Office, но я не пойму как установить это средство. написано, что идет вместе с visual studio, но у меня нет.
Visual Studio Tools For Office поставляются в комплекте Visual Studio 2008 Team System или Professional. в VS2005 такого нет вроде...
0
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
04.06.2009, 10:37  [ТС]
Да в 2005 нет, а в 2008 студии нашла Tools for Office. в одном из форумов нашла класс для работы с Word, без необходимости создания проекта Office. есть следующий метод:
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
Type objClassType;
objClassType = Type.GetTypeFromProgID("Word.Applic ation");
internalWord = Activator.CreateInstance(objClassTy pe);
 
//Открытие файла
object objDocs_Late = internalWord.GetType().InvokeMember (
"Documents", BindingFlags.GetProperty, null, internalWord, null);
 
object[] Parameters;
Parameters = new Object[1];
Parameters[0] = FileName;
objCurDoc = objDocs_Late.GetType().InvokeMember ("Open",
BindingFlags.InvokeMethod, null, objDocs_Late, Parameters);
 
//Сохранение файла 
public bool SaveAs(string filename)
{
if (objCurDoc == null) return false;
object[] Parameters = new Object[2];
Parameters[0] = filename; //find text
try
{
objCurDoc.GetType().InvokeMember("S aveAs",
BindingFlags.InvokeMethod, null, objCurDoc, Parameters);
return true;
}
catch
{
return false;
}
}
Он сохраняет, но только в формате doc или docx, а как явно здесь задать формат сохранения файла?
1
 Аватар для Veyron
107 / 107 / 9
Регистрация: 02.06.2009
Сообщений: 578
04.06.2009, 11:25
А какой вам нужен тип? TXT? если ТХТ, то тут просто
File.WriteAllText("путь_к_Файлу", содержимое_в_формате_string);
1
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
04.06.2009, 11:40  [ТС]
Цитата Сообщение от Veyron Посмотреть сообщение
А какой вам нужен тип? TXT? если ТХТ, то тут просто
File.WriteAllText("путь_к_Файлу", содержимое_в_формате_string);
да. именно это и нужно. сохранить в txt, но начальный файл, который я читаю он в формате .doc. ниже код. он создает txt, но кодировка не подходит наверно. одни закарючки в файле
string str="";
str = File.ReadAllText("c:/123.doc");
File.WriteAllText("c:/123.txt", str, System.Text.Encoding.Default);
0
 Аватар для Veyron
107 / 107 / 9
Регистрация: 02.06.2009
Сообщений: 578
04.06.2009, 11:52
Цитата Сообщение от lil Посмотреть сообщение
str = File.ReadAllText("c:/123.doc");
это неверно: вордовский документ - не текстовый, а бинарный байл. Просто его не считать.
0
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
04.06.2009, 12:02  [ТС]
вот в этом-то и проблема. мне нужно считать содержимое вордовского файла. выше я приводила код работы с документом word, но без использования Tools for Office. но не могу понять как считать содержимое. или может без считывания просто пересохранить в txt. что посоветуете в этом случае?
0
 Аватар для Veyron
107 / 107 / 9
Регистрация: 02.06.2009
Сообщений: 578
04.06.2009, 12:26
Если честно, я пока не смотрел ваш код. )) ща гляну и скажу...

Добавлено через 15 минут 10 секунд
http://www.textcontrol.com/

ссылка на компонент работы с вордовскими документами. Два минуса - триальный,на 60 дней. второе - весит 16 мб.
0
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
04.06.2009, 14:04  [ТС]
а других вариантов нет? только через эти компоненты можно работать с word?
0
 Аватар для Veyron
107 / 107 / 9
Регистрация: 02.06.2009
Сообщений: 578
04.06.2009, 14:18
Лучший ответ Сообщение было отмечено как решение

Решение

Для работы с документами Office необходимо наличие Visual Studio Tools For Office. Visual Studio 2008 имеет этот компонент. Итак, суть. Для начала нужно подключить сборки (открываем Solution Explorer->References->Add References. Там на вкладке .NET ищем Microsoft.Office.Interop.Word и Office, добавляем их. Если у вас Visual Studio 2005, можете воспользоваться сборками из архива, только нет гарантии что они заработают. Для добавления сборок из архива также откройте Add References, а там жмите вкладку Browse, затем найдите эти библиотеки на жестком диске.) Далее, в самом начале кода, где подключать модули, дописываем
C#
1
2
using Word = Microsoft.Office.Interop.Word;
using Office = Microsoft.Office.Core;
Далее вставляем куда надо следующий код:
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
Object filename = "C:\\Word.doc";
            Object confirmConversions = Type.Missing;
            Object readOnly = Type.Missing;
            Object addToRecentFiles = Type.Missing;
            Object passwordDocument = Type.Missing;
            Object passwordTemplate = Type.Missing;
            Object revert = Type.Missing;
            Object writePasswordDocument = Type.Missing;
            Object writePasswordTemplate = Type.Missing;
            Object format = Type.Missing;
            Object encoding = Type.Missing;
            Object visible = Type.Missing;
            Object openConflictDocument = Type.Missing;
            Object openAndRepair = Type.Missing;
            Object documentDirection = Type.Missing;
            Object noEncodingDialog = Type.Missing;
            Word.Application Progr = new Microsoft.Office.Interop.Word.Application();
            Progr.Documents.Open(ref filename,
                ref confirmConversions,
                ref readOnly,
                ref addToRecentFiles,
                ref passwordDocument,
                ref passwordTemplate,
                ref revert,
                ref writePasswordDocument,
                ref writePasswordTemplate,
                ref format,
                ref encoding,
                ref visible,
                ref openConflictDocument,
                ref openAndRepair,
                ref documentDirection,
                ref noEncodingDialog);
            Word.Document Doc= new Microsoft.Office.Interop.Word.Document();
            Doc = Progr.Documents.Application.ActiveDocument;
            object start = 0;
            object stop = Doc.Characters.Count;
            Word.Range Rng = Doc.Range(ref start, ref stop);
            string Result = Rng.Text;
            object sch = Type.Missing;
            object aq = Type.Missing;
            object ab = Type.Missing;
            Progr.Quit(ref sch, ref aq, ref ab);
Вместо "C:\\Word.doc" введите свой путь к файлу. В итоге работы данного кода в переменной Result будет весь текст из документа, путь к которому вы ввели.
Вложения
Тип файла: rar WordAddins.rar (190.4 Кб, 645 просмотров)
3
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
04.06.2009, 15:23  [ТС]
Цитата Сообщение от Veyron Посмотреть сообщение
Для добавления сборок из архива также откройте Add References, а там жмите вкладку Browse, затем найдите эти библиотеки на жестком диске.) Далее, в самом начале кода, где подключать модули, дописываем
а как называются библиотеки, которые нужно добавить ?

Добавлено через 1 минуту 38 секунд
а поняла, они в архиве
0
 Аватар для Veyron
107 / 107 / 9
Регистрация: 02.06.2009
Сообщений: 578
04.06.2009, 15:26
Две сборки лежат в архиве WordAddins. Он прикреплен к моему предыдущему сообщению.
1
1 / 1 / 0
Регистрация: 03.06.2009
Сообщений: 10
04.06.2009, 15:58  [ТС]
Спасибо большое, нет огромное спасибо, Veyron!!!
все работает! очень выручили.
Вот еще добавила к Вашему коду сохранение файла в формате txt:
C#
1
2
3
4
5
6
7
8
9
10
       object Target = "c:\\123.txt";// куда сохранить
            object Unknown = Type.Missing;
            object format_ = Word.WdSaveFormat.wdFormatText;
            //Сохранение файла в формате txt
            Doc.SaveAs(ref Target, ref format_,
                    ref Unknown, ref Unknown, ref Unknown,
                    ref Unknown, ref Unknown, ref Unknown,
                    ref Unknown, ref Unknown, ref Unknown,
                    ref Unknown, ref Unknown, ref Unknown,
                    ref Unknown, ref Unknown);
Добавлено через 2 минуты 10 секунд
Работаю в Visual Studio 2005. так, что гарантия работы уже есть
0
0 / 0 / 0
Регистрация: 17.03.2009
Сообщений: 10
14.06.2009, 14:07
Цитата Сообщение от Veyron Посмотреть сообщение
Для работы с документами Office необходимо наличие Visual Studio Tools For Office...
Veyron, вы пробовали делать поиск внутри Word.Range с последующим выдиранием оттуда искомого отрезка?
Тут где то была ссылка на мою тему...так и не смог решить проблему со сдвигом границ range изза скрытых символов.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
14.06.2009, 14:07
Помогаю со студенческими работами здесь

Работа с файлами в формате .doc, .docx, .xls, .xlsx
Добрый день! Подскажите, есть ли какая-то альтернатива COM-объектам для извлечения текста из форматов .doc, .docx, .xls, .xlsx? ...

Открытие doc файла, имя которого в фигурных скобках
Здравствуйте Ниже представлен код, который открывает doc файл и сохраняет его в txt формат. Код рабочий, но проблема в том, что когда...

Открытие неизвестных файлов, например файлов ресурсов игры для распаковки
Хочу научиться писать программы для открытия неизвестных файлов. например, вышла какая-нибудь игра, а в ней ресурсы или конфиги в...

Открытие нескольких файлов
Как при помощи компонента OpenFileDialog открыть несколько файлов?:confused: Ставлю свойство MultiSelect true, открывается последний...

Открытие текстовых файлов на кириллице...
Дамы и господа! Следуя кипричеобразному учебнику по C# "Пять счастливых лиц" (Морган, Ивьен и т.д.), попытался пооткрывать...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
20
Ответ Создать тему
Новые блоги и статьи
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru