Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.98/162: Рейтинг темы: голосов - 162, средняя оценка - 4.98
 Аватар для Гоблин
1 / 1 / 1
Регистрация: 17.10.2010
Сообщений: 29

Конвертация html в doc и doc в html или rtf

15.03.2011, 21:35. Показов 32170. Ответов 15
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте. Есть необходимость конвертировать на сервере текст из doc-файла в html, хранящийся в базе данных, и обратно. Ни одного готового класса для такой задачи я не нашел. Возможно ли это вообще средствами php? Или, как вариант, возможно лучше использовать какой-либо cgi-скрипт, написанный, к примеру, на делфи? В последнем случае не имею представления что и как для этого использовать, да еще что бы работало под линухом... Буду очень рад любому совету.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
15.03.2011, 21:35
Ответы с готовыми решениями:

Конвертация html в .rtf/.doc
Друзья, вопрос такой: не подскажите хорошую БЕСПЛАТНУЮ (варианты с кряками или триал-версиями не подходят) программу для конвертации html...

Какими средствами написать конвертер DOC-HTML, HTML-DOC
Доброе время суток. Необходимо написать конвертер DOC-HTML, HTML-DOC. Как это сделать, ума не приложу. Есть идея использования регулярных...

Convert HTML to DOC or RTF
Как и чем в ASP можно перегнать html в RTF или DOC?

15
191 / 191 / 31
Регистрация: 04.10.2010
Сообщений: 505
15.03.2011, 22:20
Как на счет перевести в doc, наверное возможно, но не сталкивался с этим.
А вот как перевести в rtf - это уже более реально. Когда-то делал что-то похожее, только на C++.
Тут самое главное прочитать и понять "спецификацию rtf". Но это займет много времени)))
http://en.wikipedia.org/wiki/Rich_Text_Format - тут внизу есть ссылки на спецификации.
0
 Аватар для Гоблин
1 / 1 / 1
Регистрация: 17.10.2010
Сообщений: 29
16.03.2011, 00:15  [ТС]
А вот как перевести в rtf - это уже более реально.
Посмотрел. С ним действительно проблем, в общем-то, нет. Но в силу того что подавляющее большинство документов хранятся именно в doc'е нужно что-то с ним придумать.
Когда-то делал что-то похожее, только на C++
Язык в данном случае особой роли не играет.
Немного по-иному поставлю вопрос: возможно ли использовать дельфи или си с их встроенными ole объектами для написания cgi скрипта? Да еще так, что бы это дело работало под линуксом? Может кто ни будь что ни будь может посоветовать почитать по теме?
Кстати, наверное, топик не в той теме начат... Прошу у модераторов прощения...
0
 Аватар для romchiksoad
1957 / 796 / 89
Регистрация: 03.11.2009
Сообщений: 3,066
Записей в блоге: 2
16.03.2011, 06:33
Гоблин, так на каком Вам языке? Мне нужно знать в какой раздел форума перенести Ваш топик.
0
 Аватар для Гоблин
1 / 1 / 1
Регистрация: 17.10.2010
Сообщений: 29
16.03.2011, 09:11  [ТС]
Цитата Сообщение от romchiksoad Посмотреть сообщение
Гоблин, так на каком Вам языке? Мне нужно знать в какой раздел форума перенести Ваш топик.
Нет разницы: php или c, или delphi, скомпилированные как cgi... Интересует ведь именно "как лучше" и "как возможно" это сделать...
0
 Аватар для StagnantIce
125 / 105 / 40
Регистрация: 06.03.2011
Сообщений: 334
29.03.2011, 20:37
Я это сделал)) подробнее как тут [Ссылка удалена модератором!]
Статья
Конвертация html с картинками в word (doc) на PHP

Сегодня я хочу рассказать о том, что вы вряд ли найдете на каком либо форуме. Существует множество тем посвященных конвертации html (или просто текста) в word формат doc. И многие говорят, что тут не обойтись без COM или же RTF преобразования, что просто использовать html в doc файлах слишком накладно(большой размер) и нельзя в то же время вставлять такие нужные картинки.
Сегодня я развею этот миф. Делать это можно, и по сравнению с RTF форматом, DOC файлы состряпанные из HTML являются намного меньшими по размеру. Сразу скажу, что я не претендую на оптимальный алгоритм все ниже сказанного, я просто постараюсь вкратце рассказать, как из html с картинками и таблицами сделать полноценный doc файл. Итак, поехали.
Что пользователю нужно передать сначала? Правильно, заголовки, в заголвках мы указываем xml файл, который содержит пути ко всем картинкам в html. Далее используя пакеты и кодировку base64 мы передаем пакетами с новыми заголовками все изображения перекодированные в base64 с помощью функции php base64_encode.
Пакеты могут иметь например следующий синтаксис
------=_NextPart_01C810C7.8CD49EE0
Content-Location: file:///C:/AF22D505/images/images1.gif
Content-Transfer-Encoding: base64
Content-Type: image/gif После этого ваши картинки будут отображаться. Мне лично понадобилось около трех часов, чтобы все получилось. Но это работает!
Последним пакетом мы отправляем сам xml файл с названиями картинок.
1
84 / 84 / 8
Регистрация: 12.04.2010
Сообщений: 324
30.03.2011, 06:07
Я делал так:
страничка с формой:
PHP
1
2
3
4
5
<form action="to_doc.php" method="post">
<textarea name="content"></textarea>
<!-- тут может быть что угодно и сколько угодно -->
<input type="submit" />
</form>
файл обработчик to_doc.php
PHP
1
2
3
4
5
6
7
8
9
10
11
$content = $_POST['content']
header('Content-type: application/vnd.ms-word');
header('Content-Disposition: attachment;Filename=my_file.doc');
 
echo '<html>
<meta http-equiv=\'Content-Type\' content=\'text/html; charset=windows-1251\'>
<body>';
 
echo '$content';
 
echo '</body></html>';
код корявенький, давно делал, немного доработать и всё работает как надо
1
 Аватар для Гоблин
1 / 1 / 1
Регистрация: 17.10.2010
Сообщений: 29
06.04.2011, 12:01  [ТС]
2 xand: в вашем примере текст без разметки просто отображается в ворд на пользовательской машине, в моем случае конвертация должна происходить на сервере без использования самого офиса, и со всей разметкой.
2 StagnantIce: вы сохраняете хтмл в файлы док, это тоже не лучшее решение.
На самом деле для апача есть модуль POI, написанный на яве, который позволяет на сервере формировать кучу форматов (даже xls) из хтмл. На мой взгляд - самое элегантное решение. Сейчас с ним разбираюсь.
0
84 / 84 / 8
Регистрация: 12.04.2010
Сообщений: 324
06.04.2011, 13:28
Гоблин, а у меня чёт нормально работает, и таблицы отображаются, и переводы строк и тд...
0
 Аватар для StagnantIce
125 / 105 / 40
Регистрация: 06.03.2011
Сообщений: 334
06.04.2011, 15:34
Цитата Сообщение от Гоблин Посмотреть сообщение
2 StagnantIce: вы сохраняете хтмл в файлы док, это тоже не лучшее решение.
На самом деле для апача есть модуль POI, написанный на яве, который позволяет на сервере формировать кучу форматов (даже xls) из хтмл. На мой взгляд - самое элегантное решение. Сейчас с ним разбираюсь.
Зато не самое простое. По мне так это каждый тег через COM функцию прогонять. В моем способе картинки и таблицы есть, больше ничего не нужно.
0
 Аватар для deoleg
0 / 0 / 0
Регистрация: 04.01.2010
Сообщений: 93
27.09.2011, 10:25
Я тоже столкнулся с подобным ( а может и таким же) вопросом. Сайт на Joomla. Пытаюсь сохранить документ в word. Пока пытаюсь с этим разобраться. Для написания php кода использую плагин System - Sourcerer. Он позволяет в статьи писать php и обрабатывает его. Была проблема, при выводе запроса на сохранение, браузер не определял что это word, решил так:
PHP
1
2
$doc =& JFactory::getDocument();
$doc->setMimeEncoding('application/msword');
Сейчас хочу сохранить содержимое переменной в word.
PHP
1
2
3
4
$content = "Тест!!!"; 
header('Content-type: application/vnd.ms-word');
header('Content-Disposition: attachment; Filename=my_file.doc');
echo "$content";
У меня предлагает сохранить word документ. Когда я его открываю, то у меня там получается не "Тест!!!", а весь html Joomla страницы. т.е. со всеми меню и т.д.
Примерно так:

• Меню_1
o Подменю_1
o Подменю_2
o Подменю_3
o Подменю_4
• Меню_2
o Подменю_1
o Подменю_2
o Подменю_3
o Подменю_4
o Подменю_5
• Меню_3
o Подменю_1
o Подменю_2
o Подменю_3
o Подменю_4
o Подменю_5
o Подменю_6
• Меню_4
o Подменю_1
o Подменю_2
o Подменю_3
o Подменю_4
Главная
$Тест!!!
и т.д.
Как мне сделать чтобы сохранялось в word только содержимое переменной $content? Заранее спасибо
0
 Аватар для StagnantIce
125 / 105 / 40
Регистрация: 06.03.2011
Сообщений: 334
27.09.2011, 17:39
сделать в конце exit(); а в начале ob_clean();
0
0 / 0 / 0
Регистрация: 29.09.2011
Сообщений: 11
29.09.2011, 12:31
О deoleg Я тоже столкнулся с подобным ( а может и таким же) вопросом. Сайт на Joomla.


такая же проблема, не подскажете как решили ?.
0
0 / 0 / 0
Регистрация: 16.09.2011
Сообщений: 3
08.10.2011, 12:05
Цитата Сообщение от Гоблин Посмотреть сообщение
Здравствуйте. Есть необходимость конвертировать на сервере текст из doc-файла в html, хранящийся в базе данных, и обратно. Ни одного готового класса для такой задачи я не нашел. Возможно ли это вообще средствами php? Или, как вариант, возможно лучше использовать какой-либо cgi-скрипт, написанный, к примеру, на делфи? В последнем случае не имею представления что и как для этого использовать, да еще что бы работало под линухом... Буду очень рад любому совету.
Может быть, как вариант использовать .Net компонент для конвертирования HTML в Word и Word в HTML?! После танцев с бубном, я полагаю это можно запустить и на линуксовом сервере!

C#
1
2
3
4
5
6
7
8
9
10
                       SautinSoft.HtmlToRtf objH = new SautinSoft.HtmlToRtf();
            
            //set some converting options
            //set page size as Letter
            objH.PageStyle.PageSize.Letter();
            //set left margin 20 mm
            objH.PageStyle.PageMarginLeft.mm(20f);
            
            //convert HTML file to RTF file
            int ret = objH.ConvertFile(@"C:\Temp\1.htm", @"C:\Temp\1.rtf");
0
cmutek
11.05.2012, 18:13
Если кому ещё надо, тут интересный скрипт для конвертации из doc в html через Google API:
ссылка
 Аватар для Aeliot
177 / 62 / 3
Регистрация: 17.11.2011
Сообщений: 318
22.01.2015, 12:32
-> xand
Как внедрить стили?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
22.01.2015, 12:32
Помогаю со студенческими работами здесь

Конвертация .doc в .html.
Menya interesuyut component-i i biblioteki pri pomosi kotorix vozmozna convertaciya format-a .doc v .html s podderzkoy kodirovki UTF-8.

Конвертация docx/doc в html
есть возможность сделать на JS,NodeJS? без использования сторонних API

Конвертация html в doc, pdf, djv
Здравствуйте, Всем, может ктонить подсказать, как решить проблему. Скачал книгу интересную, она тока в html формате, в winrare. Нужны ли...

Конвертация *.doc файла в формат html
Всем привет!!! Начал писать прогу парсер doc файлов. С регулярками разобрался. Теперь необходимо конвертация этого же doc файла в формат...

конвертация html-документа в doc, на основе шаблона
Здраствуйте, товарищи!! Такая задача: Некая программа генерирует отчеты в html формате, причем создает html-страницы динамически на...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
16
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru