|
18 / 18 / 15
Регистрация: 27.11.2013
Сообщений: 470
|
|
Сохранение текста и изображений в файл05.05.2021, 15:57. Показов 2115. Ответов 4
Метки нет (Все метки)
Здравствуйте. Стоит цель спарсить определенную страницу. На ней может быть как текст, так и изображение.
С помощью htmlagilitypack удается получить содержимое страницы в виде html, как текстовое, так и ссылки на картинки. Есть простой вариант с сохранением исходного html-кода в виде .html файла, тогда и изображения отображаются в нем, и текст форматирован. Однако затем конвертировать такие файлы в pdf, epub или fb2 бесполезно, т.к. изображения теряются, а порой и форматирование текста. И неважно какие программы для этого использую. Даже calibre не справляется. Поэтому возник вопрос: а есть способ изначально сохранять файлы, например, в epub? Либо любом другом формате, который бы позволял затем спокойно конвертировать его в нужные мне без потери каких-либо изначальных особенностей, будь то картинки или форматирование текста.
0
|
|
| 05.05.2021, 15:57 | |
|
Ответы с готовыми решениями:
4
Ввод текста, сохранение текста в файл, вывод текста из файла
Сохранение и открытые изображений из pictureBox в файл |
|
1152 / 860 / 263
Регистрация: 30.04.2009
Сообщений: 3,603
|
|
| 06.05.2021, 05:42 | |
|
html не содержит картинок, только текст и ссылки.
0
|
|
|
14303 / 9388 / 1354
Регистрация: 21.01.2016
Сообщений: 35,397
|
||||||
| 06.05.2021, 05:46 | ||||||
|
nicolas2008, картинки тоже может, только хитрым образом:
0
|
||||||
|
1152 / 860 / 263
Регистрация: 30.04.2009
Сообщений: 3,603
|
|
| 06.05.2021, 06:27 | |
|
Usaga, можно, но если я правильно понял, по условиям задачи нужно уметь automagically сохранять с картинками произвольные html страницы, в которых обычно содержатся ссылки на картинки и стили.
0
|
|
|
18 / 18 / 15
Регистрация: 27.11.2013
Сообщений: 470
|
||
| 06.05.2021, 13:32 [ТС] | ||
|
0
|
||
| 06.05.2021, 13:32 | |
|
Помогаю со студенческими работами здесь
5
Сохранение изображений в файл в отдельном потоке (TThread)
Сохранение введенного текста в обычный текстовый файл, либо в файл HTML Сохранение текста в файл Сохранение текста в файл Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
|
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога
Финальные проекты на Си и на C++:
hello-sdl3-c. zip
hello-sdl3-cpp. zip
Результат:
|
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога
MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
|
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд.
Даже если у вас. . .
|
|
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает
монорепозиторий в котором находятся все исходники.
При создании нового решения, мы просто добавляем нужные проекты
и имеем. . .
|
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение:
В этой книге («Подход, основанный на вариантах использования») Ивар утверждает,
что архитектура программного обеспечения — это
структуры,. . .
|
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога
Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
|
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога
Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip
На первой гифке отладочные линии отключены, а на второй включены:. . .
|