|
Oleg
|
|
Как очистить HTML от мусора?19.06.2008, 10:21. Показов 1988. Ответов 4
Метки нет (Все метки)
Помогите!!! Есть HTML-файл. Надо преобразовать его в текстовый.
Это можно сделать, если открыть IE и сказать сохранить как текст. А как сделать эту работу автоматически? Т.е. на входе несколько (много) файлов и надо все их переделать в текстовые. Есть компонент HTMLView, но как с ним работать я не знаю. И вообще можно ли с его помощью что либо сделать? Заранее благодарен. |
|
| 19.06.2008, 10:21 | |
|
Ответы с готовыми решениями:
4
Очистить от html мусора
Нужно очистить ПК от мусора |
|
0 / 0 / 0
Регистрация: 18.06.2008
Сообщений: 4
|
|
| 19.06.2008, 11:20 | |
|
Можно поробовать regular expressions. К примеру, тэги table и br заменять на перевод строки, остальные же просто выкидывать, оставляя текст...
0
|
|
|
2 / 2 / 1
Регистрация: 30.07.2007
Сообщений: 206
|
|
| 23.06.2008, 01:06 | |
|
Я делаю так. Есть исходный htm-текст со всеми тегами. Ты последовательно находишь через InStr знак меньше (<), затем знак больше (>) и удаляешь всю информацию, заключенную между этими тегами. Затем ты замечаешь, что остается 'пустая' информация, заключенная в теги скриптов или счетчиков. Вот сначала и надо удалять такую информацию, а потом вылавливать основной текст.
Я пользовался таким алгоритмом долгое время, но потом понял, что лучше всего сшить все файлы для обработки в один файл (через программу FAR), а затем действительно ВЫДЕЛИТЬ весь текст, СКОПИРОВАТЬ и вставить для дальнейшей обработки в любой текстовой редактор. Если нужен совет, пиши на bigsharig@mtu-net.ru
0
|
|
|
51 / 17 / 6
Регистрация: 18.05.2007
Сообщений: 1,322
|
||||||
| 23.06.2008, 09:32 | ||||||
|
Пора заносить в FAQ
![]()
0
|
||||||
|
Oleg
|
|
| 23.06.2008, 09:53 | |
|
А кто-нибудь пробовал это сделать через IE, но только автоматически.
Скажем в васике вызвать объект IE и с ним поработать: открыть файл и сохранить как... |
|
| 23.06.2008, 09:53 | |
|
Помогаю со студенческими работами здесь
5
Как очистить урл после .html Я сохраняю html как текст, а как txt очистить от тегов? Регулярным выражением очистить ширину и высоту ячейки таблицы HTML Как избавиться от мусора в массиве? Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога
Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
|
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
|
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога
В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
|
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога
Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
|
|
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога
Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
|
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
|
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования.
Часть библиотеки BedvitCOM
Использованы. . .
|
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога
SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
|