|
Oleg
|
|
Как очистить HTML от мусора?19.06.2008, 10:21. Показов 2016. Ответов 4
Метки нет (Все метки)
Помогите!!! Есть HTML-файл. Надо преобразовать его в текстовый.
Это можно сделать, если открыть IE и сказать сохранить как текст. А как сделать эту работу автоматически? Т.е. на входе несколько (много) файлов и надо все их переделать в текстовые. Есть компонент HTMLView, но как с ним работать я не знаю. И вообще можно ли с его помощью что либо сделать? Заранее благодарен. |
|
| 19.06.2008, 10:21 | |
|
Ответы с готовыми решениями:
4
Очистить от html мусора
Нужно очистить ПК от мусора |
|
0 / 0 / 0
Регистрация: 18.06.2008
Сообщений: 4
|
|
| 19.06.2008, 11:20 | |
|
Можно поробовать regular expressions. К примеру, тэги table и br заменять на перевод строки, остальные же просто выкидывать, оставляя текст...
0
|
|
|
2 / 2 / 1
Регистрация: 30.07.2007
Сообщений: 206
|
|
| 23.06.2008, 01:06 | |
|
Я делаю так. Есть исходный htm-текст со всеми тегами. Ты последовательно находишь через InStr знак меньше (<), затем знак больше (>) и удаляешь всю информацию, заключенную между этими тегами. Затем ты замечаешь, что остается 'пустая' информация, заключенная в теги скриптов или счетчиков. Вот сначала и надо удалять такую информацию, а потом вылавливать основной текст.
Я пользовался таким алгоритмом долгое время, но потом понял, что лучше всего сшить все файлы для обработки в один файл (через программу FAR), а затем действительно ВЫДЕЛИТЬ весь текст, СКОПИРОВАТЬ и вставить для дальнейшей обработки в любой текстовой редактор. Если нужен совет, пиши на bigsharig@mtu-net.ru
0
|
|
|
51 / 17 / 6
Регистрация: 18.05.2007
Сообщений: 1,322
|
||||||
| 23.06.2008, 09:32 | ||||||
|
Пора заносить в FAQ
![]()
0
|
||||||
|
Oleg
|
|
| 23.06.2008, 09:53 | |
|
А кто-нибудь пробовал это сделать через IE, но только автоматически.
Скажем в васике вызвать объект IE и с ним поработать: открыть файл и сохранить как... |
|
| 23.06.2008, 09:53 | |
|
Помогаю со студенческими работами здесь
5
Как очистить урл после .html Я сохраняю html как текст, а как txt очистить от тегов? Регулярным выражением очистить ширину и высоту ячейки таблицы HTML Как избавиться от мусора в массиве? Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Настройки VS Code
Loafer 13.04.2026
{
"cmake. configureOnOpen": false,
"diffEditor. ignoreTrimWhitespace": true,
"editor. guides. bracketPairs": "active",
"extensions. ignoreRecommendations": true,
. . .
|
Оптимизация кода на разграничение прав доступа к элементам формы
Maks 13.04.2026
Алгоритм из решения ниже реализован на нетиповом документе, разработанного в конфигурации КА2.
Задачи, как таковой, поставлено не было, проделанное ниже исключительно моя инициатива.
Было так:. . .
|
Контроль заполнения и очистка дат в зависимости от значения перечислений
Maks 12.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2.
Задача: реализовать контроль корректности заполнения дат назначения. . .
|
Архитектура слоя интернета для сервера-слоя.
Hrethgir 11.04.2026
В продолжение https:/ / www. cyberforum. ru/ blogs/ 223907/ 10860. html
Знаешь что я подумал? Раз мы все источники пишем в голове ветки, то ничего не мешает добавить в голову такой источник, который сам. . .
|
|
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2.
Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
|
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях.
Задача: при копировании документа очищать определенные реквизиты и табличную. . .
|
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git
main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели
8ATzM_2aurI
|
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2.
Задача: запретить редактирование документа, если он открыт у другого пользователя.
/ / . . .
|