Форум программистов, компьютерный форум CyberForum.ru
Наши страницы

С++ для начинающих

Войти
Регистрация
Восстановить пароль
 
Dillingers
Сообщений: n/a
#1

Удаление выбранных тегов (html-страница) - C++

16.06.2013, 19:02. Просмотров 473. Ответов 1
Метки нет (Все метки)

В текстовом файле хранится сохраненная html страница. нужно проверить её и удалить теги, выбранные пользователем
имеется код программы ,который просто переводит ее в обычный текстовый вид, удаляя все теги
что нужно дописать для удаления только выбранных?
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
#include <iostream>
#include <fstream>
 
#include <string>
 
using namespace std;
 
int main()
{
    const char* filename = "index.html";
    ifstream ifs(filename, ifstream::in);
 
    string text = "";
    char ch = '\0'; bool b = false;
    while (ifs.peek() >= 0 && (ch = ifs.get()))
    {
        if (ch == '>') b = true;
        if (b != false)
        {
            if (ch != '<' && ch != '>')
                text+=ch;
        }
        if (ch == '<') b = false;
    }
 
    cout << text << endl;
 
    return 0;
}
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
16.06.2013, 19:02
Здравствуйте! Я подобрал для вас темы с ответами на вопрос Удаление выбранных тегов (html-страница) (C++):

Правила вложенности тегов html (html разметка на С++) - C++
Смысл программы: создание html разметки (добавление, удаление тегов) Подскажите, как и где реализовать правила вложенности тегов?...

Расстановка html тегов в тексте - C++
Хочу спросить, реально ли сделать автоматический перевод и правильную расстановку html тегов в русском тексте. Я мучился мучился, но так и...

Вытащить текст между тегов html - C++
Здравствуйте, форумчане! Нужно вытащить текст между тегами. Из этого: &lt;html&gt; &lt;tag1&gt;Текст 1&lt;/tag1&gt; &lt;html&gt; Должно получиться:...

Сохранить в файл содержимое тегов <a> данного html файла - C++
Дан текст HTML-страницы. Необходимо выделить текст внутри всех тегов a: (т.е. текст заключенный между &lt;a...&gt; и &lt;/a&gt;), вывести его на экран...

html-страница с картинками в качестве ресурса приложения. - C++
Доброй ночи всем! Делаю прогу на VC++ (среда VS.NET 2003). Основа-диалоговое окно на классе CHtmlDialog.Хотела отображать в нем...

Массив(Замена выбранных элементов). Область памяти(замена выбранных элементов) - C++
Собственно 3 задачи в которых нужна помощь...Может кто нить встречался с таким родом задач? 1.Создать массив из 20 элементов,...

1
AntonChik
1084 / 582 / 21
Регистрация: 11.11.2008
Сообщений: 1,544
17.06.2013, 09:03 #2
суть такая:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
int main()
{
    const char* filename = "index.htm";
    ifstream ifs(filename, ifstream::in);
 
    string text = "", tag;
    const char *tags = "<CPP></CPP><QUOTE></QUOTE> ";
    char ch = '\0'; bool b = false;
    while (ifs.peek() >= 0 && (ch = ifs.get()))
    {
        if (b && ch != '<' && ch != '>')text+=ch;
 
        if (ch == '<') {b = false; tag="";}
        if(!b)tag+=ch;
        if (ch == '>')
            {
            b = true;
            if (strstr(tags, tag.c_str()) == NULL) text=text+tag;
            }
    }
    cout << text << endl;
 
    return 0;
}
главное что tag выделен.
но конечно надо еще доработать, чтоб не отличать закрывающийся тег и чтоб аттрибуты могли присутствовать. удачи.
1
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
17.06.2013, 09:03
Привет! Вот еще темы с ответами:

.NET 4.x Удаление HTML-тегов из текста - C#
Здравствуйте помогите сделать пожалуйста программу с помощью WindowsForm. Очистка текста от html-тегов. Разработанная система должна...

Автоматическое удаление лишний символов, тегов в HTML - Софт
Здравствуйте! У меня есть мой старый сайт, написанный очень давно, и там плохая рахметка текста, очень много лишний тегов. Есть ли такая...

Удаление из HTML страницы ненужных тегов вместе с содержимым - PHP
Доброго времени суток. Нужна функция или регулярное выражение, которое из HTML страницы удалит ненужные теги вместе с содержимым. К...

Загрузка html в мемо и удаление тегов (+скрин), как удалить лишние символы??? - Delphi
Что нужно подкорректировать в моей программе чтоб удалилось лишнее, остались только русские символы и числа, вообщем очистить по &quot;полной...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru