Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/8: Рейтинг темы: голосов - 8, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 02.06.2017
Сообщений: 1
1

Сохранить в файл содержимое тегов <a> данного html файла

23.06.2017, 00:14. Показов 1670. Ответов 7
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Дан текст HTML-страницы. Необходимо выделить текст внутри всех тегов a: (т.е. текст заключенный между <a...> и </a>), вывести его на экран и сохранить в файл. Я пробовал писать, но не очень правильно получилось.
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
#define _CRT_SECURE_NO_WARNINGS 
#include "stdafx.h" 
#include <stdlib.h> 
#include <stdio.h> 
#include <time.h> 
#include <string.h> 
 
char text[20000]; 
static char start[] = "<a>"; 
static char end[] = "</a>"; 
 
int findTag(char* tag, char* text, int off) { 
for (int i = off; text[i] != '\0'; ++i) { 
if (text[i] == tag[0]) { 
bool flFind = true; 
for (int j = 0; tag[j] != '\0'; j++) 
if (text[i + j] != tag[j]) { 
flFind = false; 
break; 
} 
if (flFind) return i; 
} 
} 
return -1; 
} 
 
int _tmain(int argc, _TCHAR* argv[]) 
{ 
FILE* fp = fopen("kurs.txt", "rb"); 
if (fp == NULL) { 
printf("File not found"); 
return 0; 
} 
 
fseek(fp, 0, SEEK_END); 
int length = ftell(fp); 
fseek(fp, 0, SEEK_SET); 
 
fread((char *)text, length, 1, fp); 
text[length] = '\0'; 
fclose(fp); 
int a = 0, b = 0; 
int Nend = strlen(end); 
do { 
int a = findTag(start, text, 0); 
if (a != -1) { 
b = findTag(end, text, a); 
break; 
} 
if (b == -1) b = length; 
 
b += Nend; 
 
for (int i = a; i < length; ++i) 
text[i] = text[b + (i - a) + 1]; 
 
length -= (b - a); 
 
} while (a != -1); 
for (int i = 0; text[i] != '\0'; ++i) { 
printf("&c", text[i]); 
} 
fp = fopen("ABC", "wb"); 
if (fp == NULL) { 
printf("File not open for save"); 
return 0; 
} 
 
fwrite(text, length, 1, fp); 
fclose(fp); 
return 0; 
}
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
23.06.2017, 00:14
Ответы с готовыми решениями:

Сохранить содержимое диска в (HTML-)файл в иерархическом виде (TreeView)
Программа должна просканировать диск и вывести содержимое указанного каталога в HTML-файл в...

Копировать файл и сохранить содержимое файла в .txt
Добрый день форумчане. у меня возникла проблема. Мне надо написать программу которая: 1. копирует...

Как вставить в текущую html-страницу содержимое другого html-файла?
Как вставить в текущую html-страницу содержимое другого html-файла? Допустим есть файл...

Записать в текстовый файл содержимое Edit, и прочитать содержимое файла в Memo
Создать приложение которое создает текстовый файл текстовый файл text.txt записывает в него текст...

7
7792 / 6559 / 2984
Регистрация: 14.04.2014
Сообщений: 28,668
23.06.2017, 14:54 2
regex используй.
0
Эксперт С++
1624 / 954 / 782
Регистрация: 06.02.2016
Сообщений: 2,452
Записей в блоге: 31
23.06.2017, 15:03 3
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
#include <iostream>
#include <fstream>
#include <string>
#include <regex>
using namespace std;
int main() {
    ifstream ff("tr.txt");
    ofstream fd("out.txt");
    string s {},txt {};
    while(getline(ff,s)) txt+=s+" ";
    regex e("<a(.*?)>(.*?)</a>");
    for(auto it=sregex_iterator(txt.begin(),txt.end(),e); it!=sregex_iterator(); ++it) {
        cout<<it->str()<<endl;
        fd<<it->str()<<endl;
    }
    return 0;
}
0
279 / 39 / 13
Регистрация: 11.10.2015
Сообщений: 405
24.06.2017, 22:24 4
Peoples, можно find_all_regex из буста взять, он тут к месту будет

Добавлено через 43 секунды
вообще странно делать подобные вещи с HTML-кой на плюсах
0
7792 / 6559 / 2984
Регистрация: 14.04.2014
Сообщений: 28,668
24.06.2017, 23:27 5
zarko97, а как надо?
0
279 / 39 / 13
Регистрация: 11.10.2015
Сообщений: 405
24.06.2017, 23:32 6
nmcf, тут дело не в том как надо, а как удобнее. В данном случае и плюсы отлично подойдут, но парсинг штэмелек это тема пайтона как по мне.
0
nmcf
24.06.2017, 23:43
  #7

Не по теме:

Цитата Сообщение от zarko97 Посмотреть сообщение
но парсинг штэмелек это тема пайтона как по мне
Это же Бейсик такой. Шаг назад. :)

0
2782 / 1935 / 570
Регистрация: 05.06.2014
Сообщений: 5,600
25.06.2017, 00:14 8
Цитата Сообщение от nmcf Посмотреть сообщение
zarko97, а как надо?
Перлом.
Perl
1
2
3
4
5
6
7
use LWP::Simple;
$text=get("http://tk.ulstu.ru/lib/info/kurs_11.txt");
open(my $out,'>',"out.txt");
while($text=~/<a.*?>(.*?)<\/a>/g)
{
    print $out $1;
}
1
25.06.2017, 00:14
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
25.06.2017, 00:14
Помогаю со студенческими работами здесь

Сохранить содержимое EditorGadget в файл
Здравствуйте! Извините если в поиске не нашел, но у меня вопрос. Как содержимое EditorGadget...

Сохранить содержимое формы в файл
привет всем. как сохранить содержимое некоторой формы в текстовый файл на сервере? пример: есть...

Копировать содержимое одного указанного файла в другой указанный файл, дописывая, а не стирая его содержимое
Dragokas, Помогите пожалуйста с заданием! Задание 3. Написать командный файл, копирующий...

Сохранить содержимое консоли в текстовый файл
Здравствуйте! столкнулся с такой проблемой. Не могу сохранить содержимое консоли в текстовый файл....


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru