Форум программистов, компьютерный форум CyberForum.ru

В текстовом файле найти все устойчивые словосочетания - C++

Восстановить пароль Регистрация
 
AlinaKk
1 / 1 / 0
Регистрация: 11.11.2013
Сообщений: 27
06.01.2014, 16:52     В текстовом файле найти все устойчивые словосочетания #1
Всем доброго времени суток. Нужно сегодня сдать задачу до конца суток, я 2 дня ломаю голову над ней, ничего не выходит. Помогите кто может, пожалуйста.

В текстовом файле найти все устойчивые словосочетания: 2 или более под-
ряд идущих слов, повторяющихся в тексте 3 или более раз. Все словосочетания
вывести на экран.

Заранее спасибо
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
06.01.2014, 16:52     В текстовом файле найти все устойчивые словосочетания
Посмотрите здесь:

C++ Найти количество строк в текстовом файле
Как найти в текстовом файле нужный параметр C++
Работа с файлами: как найти слово в отдельном текстовом файле? C++
C++ Поиск в текстовом файле всех слов, заданных в другом текстом файле
Написать функцию, заменяющую в текстовом файле все цифры и знаки “+” и “ - ” на пробелы C++
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
Croessmah
Модератор
Эксперт С++
 Аватар для Croessmah
11811 / 6790 / 767
Регистрация: 27.09.2012
Сообщений: 16,841
Записей в блоге: 2
Завершенные тесты: 1
06.01.2014, 16:53     В текстовом файле найти все устойчивые словосочетания #2
Цитата Сообщение от AlinaKk Посмотреть сообщение
нужна
а нам что делать?
ninja2
 Аватар для ninja2
230 / 186 / 7
Регистрация: 26.09.2012
Сообщений: 2,018
Завершенные тесты: 1
06.01.2014, 18:49     В текстовом файле найти все устойчивые словосочетания #3
Цитата Сообщение от AlinaKk Посмотреть сообщение
В текстовом файле найти все устойчивые словосочетания: 2 или более под-
ряд идущих слов, повторяющихся в тексте 3 или более раз. Все словосочетания
вывести на экран.
У меня повторяются 2 или более раз, там можешь изменить, специально для тебя выделил настройки проги. работает в visual studio 2010, сильно не тестил там могуб быть наверно и ошибки, если будут сам поисправляешь, но для того текста что у меня вроде норм ищет.
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
#include <iostream>
#include <string>
#include <regex>
using namespace::std;
 
 
int main()
{
    setlocale(LC_ALL, "Russian");
    wstring s=L"hellow world да  мазафака да     да гаспада мазафака да да da da мазафака да да hellow world да";
    //////////////////////////////////////////////////////////////////////////////////
    // настройки//////
    //количество слов
    wstring count_w=L"1"; // 1 - два слова, если 2 - то будет 2 слова
    //количество совпадений
    int count_sofpadenii(1); // 1 - два совпадения, если 3 - то будет 3 совпадения
    //////////////////////////////////////////////////////////////////////////////////
    wcout <<"s= "<<s<<endl;
    wsmatch sm;
    while(regex_search(s,sm,wregex(wstring(L"\\s*(\\w+)\\s+?(\\w+\\s*){"+count_w+L"}"))))
    {   
        wstring temp=sm[0].str();
        wstring temp1=sm.suffix().str();
        wsmatch sm1;
        int count(count_sofpadenii);
        while(regex_search(temp1,sm1,wregex(regex_replace(temp,wregex(L"\\s+$"),wstring(L"")))))
        {
            count++;
            temp1=sm1.suffix().str();
        }
        if(count!=count_sofpadenii)
            wcout <<endl<<"#lekcema# = "<<temp<<" #count# = "<<count<<endl<<endl;
        temp=regex_replace(temp,wregex(L"^\\w+\\s+"),wstring(L""));
        s=temp+sm.suffix().str();
    }
    wcout <<"s= "<<s<<endl;
 
    return 0;
}
AlinaKk
1 / 1 / 0
Регистрация: 11.11.2013
Сообщений: 27
06.01.2014, 19:19  [ТС]     В текстовом файле найти все устойчивые словосочетания #4
Цитата Сообщение от ninja2 Посмотреть сообщение
У меня повторяются 2 или более раз, там можешь изменить, специально для тебя выделил настройки проги. работает в visual studio 2010, сильно не тестил там могуб быть наверно и ошибки, если будут сам поисправляешь, но для того текста что у меня вроде норм ищет.
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
#include <iostream>
#include <string>
#include <regex>
using namespace::std;
 
 
int main()
{
    setlocale(LC_ALL, "Russian");
    wstring s=L"hellow world да  мазафака да     да гаспада мазафака да да da da мазафака да да hellow world да";
    //////////////////////////////////////////////////////////////////////////////////
    // настройки//////
    //количество слов
    wstring count_w=L"1"; // 1 - два слова, если 2 - то будет 2 слова
    //количество совпадений
    int count_sofpadenii(1); // 1 - два совпадения, если 3 - то будет 3 совпадения
    //////////////////////////////////////////////////////////////////////////////////
    wcout <<"s= "<<s<<endl;
    wsmatch sm;
    while(regex_search(s,sm,wregex(wstring(L"\\s*(\\w+)\\s+?(\\w+\\s*){"+count_w+L"}"))))
    {   
        wstring temp=sm[0].str();
        wstring temp1=sm.suffix().str();
        wsmatch sm1;
        int count(count_sofpadenii);
        while(regex_search(temp1,sm1,wregex(regex_replace(temp,wregex(L"\\s+$"),wstring(L"")))))
        {
            count++;
            temp1=sm1.suffix().str();
        }
        if(count!=count_sofpadenii)
            wcout <<endl<<"#lekcema# = "<<temp<<" #count# = "<<count<<endl<<endl;
        temp=regex_replace(temp,wregex(L"^\\w+\\s+"),wstring(L""));
        s=temp+sm.suffix().str();
    }
    wcout <<"s= "<<s<<endl;
 
    return 0;
}
Спасибо огромное! а вас не затруднит описать именно алгоритм программы?
ninja2
 Аватар для ninja2
230 / 186 / 7
Регистрация: 26.09.2012
Сообщений: 2,018
Завершенные тесты: 1
06.01.2014, 19:28     В текстовом файле найти все устойчивые словосочетания #5
Простой алгоритм:
Берем 2 или 3( смотря сколько выствим) слова с начала исходной строки и сравниваем с оставшейся частью строки, если находим увеличиваем счетчик на 1, дальше проверяем счетчик если он больше нужного нам количества совпадений то мы выводим на экран строку и количество совпадений.
Затем обрезаем исходную строку - мы просто удаляем первое слово из нее, hellow wordl gacpada, то должно стать на слово меньше wordl gacpada и так снова повторяем пока всю строку не обойдем.
Такой алгоритм простой.

Я его так быстро набрал сильно не тестил могут быть ошибки и для коких то текстов будет неправильно работать. Ну я ее дорабатывать нихо, ее было и эту морочно набрать, это так как пример, дальше сам протестиш и доработаешь!
senich
61 / 61 / 23
Регистрация: 22.11.2012
Сообщений: 236
Записей в блоге: 1
06.01.2014, 21:00     В текстовом файле найти все устойчивые словосочетания #6
Ваш алгоритм находит словосочетания только определённой длины. Лучше, если мы будем брать сначала 1 первое слово, потом 1 и 2, до тех пор, пока кол-во вхождений этих слов больше 2. Если кол-во вхождений больше 2 и кол-во слов больше 1, то заносим их в массив словосочетаний. Рассмотренные слова удаляем.
Деление текста на слова:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
vector<string> words;
  string buf="", separators=" .?!-;,:", text;
  cout<<"Enter text:"<<endl<<"->";
  getline(cin, text);
  text+=" ";
  for(int i=0; i<text.length(); i++){
    if(separators.find(text[i])==-1)
      buf+=text[i];
    else if(buf.empty()!=1){
      words.push_back(buf);
      buf.clear();
    }
  }
Добавлено через 6 минут
Добавил комментарии.
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
vector<string> words;//массив слов
  string buf="", separators=" .?!-;,:", text;
  cout<<"Enter text:"<<endl<<"->";
  getline(cin, text);
  text+=" ";
  for(int i=0; i<text.length(); i++){
    if(separators.find(text[i])==-1)//Если символ- не разделитель
      buf+=text[i];//то увеличиваем буфер
    else if(buf.empty()!=1){//если символ-разделитель, и буфер не пуст, тогда
      words.push_back(buf);//добавляем слово в массив слов
      buf.clear();//очищаем буфер
    }
  }
AlinaKk
1 / 1 / 0
Регистрация: 11.11.2013
Сообщений: 27
06.01.2014, 21:15  [ТС]     В текстовом файле найти все устойчивые словосочетания #7
Большое спасибо!! а вы случайно не знаете, как сделать это с помощью регулярных выражений?
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
06.01.2014, 22:44     В текстовом файле найти все устойчивые словосочетания
Еще ссылки по теме:

Найти в текстовом файле все отрицательные числа и записать их в другой файл C++
C++ В текстовом файле содержится некоторый текст. Выделить все числа, которые содержатся в данном тексте
C++ Найти частоту появления символов в исходном текстовом файле

Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
ninja2
 Аватар для ninja2
230 / 186 / 7
Регистрация: 26.09.2012
Сообщений: 2,018
Завершенные тесты: 1
06.01.2014, 22:44     В текстовом файле найти все устойчивые словосочетания #8
Цитата Сообщение от AlinaKk Посмотреть сообщение
Большое спасибо!! а вы случайно не знаете, как сделать это с помощью регулярных выражений?
Это и есть с помощью регулярных выражений, я думаю легче преподу заплатить за зачет и не мучится .

Добавлено через 5 минут
Цитата Сообщение от senich Посмотреть сообщение
Ваш алгоритм находит словосочетания только определённой длины. Лучше, если мы будем брать сначала 1 первое слово, потом 1 и 2, до тех пор, пока кол-во вхождений этих слов больше 2.
Ну так понятно что определенное количество находит, я ж специально выделил какие переменные нужно менять. Пусть сам уже в виде функции оформляет и в цикле ее вызывает с нужными параметрами для количества слов в словосочетании. Если делать что б можно было задать границы для количества слов от 2 и до 5 например, то это писать столько примерно кода пришлось бы.

Добавлено через 2 минуты
senich, Ну да можно и на слова делить тоже как вариант.
Yandex
Объявления
06.01.2014, 22:44     В текстовом файле найти все устойчивые словосочетания
Ответ Создать тему
Опции темы

Текущее время: 08:11. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2016, vBulletin Solutions, Inc.
Рейтинг@Mail.ru