6 / 6 / 9
Регистрация: 16.04.2015
Сообщений: 121
1

Реализовать поиск слов по маске

12.05.2016, 18:31. Показов 2494. Ответов 9
Метки нет (Все метки)

Решил запилить поиск слов по маске: буквы и символы (* и ?) из текстового файла, но никак не могу придумать, как можно парсить так слова. Кому не трудно, поясните, пожалуйста, каким алгоритмом можно это организовать.
__________________
Помощь в написании контрольных, курсовых и дипломных работ здесь
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
12.05.2016, 18:31
Ответы с готовыми решениями:

Поиск слов по маске в строке, их удаление, сортировка оставшихся слов
Доброго времени суток. Помогите, пожалуйста, реализовать задачу. нужно из текстового файла считать...

Реализовать поиск в БД по маске
SELECT * FROM table WHERE punkt='$punkt' выводит только точное совпадение, мне нужны другие...

Поиск слов по маске в текстовом редакторе
Здравствуйте, возникла проблема, нужно реализовать текстовый редактор с подсчетом...

delphi и word. Поиск слов по маске и между строк.
Добрый день. Не судите строго. Принялся за изучение delphi. у меня такая задача. Программка...

9
Супер-модератор
Эксперт Pascal/DelphiАвтор FAQ
31246 / 20425 / 7961
Регистрация: 22.10.2011
Сообщений: 35,465
Записей в блоге: 6
13.05.2016, 18:53 2
Лучше запили поиск по регулярному выражению. Ну, или простенькую функцию, которая в маске заменяет символы ? и *, и использует опять же регулярки для сопоставления с образцом:
Pascal
1
2
3
4
5
6
7
8
9
10
function MatchesMask(sText : string; sMask : string) : boolean;
begin
  var m := new Regex(sMask.Replace('.', '[.]').Replace('*', '.*').Replace('?', '.'));
  result := m.IsMatch(sText);
end;
 
begin
  writeln(MatchesMask('привет', 'пр?в*')); // true
  writeln(MatchesMask('привет', 'пр?вт*')); // false
end.
0
6 / 6 / 9
Регистрация: 16.04.2015
Сообщений: 121
13.05.2016, 19:34  [ТС] 3
volvo, спасибо, волво, здесь просто очень мало людей юзают .Net, как раз с помощью него это можно просто запилить.
А потом все слова прогонять и проверять?
0
6 / 6 / 9
Регистрация: 16.04.2015
Сообщений: 121
17.05.2016, 00:59  [ТС] 4
volvo, что-то неладное приключилось, когда я почти дописал программульку-парсер:
Pascal
1
writeln(MatchesMask('беспроводной', 'пров*')); // true
0
Супер-модератор
Эксперт Pascal/DelphiАвтор FAQ
31246 / 20425 / 7961
Регистрация: 22.10.2011
Сообщений: 35,465
Записей в блоге: 6
17.05.2016, 10:10 5
Имеется в виду, что должны искаться совпадения с начала строки? Так добавь символ "^" в начало регулярки:
Pascal
1
2
3
4
5
function MatchesMask(sText : string; sMask : string) : boolean;
begin
  var m := new Regex(('^' + sMask).Replace('.', '[.]').Replace('*', '.*').Replace('?', '.'));
  result := m.IsMatch(sText);
end;
Теперь
Pascal
1
2
3
4
5
  writeln(MatchesMask('привет', 'пр?в*')); // true
  writeln(MatchesMask('привет', 'пр?вт*')); // false
  writeln(MatchesMask('беспроводной', 'пров*')); // false
  writeln(MatchesMask('беспроводной', '*пров*')); // true
  writeln(MatchesMask('беспроводной', '??спров*')); // true
Это нужно было?
0
6 / 6 / 9
Регистрация: 16.04.2015
Сообщений: 121
20.05.2016, 15:11  [ТС] 6
volvo, да, именно это, огромное спасибо. Уже сделал одну программу: парсер текста. Если буду ее опубликовывать, обязательно тебя добавлю как помощника)
Кое-что еще, ты не знаешь, как выбрать тупо слова из текста (произведения), чисто слова, вообще без delim-ов и рассортировать их по частоте встречи?
Я пробовал, у меня выходило после слова, то запятая лишняя, то скобочка.

Добавлено через 21 час 38 минут
volvo, а что в конце поставить строки, чтобы результат был такой же, а то я ставлю 'го?', а он мне все слова которые начинаются на "го" выписывает.
0
Супер-модератор
Эксперт Pascal/DelphiАвтор FAQ
31246 / 20425 / 7961
Регистрация: 22.10.2011
Сообщений: 35,465
Записей в блоге: 6
20.05.2016, 16:27 7
Цитата Сообщение от Radmir2015 Посмотреть сообщение
как выбрать тупо слова из текста (произведения), чисто слова, вообще без delim-ов и рассортировать их по частоте встречи?
Разбить текст на слова, предварительно убрав из него все символы, не принадлежащие к алфавиту, и рассортировать по частоте:
Pascal
1
2
3
4
  var s := 'one two, two, three.... four, one, TWo';
  var re := new System.Text.RegularExpressions.Regex('[^a-zA-Zа-яА-Я0-9]');
  var v := re.Replace(s, ' ').ToWords().GroupBy(s -> s.ToLower()).OrderByDescending(gr -> gr.Count);
  foreach var x in v do writeln(x.Key.ToLower(), ' -> ', x.Count());
выведет:
two -> 3
one -> 2
three -> 1
four -> 1
Цитата Сообщение от Radmir2015 Посмотреть сообщение
а что в конце поставить строки, чтобы результат был такой же, а то я ставлю 'го?', а он мне все слова которые начинаются на "го" выписывает
А что тебе нужно, чтобы выводилось? Только слова, которые начинаются на "го" и состоящие из трех символов? Тогда добавь '$' как символ конца строки:
Pascal
1
var m := new Regex(('^' + sMask + '$').Replace('.', '[.]').Replace('*', '.*').Replace('?', '.'));
0
6 / 6 / 9
Регистрация: 16.04.2015
Сообщений: 121
21.05.2016, 16:16  [ТС] 8
volvo,
Цитата Сообщение от volvo Посмотреть сообщение
var m := new Regex(('^' + sMask + '$').Replace('.', '[.]').Replace('*', '.*').Replace('?', '.'));
да, есс, ура, наконец-то, работает, как часы, огромное спасибо, именно это и нужно. Ведь "?" - это ОДИН любой символ, то есть не может быть у "го?" длина больше 3. А вот если "*го?", тогда может быть любой, если бы без регулярки, то было бы очень тяжело сделать.

Слева словарь с кучей слов, в середине программа парсер (еще недоделанная), справа результат.

И да, генерировать ровно по определенной общей длине очень сложно, поэтому сделал примерно. Например, у меня стоит 50 - общая длина, он может сгенерировать, и 48, и 54, но это все делается расчетами, так сказать: брать ли последнее слово или нет.
Миниатюры
Реализовать поиск слов по маске  
0
6 / 6 / 9
Регистрация: 16.04.2015
Сообщений: 121
24.05.2016, 20:18  [ТС] 9
volvo, если знаешь, подскажи, как сделать ровно строки по определенной длине?
0
6 / 6 / 9
Регистрация: 16.04.2015
Сообщений: 121
02.06.2016, 16:01  [ТС] 10
Цитата Сообщение от volvo Посмотреть сообщение
Разбить текст на слова, предварительно убрав из него все символы, не принадлежащие к алфавиту, и рассортировать по частоте:
Замечательно, работает. А как сложить две последовательности типа v, просто я хочу провернуть это с большим файлом, со 100 строками быстро обрабатывает, а с 15 тыс, зависает и не развисает, ждал минут 10-15.

Может так: (если s := ReadLines(...))
Pascal
1
2
3
if s.Count > 100 then
  for var i := 0 to s.Batch(100).Count - 1 do
  v.Concat(re.Replace(s.Batch(100).ElementAt(i).JoinIntoString(' '), ' ').ToWords().GroupBy(s -> ignoreCase ? s.ToLower() : s));
Но в конце нужно присваивать v := v.Concat... компилятор ругается на несоответствие типов. Тогда как можно реализовать?
Как объявить переменную v заранее, без присвоения, просто нужно было использовать if, мне пришлось делать две практически одинаковых ветки, а то компилятор бы ругался на внутриблочные переменные.
0
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
02.06.2016, 16:01

Сделать поиск слов в заданной пользователем строкой по Маске
Сделать поиск слов в заданной пользователем строкой по Маске. Маска делается строкой, которая...

Генератор слов по маске
Доброго времени суток, Уважаемые программисты! Есть ряд слов и цифр, допустим: Как...

Алгоритм поиска слов по маске
Здравствуйте. Передо мной стоит задача - написать функцию, которая по заданной маске и слову...

Как в DataGridView реализовать ввод по маске?
как в грид поместить поле MaskedTextBox, или установить маску, например координаты (00\'00\'00,000)"

Поиск по маске
/^ Украина/ i. test( country) возвращает true когда я ввел полностью" Украина", мне нужно когда...

Поиск по маске
Требуется разработать скрипт для поиска и удаления на заданном диске или в заданной папке всех...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
10
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2021, vBulletin Solutions, Inc.