|
|
||||||
Найти все слова в тексте содержащие одинаковую часть19.09.2019, 16:18. Показов 5083. Ответов 19
Метки нет (Все метки)
Есть текстовый файл, много много слов
Точно знаю, что в текстовом файле встречается упоминание одного файла - image.jpg - но есть маленькая деталь в файле нужно найти все упоминания. Например, в файле упоминание может встречаться _src="/upload/old/cn6.jpg"_ где "_" = пробел или _000/u77/6/0/roga-bez-pasporta-picture-normal.jpg\nsmall:_ где _ (доска) = пробел или _target="_blank">https://site.ru/upload/users/photos/medium/cn6.jpg</a>"_ из этого всего, в функции мне нужно возвращать путь - или upload/old/cn6.jpg или 000/u77/6/0/roga-bez-pasporta-picture-normal.jpg или upload/users/photos/medium/cn6.jpg чтобы потом копировать файл и сохранять по этому пути Ниже, простой функцией, я могу найти, есть файл в базе или нет
путь или несколько путей, если файл встречается несколько раз
0
|
||||||
| 19.09.2019, 16:18 | |
|
Ответы с готовыми решениями:
19
Найти в данном тексте все слова, содержащие от 2-х до 4-х гласных букв В данном тексте найти все слова, содержащие заданную подстроку s Найти все слова содержащие заданный символ и встречающиеся в тексте не менее 2 раз |
|
102 / 75 / 38
Регистрация: 08.11.2017
Сообщений: 272
|
|
| 19.09.2019, 16:49 | |
|
IRIP, и в чём вопрос?
0
|
|
|
5036 / 1063 / 149
Регистрация: 29.01.2013
Сообщений: 6,204
|
|
| 20.09.2019, 09:55 | |
|
IRIP, так мы же недавно помогали вам решить похожую задачу, или я что-то путаю?
0
|
|
| 20.09.2019, 10:00 | |
|
Не по теме: Alli_Lupin, не путаешь, причем понятнее его задания не становятся, наоборот...
0
|
|
|
|
||
| 20.09.2019, 10:30 [ТС] | ||
|
потом сравнить с имеющимися и ... а в этом задании - не нужно искать по расширениям. Это другой подход. здесь уже есть конкретная картинка с именем и расширением и нужно выдрать из базы все ее упоминания от пробела до пробела это совершенно другой подход
0
|
||
|
5036 / 1063 / 149
Регистрация: 29.01.2013
Сообщений: 6,204
|
|
| 20.09.2019, 10:31 | |
|
IRIP, вы не поверите. Пичаль в том, что поиск выполняется одинаково что там, что там.
0
|
|
|
5036 / 1063 / 149
Регистрация: 29.01.2013
Сообщений: 6,204
|
|
| 20.09.2019, 10:58 | |
|
IRIP, алгоритм примерно такой: ищите подстроку ".jpg" или с другим расширением, парсим эту строку, находим
" до и после расширения, копируем подстроку. По факту надо 2 цикла и 2 условия.
0
|
|
|
|
||
| 20.09.2019, 11:18 [ТС] | ||
|
Alli_Lupin,
Алгоритм примерно такой мне виделся: 1. Получили название файла 2. Ищем все строки содержащие это "слово" 3. Вырезаем слово содержащее искомое "слово" от пробела до пробела 4. Добавляем его в list 5. Возвращаем лист в ответе функции Добавлено через 10 минут но должны быть и другие решения?
0
|
||
|
5036 / 1063 / 149
Регистрация: 29.01.2013
Сообщений: 6,204
|
|
| 20.09.2019, 12:12 | |
|
IRIP, ну вот, вы всё знаете, так что вас останавливает?
0
|
|
|
955 / 341 / 114
Регистрация: 04.08.2018
Сообщений: 2,533
|
|
| 20.09.2019, 12:16 | |
|
IRIP, лямбда это инструкция.
Добавлено через 50 секунд IRIP, но по сути своей является анонимной функцией. Поэтому её можно считать за функцию
0
|
|
|
|
||||||||
| 20.09.2019, 15:18 [ТС] | ||||||||
|
Наглядно иллюстрирует объем выполняемой работы, вот этот код
а файлов больше 100 000 и на поиск каждого вхождения будет проведено 200000*100000=20.000.000.000 операций Добавлено через 1 минуту
0
|
||||||||
|
5036 / 1063 / 149
Регистрация: 29.01.2013
Сообщений: 6,204
|
|
| 20.09.2019, 15:34 | |
|
IRIP, подобные задачи надо распараллеливать. С параллельностью в пайтоне грустно.
0
|
|
|
|
|
| 20.09.2019, 15:52 [ТС] | |
|
Alli_Lupin, не обязательно распараллеливать наверно
должны быть решения. Я по другому пути изначально и пошел, потому что думал сначала получить список таких файлов а затем из него выбирать но это оказалось еще дольше, совершает больше операций, чем предложенный в этой теме вариант Возможно, нужно напрямую к базе данных обращаться... и там искать...
0
|
|
|
5036 / 1063 / 149
Регистрация: 29.01.2013
Сообщений: 6,204
|
|
| 21.09.2019, 16:03 | |
|
IRIP, нужно именно распараллеливать. Системы многоядерные, производительность повысится в разы.
0
|
|
|
|
||||||
| 24.09.2019, 18:02 [ТС] | ||||||
|
Вот решение написал
с ним потом можно делать все, что нужно функция работает очень шустро (на сколько я могу судить)
0
|
||||||
| 24.09.2019, 18:02 | |
|
Помогаю со студенческими работами здесь
20
Найти в данном тексте все слова, содержащие наибольшее количество гласных латинских букв (a, e, i, o, u) Найти в тексте слова, содержащие не менее трех букв из первого слова Если все слова в тексте имеют одинаковую длину, вывести слово "ДЛИНА" Найти в тексте слова, содержащие не менее трех букв из последнего слова текста Текстовые файлы: Найти в тексте слова, содержащие не менее трех букв из последнего слова текста Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма).
На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
|
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ *
Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам
Кирхгофа, решает её и находит:
токи, напряжения и их 1 и 2 производные при t = 0;. . .
|
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым.
Но восстановить их можно так.
Для этого понадобится консольная утилита. . .
|
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
|
|
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11
— это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
|
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11
Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
|
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
|
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/
O1rJuneU_ls
https:/ / vkvideo. ru/ video-115721503_456239114
|