|
|
||||||
Найти все слова в тексте содержащие одинаковую часть19.09.2019, 16:18. Показов 5102. Ответов 19
Метки нет (Все метки)
Есть текстовый файл, много много слов
Точно знаю, что в текстовом файле встречается упоминание одного файла - image.jpg - но есть маленькая деталь в файле нужно найти все упоминания. Например, в файле упоминание может встречаться _src="/upload/old/cn6.jpg"_ где "_" = пробел или _000/u77/6/0/roga-bez-pasporta-picture-normal.jpg\nsmall:_ где _ (доска) = пробел или _target="_blank">https://site.ru/upload/users/photos/medium/cn6.jpg</a>"_ из этого всего, в функции мне нужно возвращать путь - или upload/old/cn6.jpg или 000/u77/6/0/roga-bez-pasporta-picture-normal.jpg или upload/users/photos/medium/cn6.jpg чтобы потом копировать файл и сохранять по этому пути Ниже, простой функцией, я могу найти, есть файл в базе или нет
путь или несколько путей, если файл встречается несколько раз
0
|
||||||
| 19.09.2019, 16:18 | |
|
Ответы с готовыми решениями:
19
Найти в данном тексте все слова, содержащие от 2-х до 4-х гласных букв В данном тексте найти все слова, содержащие заданную подстроку s Найти все слова содержащие заданный символ и встречающиеся в тексте не менее 2 раз |
|
102 / 75 / 38
Регистрация: 08.11.2017
Сообщений: 272
|
|
| 19.09.2019, 16:49 | |
|
IRIP, и в чём вопрос?
0
|
|
|
5037 / 1064 / 149
Регистрация: 29.01.2013
Сообщений: 6,217
|
|
| 20.09.2019, 09:55 | |
|
IRIP, так мы же недавно помогали вам решить похожую задачу, или я что-то путаю?
0
|
|
| 20.09.2019, 10:00 | |
|
Не по теме: Alli_Lupin, не путаешь, причем понятнее его задания не становятся, наоборот...
0
|
|
|
|
||
| 20.09.2019, 10:30 [ТС] | ||
|
потом сравнить с имеющимися и ... а в этом задании - не нужно искать по расширениям. Это другой подход. здесь уже есть конкретная картинка с именем и расширением и нужно выдрать из базы все ее упоминания от пробела до пробела это совершенно другой подход
0
|
||
|
5037 / 1064 / 149
Регистрация: 29.01.2013
Сообщений: 6,217
|
|
| 20.09.2019, 10:31 | |
|
IRIP, вы не поверите. Пичаль в том, что поиск выполняется одинаково что там, что там.
0
|
|
|
5037 / 1064 / 149
Регистрация: 29.01.2013
Сообщений: 6,217
|
|
| 20.09.2019, 10:58 | |
|
IRIP, алгоритм примерно такой: ищите подстроку ".jpg" или с другим расширением, парсим эту строку, находим
" до и после расширения, копируем подстроку. По факту надо 2 цикла и 2 условия.
0
|
|
|
|
||
| 20.09.2019, 11:18 [ТС] | ||
|
Alli_Lupin,
Алгоритм примерно такой мне виделся: 1. Получили название файла 2. Ищем все строки содержащие это "слово" 3. Вырезаем слово содержащее искомое "слово" от пробела до пробела 4. Добавляем его в list 5. Возвращаем лист в ответе функции Добавлено через 10 минут но должны быть и другие решения?
0
|
||
|
5037 / 1064 / 149
Регистрация: 29.01.2013
Сообщений: 6,217
|
|
| 20.09.2019, 12:12 | |
|
IRIP, ну вот, вы всё знаете, так что вас останавливает?
0
|
|
|
955 / 341 / 114
Регистрация: 04.08.2018
Сообщений: 2,533
|
|
| 20.09.2019, 12:16 | |
|
IRIP, лямбда это инструкция.
Добавлено через 50 секунд IRIP, но по сути своей является анонимной функцией. Поэтому её можно считать за функцию
0
|
|
|
|
||||||||
| 20.09.2019, 15:18 [ТС] | ||||||||
|
Наглядно иллюстрирует объем выполняемой работы, вот этот код
а файлов больше 100 000 и на поиск каждого вхождения будет проведено 200000*100000=20.000.000.000 операций Добавлено через 1 минуту
0
|
||||||||
|
5037 / 1064 / 149
Регистрация: 29.01.2013
Сообщений: 6,217
|
|
| 20.09.2019, 15:34 | |
|
IRIP, подобные задачи надо распараллеливать. С параллельностью в пайтоне грустно.
0
|
|
|
|
|
| 20.09.2019, 15:52 [ТС] | |
|
Alli_Lupin, не обязательно распараллеливать наверно
должны быть решения. Я по другому пути изначально и пошел, потому что думал сначала получить список таких файлов а затем из него выбирать но это оказалось еще дольше, совершает больше операций, чем предложенный в этой теме вариант Возможно, нужно напрямую к базе данных обращаться... и там искать...
0
|
|
|
5037 / 1064 / 149
Регистрация: 29.01.2013
Сообщений: 6,217
|
|
| 21.09.2019, 16:03 | |
|
IRIP, нужно именно распараллеливать. Системы многоядерные, производительность повысится в разы.
0
|
|
|
|
||||||
| 24.09.2019, 18:02 [ТС] | ||||||
|
Вот решение написал
с ним потом можно делать все, что нужно функция работает очень шустро (на сколько я могу судить)
0
|
||||||
| 24.09.2019, 18:02 | |
|
Помогаю со студенческими работами здесь
20
Найти в данном тексте все слова, содержащие наибольшее количество гласных латинских букв (a, e, i, o, u) Найти в тексте слова, содержащие не менее трех букв из первого слова Если все слова в тексте имеют одинаковую длину, вывести слово "ДЛИНА" Найти в тексте слова, содержащие не менее трех букв из последнего слова текста Текстовые файлы: Найти в тексте слова, содержащие не менее трех букв из последнего слова текста Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
| Опции темы | |
|
|
Новые блоги и статьи
|
|||
|
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога
Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
|
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
|
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога
В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
|
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога
Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
|
|
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога
Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
|
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
|
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования.
Часть библиотеки BedvitCOM
Использованы. . .
|
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога
SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
|