0 / 0 / 0
Регистрация: 07.11.2020
Сообщений: 3

Удалить текст с первого до второго вхождения

07.11.2020, 00:37. Показов 743. Ответов 6
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день! В программировании ни бум бум, нужно в текстовых документах почистить некоторые фрагменты, которые одинаково начинаются и заканчиваются, но в середине другой текст, например:
фрагмент 1 - играть в мяч - фрагмент 2
фрагмент 1 - играть в футбол - фрагмент 2
Нужно из файла полностью удалить текст посередине и входящие фрагменты тоже. Нашел решение для ворда через замену: (фрагмент1)*(фрагмент2) с галочкой на подстановочных знаках. Все бы ничего, но файлов слишком много и вордом долго. Может подскажите, есть какой-нибудь скрипт для этих целей или программа, которая автоматически на всех файлах сразу уберет этот текст?
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
07.11.2020, 00:37
Ответы с готовыми решениями:

Дано два списка, из второго удалить все вхождения головы первого.
Здравствуйте. Помогите пожалуйста, очень срочно надо решить задачку. Дано два списка, из второго удалить все вхождения головы первого.

Удалить из второго списка все вхождения головы первого списка
2. Даны 2 списка. Удалить из второго все вхождения головы первого списка.

Строка: Удалить все символы в строке, которые стоят после первого вхождения символа ‘*’, но ко второму его вхождения
удалить все символы в строке, которые стоят после первого вхождения символа ‘*’, но ко второму его вхождения (если он встречается только...

6
sleep
 Аватар для I can
4936 / 4618 / 841
Регистрация: 13.04.2015
Сообщений: 9,792
07.11.2020, 06:58
Цитата Сообщение от MEgmaa Посмотреть сообщение
в текстовых документах
Нужен файл.
0
 Аватар для Rh2Dark
32 / 32 / 0
Регистрация: 05.11.2020
Сообщений: 102
07.11.2020, 13:01
Цитата Сообщение от MEgmaa Посмотреть сообщение
Нужно из файла полностью удалить текст посередине и входящие фрагменты тоже
Если нужно удалить фрагменты и текст между ними, это означает - удалить текст полностью?
Вопрос сформулирован очень узко. Какого рода документы? Чистый текст или специализированные форматы?
Как-то давно сочинял прогу "Replacer", она заменяла искомые строки в куче файлов на заданные, работала только с чистым текстом. Это было моё развитие таких прог как M-replace и ST-Replacer. Последняя даже сохранилась у меня на компе. Вот её описание из приложенного файла:

Simple Text Replacer

Программа для замены фрагмента текста в группе файлов.
Очень удобно менять кодировку символах в сразу нескольких html-файлах после их скачивания на диск программой, типа Teleport Pro.
ver 1.2 - добавлена возможность многострочной замены в выбранном файле и группе файлов.
ver 1.1 - добавлена возможность замены в выбранном файле и группе файлов.
ver 1.0 - начальная версия.
Программа представляет собой "Файловый конвейер" - закончив операции над одним файлом, она автоматически принимается за другой.

--

Автор Гуляев Сергей Анатольевич
Город Пермь
Сайт www.SimpleSite.Narod.ru
E-mail SimpleSite@Narod.ru
0
0 / 0 / 0
Регистрация: 07.11.2020
Сообщений: 3
07.11.2020, 14:40  [ТС]
Большое спасибо, загрузил вашу программу) Но не знаю есть у нее такой функционал. Видимо я сумбурно объяснил, в общем у меня задание спарсить описания товаров с другого сайта и загрузить к нам, я загрузил HTML файлы, перевел их сразу в TXT. Мне нужно удалить код до описания товара и после. Он всегда обрамлен одинаковыми тегами. Мне нужно удалить текст от тега <HTML> до тега <Description> и после тега </description> до тега </html>. Грубо говоря начало и конец одинаковы у всех текстов в файлах, но середина отличается. Не обязательно, чтобы программа или скрипт удаляли эти 2 части сразу, можно и 2 раза прогнать. В ворде это делалось такой заменой: (HTML)*(Description) и ставил галочку подстановочные знаки, он все удалял от начала и до конца этих тегов, но значки тегов не мог удалить (<>), поэтому я их удалял Notepad. Мне бы тоже самое, но в многопотоке сделать, скобки тегов можно также в Notepad удалить(потому что в ворде с ними проблема какая-то). Может подскажите что-нибудь? Загрузить файлы пока не могу, не на рабочем месте.
0
92 / 58 / 21
Регистрация: 09.05.2019
Сообщений: 184
07.11.2020, 15:55
MEgmaa, Если вам нужно удалить теги, Поместите все теги в массив, и используйте функцию replace по замене.
Алгоритм программы
1) пользователь вбивает все теги которые необходимо удалить (они заносятся в массив и сохраняются в программе)
2) считываем файл TXT и удаляем все теги
3) перезаписываем файл

Чтобы удалялись знаки <> вы и пишите тег с этим знаком, <HTML> или </HTML> тогда и будет тег полностью удалятся.
0
0 / 0 / 0
Регистрация: 07.11.2020
Сообщений: 3
07.11.2020, 16:50  [ТС]
Все-таки почитал про Notepad++, нашел регулярное выражение .*., которое помогло. Всем неравнодушным, спасибо! Тему можно закрывать)
0
 Аватар для Rh2Dark
32 / 32 / 0
Регистрация: 05.11.2020
Сообщений: 102
07.11.2020, 22:13
Цитата Сообщение от MEgmaa Посмотреть сообщение
Большое спасибо, загрузил вашу программу)
Поправочка! - это не я писал эти проги, автор указан в описании. Я лишь пробовал в своем время ими пользоваться.

Цитата Сообщение от MEgmaa Посмотреть сообщение
Все-таки почитал про Notepad++, нашел регулярное выражение .*., которое помогло. Всем неравнодушным, спасибо! Тему можно закрывать)
А разве "Notepad++" может работать в пакетном режиме с файлами (обрабатывать пачкой, я имею в виду, не загружая в окно редактиования)?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
07.11.2020, 22:13
Помогаю со студенческими работами здесь

Для каждого числа из второго списка вывести индекс первого и последнего вхождения в первый список
Есть задача: Вам даны два списка целых чисел. Первый список отсортирован по возрастанию. Необходимо для каждого числа из второго...

Найти в первом файле строку из второго файла и скопировать всё с первого вхождения найденной строки и до пробела
Есть два файла со списками: В первом файле список, а во втором часть списка, просто строки из первого файла. Нужно найти в...

Функция поиска первого вхождения шаблона в текст
. В качестве первого параметра функция принимает текст (C-style строка), в которой нужно искать шаблон. В качестве второго параметра...

Требуется зашифровать текст из первого массива, заменяя буквы первого массива символами из второго
В виде массива символов дан текст (ввод с клавиатуры). Случайным образом заполните второй массив из 26 элементов символа-ми, отличными от...

Удалить все нули, до первого вхождения любой цифры
arr.erase(remove_if(arr.begin(), arr.end(), (int&amp; a) { return a == 0 ? true : false; }), arr.end());


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Опции темы

Новые блоги и статьи
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем. . . .
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru