Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
 
Рейтинг 4.83/18: Рейтинг темы: голосов - 18, средняя оценка - 4.83
242 / 208 / 36
Регистрация: 19.02.2021
Сообщений: 1,431

Парсинг текста

28.06.2021, 13:31. Показов 3834. Ответов 22
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
По служебной необходимости столкнулся с ситуацией парсинга текста. С Python я знаком шапочно, к сожалению, поэтому прошу помощи.
Задача такая: на вход подается строка, где могут присутствовать (а могут и нет) некие, скажем так, "функции" имеющие примерно такой вид "Имя_Функции(Параметры)". Мне нужно "вычленить" из этой строки эти функции, затем их посчитать и вставить обратно уже результат. Есть список имен этих "функций".
Я могу сделать это "в лоб" примитивными программными средствами - найти первое совпадение с именем, сохранить позицию, затем посимвольно считать "параметры" от открывающей скобки и до закрывающей, сохранить длину всей функции, затем вставить результат, но мне бы хотелось использовать средства Python, т.к., он (насколько я знаю) как раз силен в подобных задачах.
Возможно, это нужно делать регулярными выражениями, но если выражение в скобках я еще смогу обернуть в регулярки, то учесть Имя функции я уже не знаю как.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
28.06.2021, 13:31
Ответы с готовыми решениями:

Парсинг текста с сайта
Добрый вечер! Питон знаю посредственно, как и HTML в принципе, но в голове закралась идея сделать бота в телеге, который будет брать...

Парсинг текста
Здравствуйте, надо зделать 2 функции в python. 1) Из большого текста вырезать кусок по параметрам слева и права Пример: cutOne('Lorem...

Парсинг и замена текста в html (python3)
Приветствую Друзья, если не затруднит, подскажите решение для python3. Есть некий html файл, вполне себе стандартный, в нем среди...

22
3582 / 2182 / 571
Регистрация: 02.09.2015
Сообщений: 5,510
29.06.2021, 14:41
Студворк — интернет-сервис помощи студентам
Цитата Сообщение от Constcat Посмотреть сообщение
Снова я к вам.
Вот, не получается разобрать подобные строки. Слаб в регулярках, к сожалению...
Данный класс (задач) регулярками не решается. Точка!
P. S. Ты либо пишешь лексер + парсер по своей грамматике (с помощью регулярок или без), либо страдаешь дальше.
P. P. S. Кури ANTLR4.

Добавлено через 2 минуты
Первая ссылка в гугле: https://stackoverflow.com/a/22492975.
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
29.06.2021, 14:55
Цитата Сообщение от Constcat Посмотреть сообщение
Вот, не получается разобрать подобные строки
А ты вообще попробовал то, что тебе показали?
Моя регулярка работает на всех твоих примерах.

Python
1
2
3
4
5
6
>>> text= """PROJECT_DURATION(>,50) - TASK_DURATION(=,70)
PROJECT_COST(<,1000) * 365
"Manager " + PRROJECT_NAME(=,Иванов)"""
>>> re.findall(r"(?i)(\w+?)\((.*?)\)", text)
[('PROJECT_DURATION', '>,50'), ('TASK_DURATION', '=,70'), ('PROJECT_COST', '<,1000'), ('PRROJECT_NAME', '=,Иванов')]
>>>
1
242 / 208 / 36
Регистрация: 19.02.2021
Сообщений: 1,431
29.06.2021, 15:51  [ТС]
Цитата Сообщение от Garry Galler Посмотреть сообщение
А ты вообще попробовал то, что тебе показали?
Моя регулярка работает на всех твоих примерах.
Упустил, каюсь... Сейчас попробую.

Добавлено через 49 минут
Garry Galler, Еще раз большое спасибо! Ваша регулярка + цикл с заменой из примера Fudthhh полностью решила задачу!
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
29.06.2021, 15:51
Помогаю со студенческими работами здесь

Парсинг текста на сайте с защитой от копирования
Уважаемые форумчане, прошу помощи: есть сайт с текстом книги, но он защищен от копирования. Помогите спарсить весь текст книги в файлик. ...

Парсинг по порядку или парсинг до определенного тега
Доброго времени друзья! Подскажите пожалуйста, к примеру есть вот такой html код: &lt;div class=&quot;container mt-3&quot;&gt; ...

Парсинг текста
Здравствуйте, у меня есть строка char* с огромным количеством текста(в мб) как ее можно про парсить? Можно пример, с любым много строчным...

парсинг текста
Ну в общем,хочу спарсить с сайта текста находящийся между тегами,но компилятор ругается. a=(List-&gt;Text.Pos(&quot;&lt;a...

Парсинг текста
Парсит один раз, хотя значений как минимум 15. Как правильно сделать цикл? Помогите пожалуйста. var parser, log:string; begin ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
23
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru