Форум программистов, компьютерный форум, киберфорум
Python: Решение задач
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 07.10.2020
Сообщений: 113

Логическая обработка файлов

14.01.2025, 21:27. Показов 741. Ответов 5

Студворк — интернет-сервис помощи студентам
Здравствуйте,
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
 import os
import re
 
# Путь к файлу games.txt
file_path = os.path.join(os.path.dirname(__file__), 'games.txt')
 
# Чтение данных из файла
try:
    with open(file_path, 'r', encoding='utf-8') as file:
        data = file.read()
except FileNotFoundError:
    print(f"Файл {file_path} не найден. Убедитесь, что он существует в папке с программой.")
    exit(1)
 
# Запрос коэффициента наценки и курса валют
markup_coefficient = float(input("Введите коэффициент наценки (например, 1.2 для 20% наценки): "))
usd_to_rub = float(input("Введите курс USD к RUB: "))
 
# Регулярное выражение для извлечения всех игр
game_pattern = re.compile(
    r"^(.*?)\s+Deal until.*?\n.*?\n.*?([\d,]+\.\d+)\sUSD",  # Название игры и цена в USD
    re.MULTILINE
)
 
# Список для хранения результатов
result = []
 
# Найти все игры в файле
matches = game_pattern.findall(data)
if not matches:
    print("Игры не найдены в файле. Проверьте формат входных данных.")
    exit(1)
 
# Обработка каждой найденной игры
for match in matches:
    # Извлекаем название игры и цену
    game_name = match[0].strip()
    price_usd = float(match[1].replace(',', '.'))  # Преобразование цены в float
 
    # Рассчитываем финальную цену в рублях
    final_price_rub = round(price_usd * usd_to_rub * markup_coefficient)
 
    # Добавляем строку с игрой и ценой в результат
    result.append(f"{game_name} - {final_price_rub} руб.")
 
# Запись всех игр в итоговый файл
output_file_path = 'games_info_output.txt'
with open(output_file_path, 'w', encoding='utf-8') as output_file:
    output_file.write("\n".join(result))
 
print(f"\nВсе игры успешно обработаны. Результат сохранён в файл '{output_file_path}'.")
не первый день пытаюсь решить задачу с обработкой информации в файле txt.
Задача следующая, пользователь наполняет файл games.txt информацией, каждый раз она разная но в аналогичном порядке.
На входе нас необходимо получить название игры (причем не дублировано два раза) - цена (с учетом наценки и курса). Каждый раз то не все данные обработаются, то еще что-то …
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
14.01.2025, 21:27
Ответы с готовыми решениями:

Обработка текстовых файлов. Обработка бинарных файлов. Сериализация и десериализация объектов
Запросить у пользователя необходимость повторения работы программы. В случае если пользователь желает повторить выполнение программы –...

Обработка выполняется очень долго. Обработка файлов
На вход идут данные от 2007 года до сегодня. Просто вывод дат.. очень быстро. Только включаю обработку файла то занимает очень много...

Добавление части имени файла внутрь файлов, обработка множества файлов
Есть директория, в которой находится n-ое количество файлов csv. Нужно в начало каждой строки, во всех файлах добавить часть из названия...

5
Супер-модератор
Эксперт функциональных языков программированияЭксперт Python
 Аватар для Catstail
38167 / 21102 / 4307
Регистрация: 12.02.2012
Сообщений: 34,690
Записей в блоге: 14
15.01.2025, 07:57
Цитата Сообщение от OOH Посмотреть сообщение
то еще что-то …
- прекрасный симптом!

Скорее всего - проблема в регулярном выражении. Но хотелось бы иметь файл, который, как вы пишете, обрабатывается неверно.
1
0 / 0 / 0
Регистрация: 07.10.2020
Сообщений: 113
15.01.2025, 09:56  [ТС]
Собрал все уникальные данные которые может занести пользователь, обратно же данные на сайте меняются постоянно и добавлять что-то новое .. Но в данный момент пытаюсь сделать по данным которые предоставил вам.
Вложения
Тип файла: txt games.txt.txt (1.3 Кб, 15 просмотров)
0
Супер-модератор
Эксперт функциональных языков программированияЭксперт Python
 Аватар для Catstail
38167 / 21102 / 4307
Регистрация: 12.02.2012
Сообщений: 34,690
Записей в блоге: 14
15.01.2025, 10:43
OOH, у вас

10 Second Ninja X
Trove of the Ancients
и т.п. - это название игр?
0
Любознательный
 Аватар для YuS_2
7404 / 2254 / 360
Регистрация: 10.03.2016
Сообщений: 5,213
15.01.2025, 13:12
Лучший ответ Сообщение было отмечено OOH как решение

Решение

Цитата Сообщение от OOH Посмотреть сообщение
Каждый раз то не все данные обработаются, то еще что-то …
с минимальными правками в части шаблона регулярки и наименовании переменных (не именуйте переменные зарезервированными словами):
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
import os
#import re
import regex as re
 
# Путь к файлу games.txt
file_path = os.path.join(os.path.dirname(__file__), 'games.txt')
 
# Чтение данных из файла
try:
    with open(file_path, 'r', encoding='utf-8') as file:
        data = file.read()
except FileNotFoundError:
    print(f"Файл {file_path} не найден. Убедитесь, что он существует в папке с программой.")
    exit(1)
 
# Запрос коэффициента наценки и курса валют
markup_coefficient = float(input("Введите коэффициент наценки (например, 1.2 для 20% наценки): "))
usd_to_rub = float(input("Введите курс USD к RUB: "))
 
# Регулярное выражение для извлечения всех игр
# Название игры и цена в USD
pattern = r"(?ms)(?<=\A|expensive\n)^ *([^\n]+) *\n.*?^ *(\d+(?:\.|,)?\d*) *USD"
 
result = []
matches = re.findall(pattern, data)
if not matches:
    print("Игры не найдены в файле. Проверьте формат входных данных.")
    exit(1)
 
# Обработка каждой найденной игры
for m in matches:
    # Извлекаем название игры и цену
    game_name = m[0].strip()
    price_usd = float(m[1].replace(',', '.'))  # Преобразование цены в float
 
    # Рассчитываем финальную цену в рублях
    final_price_rub = round(price_usd * usd_to_rub * markup_coefficient)
 
    # Добавляем строку с игрой и ценой в результат
    result.append(f"{game_name} - {final_price_rub} руб.")
 
# Запись всех игр в итоговый файл
output_file_path = 'games_info_output.txt'
with open(output_file_path, 'w', encoding='utf-8') as output_file:
    output_file.write("\n".join(result))
 
print(f"\nВсе игры успешно обработаны. Результат сохранён в файл '{output_file_path}'.")
Добавлено через 8 минут
Цитата Сообщение от OOH Посмотреть сообщение
На выходе нас необходимо получить название игры (причем не дублировано два раза)
с этим придется разбираться отдельно и скорее всего, вручную, ибо регэкспы не настолько интеллектуальны, чтобы разбирать подобные дубли...
хотя, конечно, можно и попытаться заменить цикл извлечения наименования и цены, примерно так:
Python
1
2
3
4
5
6
7
8
9
...
pat = r"^\b(\S+)(.*?)\1[^\n]*"
# Обработка каждой найденной игры
for m in matches:
    # Извлекаем название игры и цену
    game_name = m[0].strip()
    game_name = re.sub(pat,r"\1\2",game_name)
    price_usd = float(m[1].replace(',', '.'))  # Преобразование цены в float
...
Добавлено через 13 минут
но тут есть "подводные камни", если в наименовании есть повторяющиеся символы, то вырезание дубля произойдет некорректно, например:
"Ancient Coins - Hidden Trove of the Ancients Ancient Coins - Hidden Trove of the Ancients"
будет обрезана так:
"Ancient Coins - Hidden Trove of the "
что неверно...
Можно попытаться чуть уменьшить вероятность некорректного вырезания, вот с таким шаблоном:
Python
1
2
3
...
pat = r"^\b(\S+\s*\S*)(.*?)\1[^\n]*"
...
В общем, поэкспериментируйте с большим количеством данных...
1
0 / 0 / 0
Регистрация: 07.10.2020
Сообщений: 113
15.01.2025, 20:01  [ТС]
Да, все данные связаны связаны с играми
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
15.01.2025, 20:01
Помогаю со студенческими работами здесь

Обработка файлов с созданием и использованием файла со списком имён файлов, исключаемых при данной обработке
Эх, чтобы я без вас делал то ;) Доброго времени суток! Задача сценария: просматривать файлы в текущей директории и если их нету в...

Логическая схема. Как работает эта логическая схема и отдельные её элементы
Хотел бы понять как работает эта логическая схема и отдеьные её элементы. Почему-то вместо компараторов, сумматоров и прочего логические...

Обработка группы файлов и "склейка" файлов в один
Здравствуйте. Извините за глупый вопрос, но тем не менее: Подскажите, как лучше поступить: &quot;склеить&quot; несколько файлов word...

Обработка файлов
нужна программа, в которой ты вводишь имя файла с клавы, она открывает его, ты задаешь условие, которое программа удалит везде в этом файле...

Обработка файлов
Доброго времени суток! Обращаюсь к Вам за помощью в написании обработчика или иного способа решения возникшей проблемы: есть массив...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Первый деплой
lagorue 16.01.2026
Не спеша развернул своё 1ое приложение в kubernetes. А дальше мне интересно создать 1фронтэнд приложения и 2 бэкэнд приложения развернуть 2 деплоя в кубере получится 2 сервиса и что-бы они. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит: токи, напряжения и их 1 и 2 производные при t = 0;. . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Изучаю kubernetes
lagorue 13.01.2026
А пригодятся-ли мне знания kubernetes в России?
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru