Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.86/7: Рейтинг темы: голосов - 7, средняя оценка - 4.86
0 / 0 / 0
Регистрация: 12.04.2018
Сообщений: 4

Найти определенные фразы в файле и посчитать их долю в общем количестве фраз

12.04.2018, 05:58. Показов 1556. Ответов 6
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Есть файл (выгруженный лог запросов): https://yadi.sk/d/A-98NjcA3TktXp

1. Необходимо вывести все запросы, содержащиеся в столбце request, которые содержат определенное слово (например "хостинг").
2. Посчитать долю этих запросов в общем количестве запросов в столбце request

Подскажите команды.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
12.04.2018, 05:58
Ответы с готовыми решениями:

Как проверить определенные фразы или количество фраз в файле свыше гигабайта
Ребята, выручите пожалуйста срочно! Утром дедлайн! А работы еще перелопатить море! Есть файл, он 1.5 гига. В нем меняют нехорошие люди...

Какое изделие пользуется наибольшим спросом и какую долю ( в %) в общем количестве проданных изделий оно занимает
помогите новичку! )))):) Необходимо создать приложение,которое позволит считать данные с рабочего листа,обработать их и выдать...

Нужно найти повторяющиеся фразы и вывести список найденых фраз
нужно в текстовом файле найти повторяющиеся фразы и как результат вывести список найденых фраз. Со строками вроде все ясно, а вот с фразами...

6
Просто Лис
Эксперт Python
 Аватар для Рыжий Лис
5972 / 3734 / 1099
Регистрация: 17.05.2012
Сообщений: 10,791
Записей в блоге: 9
12.04.2018, 06:24
Хм... 400 Мб... Скиньте несколько десятков строчек из файла сюда.
0
0 / 0 / 0
Регистрация: 12.04.2018
Сообщений: 4
12.04.2018, 06:52  [ТС]
Строка 1: timestamp datetime device numdoc region request urls
Строка 2: 1520974800 2018-03-14 00:00 desktop 277053268 191 https://yandex.ru/search/?text=sad story скачать бесплатно mp3 в хорошем качестве&rl=416 http://mp3party.net/music/8507... ad%20story
Строка 3: 1520974800 2018-03-14 00:00 touch 19987730 2 https://yandex.ru/search/?text=ольгино баня&flag=l6707 http://www.bani.spb.ru/olgino.... ya-olgino/
Строка 4: 1520974800 2018-03-14 00:00 desktop 106605468 213 https://yandex.ru/search/?text=нужно ли мыть гречку перед варкой&id=hYYVGyK1cLWHo94T&client=980022
0
Просто Лис
Эксперт Python
 Аватар для Рыжий Лис
5972 / 3734 / 1099
Регистрация: 17.05.2012
Сообщений: 10,791
Записей в блоге: 9
12.04.2018, 07:08
Python
1
2
3
4
5
6
7
8
9
10
t = '''\
timestamp datetime device numdoc region request urls
1520974800 2018-03-14 00:00 desktop 277053268 191 https://yandex.ru/search/?text=sad&rl=416 http://mp3party.net/music/8507899;ht...%20sad%20story
1520974800 2018-03-14 00:00 touch 19987730 2 https://yandex.ru/search/?text=ольгино http://www.bani.spb.ru/olgino.html;h.../banya-olgino/'''
 
for line in t.split('\n'):
    bits = line.rsplit(' ', 2)
    # print(bits)
    data, request, urls = bits
    print(request)
Добавлено через 2 минуты
А, там табы... Тогда bits = line.split('\t')
0
0 / 0 / 0
Регистрация: 12.04.2018
Сообщений: 4
12.04.2018, 08:47  [ТС]
Спасибо.

А как можно вывести все строки из файла, которые содержат определенное слово? А затем посчитать их долю относительно всех строк.
0
Просто Лис
Эксперт Python
 Аватар для Рыжий Лис
5972 / 3734 / 1099
Регистрация: 17.05.2012
Сообщений: 10,791
Записей в блоге: 9
12.04.2018, 09:06
Если есть под рукой линукс:
Bash
1
2
grep word file.log
grep word file.log | wc -l
0
0 / 0 / 0
Регистрация: 12.04.2018
Сообщений: 4
12.04.2018, 09:49  [ТС]
Нет. Именно в Python.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
12.04.2018, 09:49
Помогаю со студенческими работами здесь

Найти долю нормального дохода в общем фонде заработной платы работников
Здравствуйте,помогите пожалуйста решить задачи по экономике

Найти количество полных минут в общем количестве секунд
С начала суток прошло N секунд (N — целое). Найти количество полных минут, прошедших с начала суток.

Вставка одинаковых фраз в большом количестве
Вот сделал документик. Немного грустный, но это жизнь ))) Смысл - нужно включать большое количество одинаковых элементов . ...

Найти долю вывоза каждого вида продукции в общем объеме вывоза продукции
по 18 видам продукции даны обьемы (в тыс. тенге) вывоза каждого вида из Казахстана. требуется найти - сумарный обьем вывоза. -...

В документе Word найти определенные фразы и сделать их "жирными"
Есть задача: в документе msword найти определенные фразы и сделать их "жирным". Поиск фраз можно реализовать с помощью find.Execute(ref...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Новые блоги и статьи
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Ниже машинный перевод статьи The Thinkpad X220 Tablet is the best budget school laptop period . Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы,. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru