Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.91/22: Рейтинг темы: голосов - 22, средняя оценка - 4.91
0 / 0 / 0
Регистрация: 21.06.2012
Сообщений: 5
1

Нахождение 10 наиболее частых слов на web странице

21.06.2012, 16:34. Показов 4289. Ответов 10
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Ребят, выручайте, через 4 дня защита. Указывает на ошибку в последней строке. Питон версии 3.2 что не так? взял готовый пример с этого сайта, попробовал запустить, пишет ошибку invalid sintax в этой строке print p[0], p[1]


Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
from urllib2 import urlopen         # из модуля urllib2 импортируем функцию urlopen
 
u = urlopen("http://python.org")    # открываем URL на чтение
words = {}                          # связываем имя words с пустым словарём
                                    # (словарь — неупорядоченный [[ассоциативный массив]])
for line in u:          # читаем u по строкам
    line = line.strip(" \n")    # отбрасываем начальные и конечные пробелы
    for word in line.split(" "): # режем каждую строку на слова, ограниченные пробелами
        try:                            # блок обработки исключений
            words[word] += 1            # пытаемся увеличить words[word] на единицу
        except KeyError:                # если не получилось (раньше words[word] не было)
            words[word] = 1             # присваиваем единицу
 
# теперь словарь words содержит частоту встречаемости каждого слова.
# Например, words может содержать {"яблоко":5, "апельсин": 12, "груша": 8}
 
pairs = words.items()               # делаем из словаря список пар
                                    # pairs == [("яблоко",5), ("апельсин",12), ("груша",8)]
pairs.sort(key=lambda x: x[1], reverse=True)  # сортируем по убыванию второго элемента пары
 
for p in pairs[:10]:                # печатаем первые 10 элементов списка
    print p[0], p[1]
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
21.06.2012, 16:34
Ответы с готовыми решениями:

Нахождение 10 наиболее частых слов на web странице
Добрый день. Есть программа для нахождения 10 наиболее частых слов на web странице. Помогите...

Построить список наиболее частых пар слов (как дописать)
Построить список наиболее частых пар слов употребляемых в одной фразе(предложении), при этом слова...

Вывести список наиболее частых пар слов, употребленных в предложении, введенном с клавиатуры в консоли
Здравствуйте, форумчане. Задача примерно следующая (из заголовка темы): В консоли с клавиатуры...

Список наиболее частых повторений
Здравствуйте, подскажите пожалуйста. У меня есть список строк, мне надо найти, которые чаще всего...

Нахождение самого часто (частых) значений в массиве
В массиве надо найти самое(самые) часто повторяющееся(повторяющиеся) числа. При этом нужно...

10
2554 / 1319 / 178
Регистрация: 09.05.2011
Сообщений: 3,086
Записей в блоге: 1
21.06.2012, 19:42 2
Python
1
print(p[0], p[1])
0
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
22.06.2012, 01:40 3
Python
1
2
3
4
>>> import urllib.request
>>> urllib.request.urlopen
<function urlopen at 0xb731ec2c>
>>>
0
0 / 0 / 0
Регистрация: 21.06.2012
Сообщений: 5
22.06.2012, 14:31  [ТС] 4
accept а этот код вместо чего вставлять? Ты бы мог вставить его в код проги и полностью выложить как это будет выглядеть? Просто не шарю вообще на Питоне. Заранее спасибо
0
2554 / 1319 / 178
Регистрация: 09.05.2011
Сообщений: 3,086
Записей в блоге: 1
22.06.2012, 19:49 5
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
#!/usr/bin/env python3
 
from urllib.request import urlopen         # из модуля urllib2 импортируем функцию urlopen
 
# u = urlopen("http://python.org")    # открываем URL на чтение
words = {}                          # связываем имя words с пустым словарём
                                    # (словарь — неупорядоченный [[ассоциативный массив]])
for line in urlopen("http://python.org"):          # читаем u по строкам
    line = str(line, encoding='utf-8')
    line = line.strip(" \n")    # отбрасываем начальные и конечные пробелы
    for word in line.split(" "): # режем каждую строку на слова, ограниченные пробелами
        try:                            # блок обработки исключений
            words[word] += 1            # пытаемся увеличить words[word] на единицу
        except KeyError:                # если не получилось (раньше words[word] не было)
            words[word] = 1             # присваиваем единицу
 
# теперь словарь words содержит частоту встречаемости каждого слова.
# Например, words может содержать {"яблоко":5, "апельсин": 12, "груша": 8}
 
pairs = words.items()               # делаем из словаря список пар
                                    # pairs == [("яблоко",5), ("апельсин",12), ("груша",8)]
pairs = sorted(pairs, key=lambda x: x[1], reverse=True)  # сортируем по убыванию второго элемента пары
 
for p in pairs[:10]:                # печатаем первые 10 элементов списка
    print(p[0], p[1])
2
0 / 0 / 0
Регистрация: 21.06.2012
Сообщений: 5
24.06.2012, 21:48  [ТС] 6
Запускаю питон данный скрипт вылазиет такое 252
<a 67
54
Python 33
30
/> 25
the 25
<div 23
<link 22
for 22

Добавлено через 14 секунд
как можно это понять?
0
2554 / 1319 / 178
Регистрация: 09.05.2011
Сообщений: 3,086
Записей в блоге: 1
24.06.2012, 21:55 7
АМС, ну не знаю, может она выводит десять наиболее повторяющихся слов на странице? Хотя вряд ли, скорее всего она просит купить ей печенек с молоком.
0
0 / 0 / 0
Регистрация: 21.06.2012
Сообщений: 5
24.06.2012, 22:25  [ТС] 8
Цитата Сообщение от soon Посмотреть сообщение
АМС, ну не знаю, может она выводит десять наиболее повторяющихся слов на странице? Хотя вряд ли, скорее всего она просит купить ей печенек с молоком.
типа эта прога конченная как я понял может кто нибудь подскажет какие нибудь другие возможные варианты мне на курсач над с темой интернет технологии что то на данную тему
0
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
25.06.2012, 03:27 9
Цитата Сообщение от АМС Посмотреть сообщение
Нахождение 10 наиболее частых слов на web странице
что считается словом ?
0
0 / 0 / 0
Регистрация: 21.06.2012
Сообщений: 5
25.06.2012, 11:14  [ТС] 10
Цитата Сообщение от accept Посмотреть сообщение
что считается словом ?
так вот как раз и не знаю как я понял нужно наверное самому вписывать 10 слов и прога должна сама переходить на сайт и искать те 10 слов
0
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
26.06.2012, 02:37 11
я понял, что нужно любые слова искать на странице и подсчитывать их, но что является словом ?

Цитата Сообщение от АМС Посмотреть сообщение
<link 22
здесь словом считается непрерывная последовательность символов, которая не содержит пробелов
0
26.06.2012, 02:37
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
26.06.2012, 02:37
Помогаю со студенческими работами здесь

Нахождение самых частых триграмм, содержащих букву А
Здравствуйте, нужна помощь с решением задачи из егэ на языке программирования python, вот условие:...

Список десяти частых слов используя Thread и Regex
Здравствуйте! Помогите реализовать программу на C#, учитывающую принципы SOLID, которая будет...

Поиск наиболее употребляемых слов, наименее употребимых слов
Дописать поиск трёх наиболее употребляемых слов, наименее употребимых слов и колличество всех букв...

Дан список слов. Найти наиболее длинную последовательность слов, чтобы конец предыдущего совпадал с началом следующего
Дан список слов. Найти наиболее длинную последовательность слов, чтобы конец предыдущего совпадал с...

Нахождение наиболее заполненного прямоугольника
Здравствуйте. Такая ситуация, есть фигура с какими-то координатами, для примера X: 194 Y: 175...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
11
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru