Нахождение 10 наиболее частых слов на web странице

@АМС · Регистрация: 21.06.2012

Author24 — интернет-сервис помощи студентам

Ребят, выручайте, через 4 дня защита. Указывает на ошибку в последней строке. Питон версии 3.2 что не так? взял готовый пример с этого сайта, попробовал запустить, пишет ошибку invalid sintax в этой строке print p[0], p[1]

Python

from urllib2 import urlopen         # из модуля urllib2 импортируем функцию urlopen
 
u = urlopen("http://python.org")    # открываем URL на чтение
words = {}                          # связываем имя words с пустым словарём
                                    # (словарь — неупорядоченный [[ассоциативный массив]])
for line in u:          # читаем u по строкам
    line = line.strip(" \n")    # отбрасываем начальные и конечные пробелы
    for word in line.split(" "): # режем каждую строку на слова, ограниченные пробелами
        try:                            # блок обработки исключений
            words[word] += 1            # пытаемся увеличить words[word] на единицу
        except KeyError:                # если не получилось (раньше words[word] не было)
            words[word] = 1             # присваиваем единицу
 
# теперь словарь words содержит частоту встречаемости каждого слова.
# Например, words может содержать {"яблоко":5, "апельсин": 12, "груша": 8}
 
pairs = words.items()               # делаем из словаря список пар
                                    # pairs == [("яблоко",5), ("апельсин",12), ("груша",8)]
pairs.sort(key=lambda x: x[1], reverse=True)  # сортируем по убыванию второго элемента пары
 
for p in pairs[:10]:                # печатаем первые 10 элементов списка
    print p[0], p[1]

@soon · 21.06.2012, 19:42

Python

1	print(p[0], p[1])

accept · 22.06.2012, 01:40

Python

>>> import urllib.request
>>> urllib.request.urlopen
<function urlopen at 0xb731ec2c>
>>>

@АМС · 22.06.2012, 14:31 **[ТС]**

accept а этот код вместо чего вставлять? Ты бы мог вставить его в код проги и полностью выложить как это будет выглядеть? Просто не шарю вообще на Питоне. Заранее спасибо

@soon · 22.06.2012, 19:49

Python

#!/usr/bin/env python3
 
from urllib.request import urlopen         # из модуля urllib2 импортируем функцию urlopen
 
# u = urlopen("http://python.org")    # открываем URL на чтение
words = {}                          # связываем имя words с пустым словарём
                                    # (словарь — неупорядоченный [[ассоциативный массив]])
for line in urlopen("http://python.org"):          # читаем u по строкам
    line = str(line, encoding='utf-8')
    line = line.strip(" \n")    # отбрасываем начальные и конечные пробелы
    for word in line.split(" "): # режем каждую строку на слова, ограниченные пробелами
        try:                            # блок обработки исключений
            words[word] += 1            # пытаемся увеличить words[word] на единицу
        except KeyError:                # если не получилось (раньше words[word] не было)
            words[word] = 1             # присваиваем единицу
 
# теперь словарь words содержит частоту встречаемости каждого слова.
# Например, words может содержать {"яблоко":5, "апельсин": 12, "груша": 8}
 
pairs = words.items()               # делаем из словаря список пар
                                    # pairs == [("яблоко",5), ("апельсин",12), ("груша",8)]
pairs = sorted(pairs, key=lambda x: x[1], reverse=True)  # сортируем по убыванию второго элемента пары
 
for p in pairs[:10]:                # печатаем первые 10 элементов списка
    print(p[0], p[1])

@АМС · 24.06.2012, 21:48 **[ТС]**

Запускаю питон данный скрипт вылазиет такое 252
<a 67
54
Python 33
30
/> 25
the 25
<div 23
<link 22
for 22

Добавлено через 14 секунд
как можно это понять?

@soon · 24.06.2012, 21:55

АМС, ну не знаю, может она выводит десять наиболее повторяющихся слов на странице? Хотя вряд ли, скорее всего она просит купить ей печенек с молоком.

@АМС · 24.06.2012, 22:25 **[ТС]**

Сообщение от soon

АМС, ну не знаю, может она выводит десять наиболее повторяющихся слов на странице? Хотя вряд ли, скорее всего она просит купить ей печенек с молоком.

типа эта прога конченная как я понял может кто нибудь подскажет какие нибудь другие возможные варианты мне на курсач над с темой интернет технологии что то на данную тему

accept · 25.06.2012, 03:27

Сообщение от АМС

Нахождение 10 наиболее частых слов на web странице

что считается словом ?

@АМС · 25.06.2012, 11:14 **[ТС]**

Сообщение от accept

что считается словом ?

так вот как раз и не знаю как я понял нужно наверное самому вписывать 10 слов и прога должна сама переходить на сайт и искать те 10 слов

accept · 26.06.2012, 02:37

я понял, что нужно любые слова искать на странице и подсчитывать их, но что является словом ?

Сообщение от АМС

<link 22

здесь словом считается непрерывная последовательность символов, которая не содержит пробелов

@АМС 0 / 0 / 0 Регистрация: 21.06.2012 Сообщений: 5
	22.06.2012, 14:31 [ТС]	4
	accept а этот код вместо чего вставлять? Ты бы мог вставить его в код проги и полностью выложить как это будет выглядеть? Просто не шарю вообще на Питоне. Заранее спасибо 0

@АМС 0 / 0 / 0 Регистрация: 21.06.2012 Сообщений: 5
	24.06.2012, 21:48 [ТС]	6
	Запускаю питон данный скрипт вылазиет такое 252 <a 67 54 Python 33 30 /> 25 the 25 <div 23 <link 22 for 22 Добавлено через 14 секунд как можно это понять? 0

@soon 2554 / 1319 / 178 Регистрация: 09.05.2011 Сообщений: 3,086 Записей в блоге: 1
	24.06.2012, 21:55	7
	АМС, ну не знаю, может она выводит десять наиболее повторяющихся слов на странице? Хотя вряд ли, скорее всего она просит купить ей печенек с молоком. 0

@АМС 0 / 0 / 0 Регистрация: 21.06.2012 Сообщений: 5
	24.06.2012, 22:25 [ТС]	8
	Сообщение от soon АМС, ну не знаю, может она выводит десять наиболее повторяющихся слов на странице? Хотя вряд ли, скорее всего она просит купить ей печенек с молоком. типа эта прога конченная как я понял может кто нибудь подскажет какие нибудь другие возможные варианты мне на курсач над с темой интернет технологии что то на данную тему 0

accept 4866 / 3288 / 468 Регистрация: 10.12.2008 Сообщений: 10,570
	25.06.2012, 03:27	9
	Сообщение от АМС Нахождение 10 наиболее частых слов на web странице что считается словом ? 0

@АМС 0 / 0 / 0 Регистрация: 21.06.2012 Сообщений: 5
	25.06.2012, 11:14 [ТС]	10
	Сообщение от accept что считается словом ? так вот как раз и не знаю как я понял нужно наверное самому вписывать 10 слов и прога должна сама переходить на сайт и искать те 10 слов 0

accept 4866 / 3288 / 468 Регистрация: 10.12.2008 Сообщений: 10,570
	26.06.2012, 02:37	11
	я понял, что нужно любые слова искать на странице и подсчитывать их, но что является словом ? Сообщение от АМС <link 22 здесь словом считается непрерывная последовательность символов, которая не содержит пробелов 0