|
1 / 1 / 0
Регистрация: 30.03.2013
Сообщений: 59
|
|
Парсинг html07.10.2017, 16:44. Показов 4850. Ответов 11
Метки нет (Все метки)
Здравстувуйте.
Начинаю изучать python. В качестве тренировочной задачи делаю такую Есть html страница. В ней есть столбец имя человека и email Как сделать так, чтобы если имя совпадало с Коля, Коле присылалось письмо "Привет, Коля". В целом не интересую контретный код, а советы как это можно написать. Спасибо.
0
|
|
| 07.10.2017, 16:44 | |
|
Ответы с готовыми решениями:
11
Парсинг html страницы |
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|
| 07.10.2017, 17:09 | |
|
В общем случае, сначала нужно хтмл страничку превратить в дерево элементов, потом найти в элементах таблицу, обойти таблицу и выполнить логику, которая вам нужна. Для этого можно использовать модули
requests, если таблицу нужно загрузить из интернета lxml / beautifulsoup, для поиска по дереву элементов smtplib - для посылки письма спрашивайте, если что-то не разберетесь, с удовольствием поможем
1
|
|
|
1 / 1 / 0
Регистрация: 30.03.2013
Сообщений: 59
|
|||||||||||
| 08.10.2017, 15:55 [ТС] | |||||||||||
|
Для тестовых целей попробывал просто найти слово Коля в html таблице
Подключаем модуль Созадём функцию Загружаем мою таблицу Создаём объект супа. Ищем в таблице слово Коля Печатаем найденное Вызываем функцию. Но появляется ошибка
0
|
|||||||||||
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|
| 08.10.2017, 16:07 | |
|
Сверху ошибки же написано что и на что поменять нужно
0
|
|
|
1 / 1 / 0
Регистрация: 30.03.2013
Сообщений: 59
|
|||||||||||
| 09.10.2017, 20:03 [ТС] | |||||||||||
|
Исправил так:
0
|
|||||||||||
|
|
|
| 09.10.2017, 20:10 | |
|
Ну .read же не так!!!! Нет такого свойства. Есть такой метод. Со скобками read()
0
|
|
|
1 / 1 / 0
Регистрация: 30.03.2013
Сообщений: 59
|
|||||||||||
| 09.10.2017, 21:59 [ТС] | |||||||||||
|
Спасибо
Исправил так
Если, что мой html документ
0
|
|||||||||||
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
||||||
| 09.10.2017, 23:35 | ||||||
0
|
||||||
|
1 / 1 / 0
Регистрация: 30.03.2013
Сообщений: 59
|
|||||||||||
| 10.10.2017, 21:41 [ТС] | |||||||||||
|
Мой вариант:
0
|
|||||||||||
|
|
|
| 10.10.2017, 23:28 | |
|
Cписок дочерних узлов родителя, если дочерний узел - текстовая нода - вернет текст.
P.S. А ставить пробелы между именем функции и скобками (или перед точкой) - это чтобы парсер python'а проверить на модель "прощающего разбора"?
0
|
|
|
1 / 1 / 0
Регистрация: 30.03.2013
Сообщений: 59
|
|
| 11.10.2017, 20:26 [ТС] | |
|
Теперь думаю как сделать так, чтобы если у Коле сегодня день рождения, Васе на почту пришло: Привет Вася, поздравь Колю.
Правильно ли я понимаю, что нужно сначала создать словарь с ключами имя, дата, почта. Коллеги, прошу не присылать мне готовый код. Хочется самим дойти до него.
0
|
|
|
10 / 10 / 2
Регистрация: 07.12.2017
Сообщений: 40
|
|
| 07.12.2017, 13:20 | |
|
Смотри findall('tr') возвращает список с найденными совпадениями тоесть tr (<tr> .....</tr>)
дальше цикл перебирающий найденное с помощью findall('td'). Возвращает список с td судя по твоему файлу findall('td')[0] это имя findall('td')[1] дата рождения findall('td')[2] эмейл
0
|
|
| 07.12.2017, 13:20 | |
|
Помогаю со студенческими работами здесь
12
Парсинг и замена текста в html (python3) Парсинг html
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Налог на собак: https:/ / **********/ gallery/ V06K53e
Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf
Пост отсюда. . .
|
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop?
Ниже её машинный перевод.
После долгих разбирательств я наконец-то вернула себе. . .
|
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод
Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод.
Thinkpad X220 Tablet —. . .
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|