Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
2 / 2 / 1
Регистрация: 16.04.2022
Сообщений: 1,032

Написать скрипт правильнее

25.04.2024, 09:22. Показов 184. Ответов 0
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте!

Есть html-файлы. В данном примере для ясного понимания проблемы представленные структуры html упрощены.

Файл 1.html
Кликните здесь для просмотра всего текста
XML
1
2
3
4
<!DOCTYPE html>
<div data-qa="price-view" class="class1">7&nbsp;890
    <span class="class1_1"><span>/</span>шт.</span>
</div>

Файл 2.html
Кликните здесь для просмотра всего текста
XML
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
<!DOCTYPE html>
<div data-qa="price-view" class="class2">
    <div class="class2_1">
        <div>
            <svg width="20" height="20" viewBox="0 0 20 20" fill="none" xmlns="http://www.w3.org/2000/svg">
                <rect width="20" height="20" fill="#D22E1C"></rect>
                <path d="M13.375 6.625L6.625 13.375" stroke="#FFEF77" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round"></path>
                <path d="M7.5625 8.875C8.28737 8.875 8.875 8.28737 8.875 7.5625C8.875 6.83763 8.28737 6.25 7.5625 6.25C6.83763 6.25 6.25 6.83763 6.25 7.5625C6.25 8.28737 6.83763 8.875 7.5625 8.875Z" stroke="#FFEF77" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round"></path>
                <path d="M12.4375 13.75C13.1624 13.75 13.75 13.1624 13.75 12.4375C13.75 11.7126 13.1624 11.125 12.4375 11.125C11.7126 11.125 11.125 11.7126 11.125 12.4375C11.125 13.1624 11.7126 13.75 12.4375 13.75Z" stroke="#FFEF77" stroke-width="1.25" stroke-linecap="round" stroke-linejoin="round"></path>
            </svg>
            <span class="class2_1_1">Снижение цены!</span>
        </div>
    </div>
    <div class="class2_2">
        <span class="class2_2_1">3&nbsp;357</span>
        <span class="class2_2_2">₽/шт.</span>
    </div>
    <div class="class2_3">
        <span class="class2_3_1" style="color: var(--text-primary);">3&nbsp;720</span>
        <span class="class2_3_2" style="color: var(--text-primary);"></span>
    </div>
</div>

Аналогично остальные файлы по такой же структуре.

Нужно вытащить цену. Есть файлы, где указывается просто цена. А есть файлы, где указывается старая и новая цена. Есть скрипт, который выдергивает цены.

Кликните здесь для просмотра всего текста
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
from bs4 import BeautifulSoup
import glob
 
DATA_PATH = r'C:\Users\Acer\Desktop\Pages'
 
listFiles = []
 
extensions = [DATA_PATH + '/*.html']
 
for i in extensions:
    for image_file_name in glob.glob(i):
 
data = []
    
for file_path in listFiles:
    print(file_path)
    
    with open(file_path, encoding='utf-8') as f:
        html = f.read()
 
    bsObj = BeautifulSoup(html)  
    price = bsObj.find('div', 'class1')    
    
    if not(price is None):
        price = price.get_text().replace('\xa0', ' ').replace('/шт.', '') 
        print('Цена: ', price)
        
    price = bsObj.find('div', 'class2')
        
    if not(price is None):
        newPrice = price.find('span', 'class2_2_1').get_text().replace('\xa0', ' ') + ' ' + price.find('span', 'class2_2_2').get_text()
        oldPrice = price.find('span', 'class2_3_1').get_text().replace('\xa0', ' ') + ' ' + price.find('span', 'class2_3_2').get_text()
        print('Старая цена: ', oldPrice)
        print('Новая цена: ', newPrice)

Скрипт как бы работает, но написан не оптимально и не профессионально с учетом того, что возможно два варианта структуры html. Может появиться и третий вариант.

Хотел узнать Ваше экспертное мнение. Скажите, для имеющейся структуры html как более правильнее и профессиональнее написать скрипт?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
25.04.2024, 09:22
Ответы с готовыми решениями:

Как правильнее написать
Пример int ПРОВЕРКА1{ Проверка переменной на свойство; Возврат 1 или 0; } void main(){ int x; ...

Как правильнее написАть?
1. printf(&quot;Hello World\n&quot;); 2. printf(&quot;%s\n&quot;, &quot;Hello World&quot;); Как правильнее написАть? 1-м или 2-м...

Как правильнее написать код?
Гипотеза Коллатца open System let count x= Seq.fold (fun acc e -&gt;if acc=0 then 5 else if acc % 2=0 then acc/2 else 3*acc+1) 0 let...

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
25.04.2024, 09:22
Помогаю со студенческими работами здесь

Как правильнее написать код
Привет. Подскажите как можно покрасивее написать такое условие? $to_karma = ($self_all &lt;= 100.00 &amp;&amp; $self_all&lt;= 100.00...

Как правильнее написать обработку события удаления объекта?
Привет всем, давненько меня тут не было. Поработав с Unreal Engine, меня захватила идея EventDispatcher'ов, которые можно создать...

Как правильнее написать универсальный контрол для отправки данных с формы на сервер?
У меня уже написан сервер, который занимается валидацией веб-форм. Он принимает FormData и возвращает json с разультатами проверки. Я так...

Как написать скрипт, чтобы по нажатию таба, он прожимался 3 раза? (скрипт хоткей)
Здравствуйте, как написать скрипт, чтобы по нажатию таба, он прожимался 3 раза, срочно нужно для работы, а как сделать без понятий....

Как написать серверный lua скрипт для игры Garry's mod (hl2), запускающий скрипт из клиентской части по команде ?
Вся суть скрипта - по команде в чат запускать другой скрипт. Как все реализовано? Все скрипты запихнул в addons, как отдельный addon. В...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем. . . .
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
SDL3 для Web (WebAssembly): Сборка библиотек: SDL3, Box2D, FreeType, SDL3_ttf, SDL3_mixer и SDL3_image из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual Studio. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru