С Новым годом! Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/3: Рейтинг темы: голосов - 3, средняя оценка - 4.67
0 / 0 / 0
Регистрация: 03.01.2023
Сообщений: 6

В html нет кирилицы

03.01.2023, 04:10. Показов 632. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте, сегодня пытался спарсить данные с одного русско-язычного сайта, для избежание проблем решил скачать html код с помощью requests однако файл не поддерживает кириллицу, я попробывал сменить кодировку с utf-8 на windows-1251 однако это не помогло.
Подскажите что делать
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
03.01.2023, 04:10
Ответы с готовыми решениями:

Нет кирилицы в JavaDoc
Документирую исходники на русском. В HTML-файлы без проблем русские строки попадают. IE все это хозяйство показывает. А на закладке DOC в...

PHP исполняется, а HTML - нет
Я - начинающий и у меня проблема. Есть файл с формой, обработчиком которой выступает другой файл. Этот другой файл все нормально...

Поддержка кирилицы
Всем привет. У меня возникла проблема с кодировками в гетерогенной сети, кириллический тест распознается кроказябрами Потому, что...

3
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,664
Записей в блоге: 29
03.01.2023, 11:07
Marfile404, показывай код, которым качал и смотрел, давай урл сайта.
0
0 / 0 / 0
Регистрация: 03.01.2023
Сообщений: 6
03.01.2023, 12:39  [ТС]
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
i
mport requests
from bs4 import BeautifulSoup
 
url = 'https://www.wildberries.ru/catalog/elektronika'
headers = {
    'accept' : 'something',
    'useragent' : 'USERAGENT'
}
 
req = requests.get(url,headers=headers)
 
src = req.text
 
with open('index.html','w',encoding='utf-8') as file:
    file.write(src)
В файле вместо кириллицы эльфийский
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,664
Записей в блоге: 29
03.01.2023, 13:18
Лучший ответ Сообщение было отмечено Marfile404 как решение

Решение

Marfile404, хедеры бессмысленны, не пиши такие
зачем сохраняешь в утф-8, если кодировка содержимого другая?
Python
1
2
3
4
5
6
7
8
>>> import requests
>>> url = 'https://www.wildberries.ru/catalog/elektronika'
>>> req = requests.get(url)
>>> req.encoding
'ISO-8859-1'
>>> req.encoding='utf-8'
>>> with open('index.html','w',encoding='utf-8') as file:
...     file.write(req.text)
это кстати все прописано в документации реквестов
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
03.01.2023, 13:18
Помогаю со студенческими работами здесь

Имитация кирилицы
Привет! Пробывал (?) кто-нибудь создавать уникальные тексты, за счет уже созданных статей, но не способом рерайтинга, а заменяя в...

Символы кирилицы
Тут вот возник один вопрос:help:. Я догадываюсь, что это глупый вопрос:-!, но поиск по форуму мне ответа не дал. Собсьна сам вопрос: как...

Обработка кирилицы
Ребят, не могу сделать так, чтобы проверка на палиндром слова проходила не только для латиницы, но и для кирилицы. вот код, если есть у...

url кирилицы
вот к примеру http://пары.net/ это http://xn--80a3ae8b.net/ если даже скопировать юрл в блокнот что это за кодирование кирилицы...

Нет возможности посмотреть код html
В какой браузер не зайду, в любом нет возможности посмотреть код страницы или исследовать элемент. Везде кнопки не активны.


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение. И на уровне агентов добавится между грибами или бактериями взаимодействий. До того я пробовал подход через многомерные массивы,. . .
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути
Programma_Boinc 01.01.2026
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути Сочетание глобально распределённой вычислительной мощности и инновационных. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 05.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru