Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.86/7: Рейтинг темы: голосов - 7, средняя оценка - 4.86
0 / 0 / 0
Регистрация: 22.08.2019
Сообщений: 5

Работа с Json, регулярные выражения python

22.08.2019, 23:18. Показов 1626. Ответов 9
Метки json (Все метки)

Студворк — интернет-сервис помощи студентам
Доброго времени суток. Я недавно начал изучать python. и есть такое задание! Есть файл example.json размер его может быть до 50мб с содержимым ["http://example.com/thread.php"],["http://example.com/thread.html"],["http://example.com/thread.css"],["http://example.com/thread.js"],["http://example.com/thread.pdf"],["http://example.com/thread.csv"] . Необходимо перезаписать его в другой файл с расширение html значения ссылок *.php и *.html в тег href примерно такого вида.
<a href="http://example.com/*.html" class="url">Ссылка http://example.com/*.html</a> а другие расширения удалить .Как лучше это написать на python?

Буду очень благодарен за помощь в этом сложном для меня вопросе.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
22.08.2019, 23:18
Ответы с готовыми решениями:

Регулярные выражения Python
Дана задача: Найдите повторения любых цифр в номерах телефонов, с использование квантификаторов Пример: +7478569874 Регулярное...

Регулярные выражения Python
Есть файл содержащий строки типа этой:&quot;02/22/2021 - 21:58:44: pass ok id = &quot; Нужно сохранить файл, только то, что содержится после id в...

Регулярные выражения Python
Добрый день! Помогите решить через регулярные выражения: В файле BaseFile.txt определить всех пользователей, у которых задан телефонный...

9
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
23.08.2019, 00:15
Цитата Сообщение от Nevjets Посмотреть сообщение
с содержимым ["http://example.com/thread.php"],["http://example.com/thread.html"]
Ты хочешь сказать вот с таким содержимым:
Code
1
2
3
4
5
6
7
8
[
    ["http://example.com/thread.php"],
    ["http://example.com/thread.html"],
    ["http://example.com/thread.css"],
    ["http://example.com/thread.js"],
    ["http://example.com/thread.pdf"],
    ["http://example.com/thread.csv"]
    ]
Потому что в том виде как у тебя, JSON файлов не бывает.

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
>>> # на этом моменте мы уже прочитали файл JSON и получили из него список списков
>>> # вот такой
>>> json = [
    ["http://example.com/thread.php"],
    ["http://example.com/thread.html"],
    ["http://example.com/thread.css"],
    ["http://example.com/thread.js"],
    ["http://example.com/thread.pdf"],
    ["http://example.com/thread.csv"]
    ]
>>> fmt = '<a href={}/*.html" class="url">Ссылка {}/*.html</a>'
>>> import os
>>> for url in json:
    head, tail = os.path.split(url[0])
    url[0] = fmt.format(head,head)
>>> from pprint import pprint
>>> pprint(json)
[['<a href=http://example.com/*.html" class="url">Ссылка '
  'http://example.com/*.html</a>'],
 ['<a href=http://example.com/*.html" class="url">Ссылка '
  'http://example.com/*.html</a>'],
 ['<a href=http://example.com/*.html" class="url">Ссылка '
  'http://example.com/*.html</a>'],
 ['<a href=http://example.com/*.html" class="url">Ссылка '
  'http://example.com/*.html</a>'],
 ['<a href=http://example.com/*.html" class="url">Ссылка '
  'http://example.com/*.html</a>'],
 ['<a href=http://example.com/*.html" class="url">Ссылка '
  'http://example.com/*.html</a>']]
>>>
0
0 / 0 / 0
Регистрация: 22.08.2019
Сообщений: 5
23.08.2019, 00:20  [ТС]
Да. спасибо за поправку, действительно я не правильно написал json.
Как поместить ссылку в href я уже понял, спасибо большое ) но как отфильтровать сами ссылки по расширению и записать всё это дело в файл ?

Добавлено через 1 минуту
Так же необходимо удалить в готовом html файле скобки [ ] и двойные кавычки, должны быть только ссылки )
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
23.08.2019, 00:24
Цитата Сообщение от Nevjets Посмотреть сообщение
Так же необходимо удалить в готовом html файле скобки [ ] и двойные кавычки, должны быть только ссылки )
Это называется не удалить, а извлечь. Извлечь содержимое списка не должно вызвать трудности. Это элементарно. Никаких регулярок тут не требуется.
0
0 / 0 / 0
Регистрация: 22.08.2019
Сообщений: 5
23.08.2019, 00:26  [ТС]
Вот именно с извлечением у меня и проблемы!
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
23.08.2019, 00:28
Цитата Сообщение от Nevjets Посмотреть сообщение
как отфильтровать сами ссылки по расширению
Как-то так:
Python
1
2
3
4
head, tail = os.path.split(url[0])
_,ext = os.path.splitext(tail)
if ext in ['.php','.html']:
   что-то делаем.
0
0 / 0 / 0
Регистрация: 22.08.2019
Сообщений: 5
23.08.2019, 00:32  [ТС]
Зря спросил.Так и знал что готового решения не кто не предложит.
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
23.08.2019, 00:33
Цитата Сообщение от Nevjets Посмотреть сообщение
Вот именно с извлечением у меня и проблемы!
Читаем документацию модуля json.

Добавлено через 22 секунды
Цитата Сообщение от Nevjets Посмотреть сообщение
знал что готового решения не кто не предложит.
Почему же? В платном разделе всегда пожалуйста.
0
0 / 0 / 0
Регистрация: 22.08.2019
Сообщений: 5
23.08.2019, 00:36  [ТС]
Прикольно.А вы тоже платили деньги когда учились ? Я не пишу какой либо коммерческий софт а учусь! И если бы мне нужен был платный скрипт я бы его заказывал не тут.
0
23.08.2019, 01:28

Не по теме:

Цитата Сообщение от Nevjets Посмотреть сообщение
Я не пишу какой либо коммерческий софт а учусь!
Тогда зачем просить готовое решение? Это, увы, не прикольно, а печально.
Поколение NEXT-программистов совершено разучилось учиться.

Цитата Сообщение от Nevjets Посмотреть сообщение
А вы тоже платили деньги когда учились ?
Программированию? Нет. Мне было достаточно документации и книг. Форумы с готовыми решениями мне были не нужны.

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
23.08.2019, 01:28
Помогаю со студенческими работами здесь

Регулярные выражения в Python
Найти в тексте все даты в формате чч.мм.гг или чч.мм.гггг и заменить на полное название месяца с числом и годом. Пример: 23.02.2012...

Регулярные выражения Python
Не понимаю как сделать следующее. Нужно с помощью регулярных выражений разделить на элементы. Пробовал сделать с использованием re.split -...

Регулярные выражения Python
Доброго времени суток! Можете прокомментировать что выполняют данные строчки кода? from re import split as rs with...

Парсинг JSON - регулярные выражения, Collections или сериализация?
Имеется JSON-строка, имеющая в своем теле несколько типов данных. Конкретно какие, я просматриваю ответ с сервера через Чарли (Charles);...

Регулярные выражения python
Владимир устроился на работу в одно очень важное место. И в первом же документе он ничего не понял, там были сплошные ФГУП НИЦ ГИДГЕО, ФГОУ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
10
Ответ Создать тему
Новые блоги и статьи
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях. Задача: при копировании документа очищать определенные реквизиты и табличную. . .
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели 8ATzM_2aurI
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2. Задача: запретить редактирование документа, если он открыт у другого пользователя. / / . . .
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои. А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20% kYBz3eJf3jQ
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
Использование значений реквизитов справочника в документе, с определенными условиями и правами
Maks 07.04.2026
1. Контроль срока действия договора Алгоритм из решения ниже реализован на примере нетипового документа "ЗаявкаНаРаботу", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru