С Новым годом! Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.81/21: Рейтинг темы: голосов - 21, средняя оценка - 4.81
0 / 0 / 0
Регистрация: 07.12.2019
Сообщений: 22

Перевод файла из формата txt в формат json

07.12.2019, 19:35. Показов 4352. Ответов 1
Метки json, txt (Все метки)

Студворк — интернет-сервис помощи студентам
Есть файлы такого типа разделённые звездочками
***
Новости Украины 5:40 AM - 13 Sep 2018
User: 24todaynetua. Европарламент поддержал отмену визового режима для Косово http://24today.net/open/781606 pic.twitter.com/dKUbhPpVOc
Twitter 2019.02.05 22:11
http://twitter.com/24todaynetu... 9230816256
***
Новости Украины 5:40 AM - 13 Sep 2018
User: 24todaynetua. Практически все руководство Киевского СИЗО уволено - Минюст http://24today.net/open/781605
Twitter 2019.02.05 22:11
http://twitter.com/24todaynetu... 9059616768
***
Новости Украины 5:35 AM - 13 Sep 2018
User: 24todaynetua. Представители НАТО и Украины обсудили варианты сотрудничества http://24today.net/open/781604 pic.twitter.com/Z9HpifYFgz
Twitter 2019.02.05 22:11
http://twitter.com/24todaynetu... 8179764224
***
Новости Украины 5:30 AM - 13 Sep 2018
User: 24todaynetua. Рабинович: Медведчук активизировал процесс освобождения пленных после вхождения в "За ж http://24today.net/open/781603
Twitter 2019.02.05 22:11
http://twitter.com/24todaynetu... 3319496704

Задача стоит в том чтоб записать всё это в формат json. Плюс нужно записать с каждого файла заголовок (первая строка), user, данные из файла (после точки от инфы про user), соц сеть из которой эти данные, ну и ссылка на источник. После *** всё по новой и т.д.

Помогите написать код на Python, буду очень благодарен
Не могу указать что б правильно выводило соц сеть, дату и время. Проблема ещё в том что не работает со всеми файлами, к некоторым выводит эту ошибку (File "/home/alexander/PycharmProjects/untitled3/ddl.py", line 12, in <module> 'link': 'http' + s.split('http')[1].split(' ')[0] IndexError: list index out of range)
import json

Вот что есть:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
data = {}
data['news'] = []
with open('201902052211.txt', 'r', encoding='utf-8') as f:
    for s in f:
        if 'User:' in s:
            data['news'].append({
                'title': s.split('.')[1].split('http')[0].strip(),
                'user': s.split('.')[0][6:],
                'social_network': s.split('.')[2],
                'link': 'http' + s.split('http')[1].split(' ')[0]
            })
 
print(data)
 
with open('json_news.txt', 'w', encoding='utf-8') as outfile:
    json.dump(data, outfile)
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
07.12.2019, 19:35
Ответы с готовыми решениями:

Чтение из txt файла JSON формат
Собственно есть файлик test.txt: { &quot;response&quot;: { &quot;players&quot;: } } Подскжаите пожалуйста, как мне прочитать это из...

Перевод файла формата txt в xml
Честно сразу скажу, что ни разу с xml до этого не сталкивалась. И во сейчас для загрузки в программу Документы ПУ 5 необходимо все...

Создать текстовой формат обмена данных JSON используя данных из текстового файла info.txt
Создать текстовой формат обмена данных JSON с помощью данных из текстового файла info.txt. info={&quot;Иванов И.А.&quot;:, ...

1
Просто Лис
Эксперт Python
 Аватар для Рыжий Лис
5972 / 3734 / 1099
Регистрация: 17.05.2012
Сообщений: 10,791
Записей в блоге: 9
25.01.2020, 08:24
Так файл нужно по разделителю разбивать:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
t = '''\
***
Новости Украины 5:40 AM - 13 Sep 2018
User: 24todaynetua. Европарламент поддержал отмену визового режима для Косово http://24today.net/open/781606 pic.twitter.com/dKUbhPpVOc
Twitter 2019.02.05 22:11
http://twitter.com/24todaynetua/status/1040218639230816256
***
Новости Украины 5:40 AM - 13 Sep 2018
User: 24todaynetua. Практически все руководство Киевского СИЗО уволено - Минюст http://24today.net/open/781605
Twitter 2019.02.05 22:11
http://twitter.com/24todaynetua/status/1040218629059616768
***
Новости Украины 5:35 AM - 13 Sep 2018
User: 24todaynetua. Представители НАТО и Украины обсудили варианты сотрудничества http://24today.net/open/781604 pic.twitter.com/Z9HpifYFgz
Twitter 2019.02.05 22:11
http://twitter.com/24todaynetua/status/1040217378179764224
***
Новости Украины 5:30 AM - 13 Sep 2018
User: 24todaynetua. Рабинович: Медведчук активизировал процесс освобождения пленных после вхождения в "За ж http://24today.net/open/781603
Twitter 2019.02.05 22:11
http://twitter.com/24todaynetua/status/1040216123319496704'''
 
for item in t.split('***'):
    if not item:
        continue
    l1, l2, l3, l4 = [i for i in item.split('\n') if i]
    print([l1, l2, l3, l4])
Добавлено через 3 минуты
Хотя правильнее читать по 5 строк за раз.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
25.01.2020, 08:24
Помогаю со студенческими работами здесь

Перевод формата времени из am/pm в 24 формат
ФОРМАТ ВВОДА: Целое число A — который сейчас час после полудня у героев диалога, A &gt;= 1, A &lt; 12 Целое число B — сколько сейчас...

Перевод из 24-часового формата в 12-часовой формат времени
Многие предпочитают 24-часовой формат времени, но много где в мире вы столкнетесь с тем, что люди используют 12-часовой формат времени. ...

Перевод числа из упакованного BCD-формата в ASCII-формат
Есть программа, которая считает разницу 873451-548197 используя ASCII формат, потом результат переводиться в упакованный BCD-формат. ...

Перевод в JSON формат
Имеем объект? public class genprov { public string name { get; set; } public string adress1 {...

Ошибка в компиляции файла из формата .java в формат .class
Здравствуйте формучане. Сразу скажу, здесь я новичек, в программировании так себе, можно сказать на Вы. А теперь к теме. Столкнулся с...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути
Programma_Boinc 01.01.2026
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути Сочетание глобально распределённой вычислительной мощности и инновационных. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru