|
|
|
Анализ информации из социальных сетей21.07.2018, 11:33. Показов 16792. Ответов 187
Метки нет (Все метки)
нужно собирать и анализировать информацию из социальных сетей
на python делать? с чего нужно начинать?
1
|
|
| 21.07.2018, 11:33 | |
|
Ответы с готовыми решениями:
187
Как сделать телеграм бота пересылающий посты и новости из RSS лент и социальных сетей (агрегатор) Блокировка социальных сетей Кнопки социальных сетей |
|
|
||||||
| 21.09.2018, 12:26 [ТС] | ||||||
|
* * *
вот, получилось https://github.com/IRIP/postov =) * * * Понял, в чем была ошибка. в main.py name_db = 'bases.name_db' если убрать кавычки, и ссылаться на postov/configs/bases.py то не получается Добавлено через 10 минут * * * Идем дальше, вроде все работает =) Добавлено через 13 минут Вконтакте блокирует, если в сутки, превышаешь 5000 запросов, следовательно, нужно вводить ограничение. Мы так и не определились с объемом единоразового вливания. Например, в одной из групп Количество постов: 1291 Вы хотите сохранить введенные данные? Да(y)/Нет(n): =) как-то с объемом нужно определиться =) Добавлено через 1 час 4 минуты Изменил добавил немного pass функций, залил на git
* * * Есть еще одна ошибка Не удалось создать таблицу vkdata - поскольку она уже есть, и данные в ней есть и Traceback (most recent call last): File "/home/irip/pycharm/getpost/main.py", line 72, in <module> posts[i]['text']) for i in range(len(posts) File "/home/irip/pycharm/getpost/main.py", line 72, in <listcomp> posts[i]['text']) for i in range(len(posts) KeyError: 'source_id' но это связано с тем, что я начинаю добавлять новые поля (получится ли?)
0
|
||||||
|
1741 / 913 / 480
Регистрация: 05.12.2013
Сообщений: 3,074
|
|||||||
| 21.09.2018, 13:13 | |||||||
0
|
|||||||
|
|
|
| 21.09.2018, 13:18 [ТС] | |
|
ТабуретY, спасибо. Попробую.
Дальше, для vk нужно создать определенный набор полей в таблице (который будет включать, в том числе, id группы) https://github.com/IRIP/postov... vk_core.py здесь я начал это делать, правильно ли? и как вообще это реализуется? Стараюсь понять
0
|
|
|
1741 / 913 / 480
Регистрация: 05.12.2013
Сообщений: 3,074
|
||||||||||||
| 21.09.2018, 13:53 | ||||||||||||
и в файле maim.py, строки 67-70 можно сделать так
0
|
||||||||||||
|
|
|
| 22.09.2018, 00:07 | |
|
1
|
|
|
1741 / 913 / 480
Регистрация: 05.12.2013
Сообщений: 3,074
|
||||||
| 22.09.2018, 09:26 | ||||||
|
Итоговый вариант
0
|
||||||
|
|
|||||||||||
| 24.09.2018, 11:26 [ТС] | |||||||||||
|
ТабуретY,
вот в этом кусочке код sql взят в ''' ''' - он закомментирован?
и еще, есть какие-нибудь стандартные наборы, которые собираются с поста? текст, дата, автор, видео, фото, файл, опрос и т.п. я здесь, вроде расписал все, но может быть это уже не нужно так расписыватЬ? Может это встроено в готовые модули? https://github.com/IRIP/postov... vk_core.py Добавлено через 20 минут Вот этого набора, хватит? Или что-то забыл?
0
|
|||||||||||
|
1741 / 913 / 480
Регистрация: 05.12.2013
Сообщений: 3,074
|
|
| 24.09.2018, 14:00 | |
|
1
|
|
|
|
|
| 24.09.2018, 18:37 [ТС] | |
|
ТабуретY, да, спасибо!
действительно, интересно. 2500 постов обработал за считанные минуты, нашел нужную информацию но есть проблемы... Первое, и самое важное, не берет фото, видео, аудио, ссылки, музыку, опросы, файлы с поста. В базу попадают чистые тексты Добавлено через 16 минут Второе, замечено, что в базу влетают сразу по 4-5 одинаковых (имеющих одинаковый id) постов
0
|
|
|
1741 / 913 / 480
Регистрация: 05.12.2013
Сообщений: 3,074
|
|||
| 24.09.2018, 20:33 | |||
|
0
|
|||
|
|
||
| 24.09.2018, 21:04 [ТС] | ||
|
ТабуретY, в приведенных примерах нет вариантов решения задачи
я все-таки склоняюсь к тому, что полученный пост, не нужно сразу записывать в базу. Его нужно сначала обрабатывать. мне удалось получить доступ к отдельной странице теперь с нее нужно собирать данные и сохранять в отдельную папку как брать группа_post я понял, и как зайти и проанализировать страницу, тоже представление есть. Осталось, технически это реализовать. Добавлено через 2 минуты и запоминать, и исключать дубли (в будущем, но, до этого дойдем позже
0
|
||
|
|
||||||||||||
| 24.09.2018, 21:17 | ||||||||||||
1
|
||||||||||||
|
|
||||||
| 24.09.2018, 22:39 [ТС] | ||||||
|
Garry Galler, вот так получилось записать в базу один раз
Traceback (most recent call last): File "/home/irip/pycharm/getpost/main.py", line 79, in <module> bases.save(data) File "/home/irip/pycharm/getpost/bases/sqlite_core.py", line 22, in save self.c.executemany("INSERT INTO vkdata VALUES (?,?,?)", data) sqlite3.IntegrityError: UNIQUE constraint failed: vkdata.id
0
|
||||||
|
|
||
| 24.09.2018, 22:50 | ||
|
Вы должны использовать либо суррогатный ключ объявленный как PRIMARY_KEY AUTOINCREMENT (который база будет создавать и инкрементировать сама - вы даже не должны думать о нем и пытаться вставить), либо не вставлять дубликаты для своего уникального ключа. Третьего не дано.
0
|
||
|
|
|
| 24.09.2018, 22:58 [ТС] | |
|
Garry Galler, вся соль в том, что мне как раз нужен этот ключ уникальным, поскольку он и не ключ вовсе
а по сути post-id который для каждого уникального источника - должен быть уникальным =) блин... Добавлено через 1 минуту запушил https://github.com/IRIP/postov
0
|
|
|
|
||||||||||||
| 25.09.2018, 00:11 | ||||||||||||
В MySQL такая же конструкция, только без OR. P.S. В MySQL есть еще директива ON DUPLICATE KEY UPDATE, которая позволяет либо делать вставку, либо обновление, если ключ уже есть. Добавлено через 22 минуты Update. В SQLite похожим образом (вставить, либо заменить) должна работать такая конструкция:
0
|
||||||||||||
|
|
|||||||||||||||||
| 25.09.2018, 00:15 [ТС] | |||||||||||||||||
|
* * *
По идее, я понимаю, примерно, как работает эта программа Она берет "объем" данных и ...
но в коде я не вижу нигде больше этот items где он хранится (В памяти?) почему мы сразу сохраняем
и где, самое важное, нужно смотреть, чтобы внести изменения - не сохранять, если таблица (и данные) уже есть... Добавлено через 1 минуту * * *
0
|
|||||||||||||||||
|
|
|||||||||||||
| 25.09.2018, 00:23 | |||||||||||||
|
Вы попробуйте попользоваться API в чистом виде, чтобы понять что сайт вообще возвращает. Пример не совсем стандартного VK API, но сути не меняет.
Добавлено через 15 секунд
1
|
|||||||||||||
|
|
|||||||||||||||||
| 25.09.2018, 01:00 [ТС] | |||||||||||||||||
|
в нашем случае, https://github.com/IRIP/postov/blob/master/main.py тут мы сначала
сразу их сохраняем, без проверки
Здесь, похоже нужно пробегаться по posts и обрабатывать дополнительно как-то "список" на предмет, если в базе есть то ... или я ошибаюсь? Добавлено через 12 минут Вот, я понял, что если я хочу увидеть список posts то должен print сделать
0
|
|||||||||||||||||
|
|
|||
| 25.09.2018, 01:05 | |||
|
Сам словарь, естественно, находится в ОЗУ. Где ж ему еще быть? ТабуретY показал вам примеры, которые само собой, не являются чем-то готовым к реальному использованию. Нарастить их "мясом" - задача разработчика. Реальный код будет в много раз сложнее и объёмнее.
1
|
|||
| 25.09.2018, 01:05 | |
|
Помогаю со студенческими работами здесь
100
Виджеты социальных сетей Кнопки социальных сетей Иконки социальных сетей Шаринг социальных сетей Плагин социальных сетей Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Символьное дифференцирование
igorrr37 13.02.2026
/ *
Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2).
Унарный минус обозначается как !
*/
#include <iostream>
#include <stack>
#include <cctype>. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога
Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
|
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
|