Форум программистов, компьютерный форум, киберфорум
Наши страницы
Python: Сети
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.75/4: Рейтинг темы: голосов - 4, средняя оценка - 4.75
Minato Udzumaki
0 / 0 / 0
Регистрация: 19.03.2016
Сообщений: 23
1

Фильтрация данных: поиск записей Vk по ключевым словам

17.04.2018, 22:56. Просмотров 825. Ответов 4

Добрый день!
Пишу скрипт поиска записей вк по ключевым словам.Столкнулся с проблемой, если наше ключевое слово представлено в виде словосочетания , то нам выдают записи где имеется не все словосочетания целиком , а где есть его отдельные части . Например: если ключевое слово будет "наш выбор" то нам выдаются записи где есть слово "выбор" и "наш" а не все словосочетания целиком.
Вопрос: можно ли реализовать какой либо фильтр , что бы выдавались только те записи где есть все словосочетание ?
Спасибо
0
QA
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
17.04.2018, 22:56
Ответы с готовыми решениями:

Поиск по ключевым словам и запись данных в файл (python)
Добрый день. Я начинающий кодер на python. Мне требуется помощь. Я пишу бота для Telegram, мне...

Разделить текст на элементы по разделителю и записать их в 2 файла по ключевым словам
Здравствуйте,имеется текст: IOA14,IOC13,IOC12,IOB13,IOA13,IOB12,IOA12,...

Как реализовать поиск по ключевым словам по письмам (именно по содержимому)
Нашел реализацию поиска писем по ключевым словам через библиотеку imap, но эти реализации ищут...

Как вытащить данные соответствующие ключевым словам
Допустим у меня есть документ (xls, pdf, word) , где есть какие-то ненужные данные, и таблица с...

Поиск по всем соцсетям постов по ключевым словам
Всем привет! Есть не хилое задание по веб поиску, хотелось бы услышать варианты умных людей как...

4
Garry Galler
2322 / 1746 / 659
Регистрация: 28.10.2013
Сообщений: 4,449
17.04.2018, 23:49 2
И как именно вы запрашиваете? Если запросить сообщения со стены, то приходят только те посты, где есть все указанные слова.
Python
1
pprint(vk('wall.search', owner_id=-134263192, query='CMS HTML CSS PHP Javacsript')['items'][0]['text'])
Код
('Решение задач любой сложности, '
 'c/c++/vc++/c#/java/basic/vba/python/pascal/delphi, условия обговариваются. \n'
 'Также пишу сайты на CMS, HTML, CSS, PHP, Javacsript.')
Python
1
pprint(vk('wall.search', owner_id=-134263192, query='CMS HTML CSS PHP Javacsript Brainfuck'))
Код
{'count': 0, 'items': []}
0
Minato Udzumaki
0 / 0 / 0
Регистрация: 19.03.2016
Сообщений: 23
18.04.2018, 09:47  [ТС] 3
Добрый день.
Я запрашиваю с помощью Streaming API. Да , мне возвращают данные где есть ключевые слова. Но проблема в том , что если я например в роли ключевого слова ввиду "жизнь в Америке", то мне выдаст записи где есть слова "жизнь","в","Америке ", а мне необходимы только те записи где данное словосочетания представлено целиком.
Спасибо
0
Garry Galler
2322 / 1746 / 659
Регистрация: 28.10.2013
Сообщений: 4,449
18.04.2018, 14:12 4
Цитата Сообщение от Minato Udzumaki Посмотреть сообщение
а мне необходимы только те записи где данное словосочетания представлено целиком.
Фильтруйте полученные сообщения самостоятельно. Обычный VK API не предоставляет такой возможности, поскольку она банальна для программиста. В чем проблема, получив все посты в которых есть слова 1,2,3, найти среди них только те, в которых есть 1 2 3, разделенные пробелом?

Добавлено через 5 минут
P.S. Да, а вот новый Streming API, как я понял, предоставляет расширенные поисковые возможности - и, в частности, поиск по точному вхождению. ТО есть подстрока в кавычках '"жизнь в Америке"' должна искаться целиком.
Однако, вам стоит иногда заглядывать в документацию.
0
Anm90
0 / 0 / 0
Регистрация: 07.06.2019
Сообщений: 1
07.06.2019, 15:14 5
Спасибо!
А можете подсказать, что у меня мб не так? пытаюсь спарсить посты из группы по ключевым словам и вывести в файл, но не пойму, в чем проблема. Заранее спасибо!

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
import csv
 
import requests
 
 
def take_posts():
 
    token = 'cc43febfcc43febfcc43febf6fcc2903e6ccc43cc43febf90bafff932fd3f1f213bddc8'
    version = 5.95
    domain = 'vershkoff_ru'
    count = 100
    offset = 0
    all_posts = []
 
    while offset < 150:
        response = requests.search('https://api.vk.com/method/wall.search',
                                params= {
                                    'access_token': token,
                                    'v': version,
                                    'domain': domain,
                                    'count': count,
                                    'offset': offset,
                                    'query': 'студия акция',
                                })
 
        data = response.json()['response']['items']
        offset += 100
        all_posts.extend(data)
    return all_posts
 
def file_writer(data):
    with open('vk_parsing.csv', 'w') as file:
        a_pen = csv.writer(file, delimiter=';')
        a_pen.writerow(('likes', 'body', 'url'))
        for post in all_posts:
            try:
                if post['attachments'][0]['type']:
                    img_url = post['attachments'][0]['photo']['sizes'][-1]['url']
                else:
                    img_url = 'pass'
 
            except:
                pass
        a_pen.writerow((post['likes']['count'], post['text'], img_url))
all_posts = take_posts()
file_writer(all_posts)
0
07.06.2019, 15:14
Answers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
07.06.2019, 15:14

поиск по ключевым словам в базе данных
Добрый день! Помогите, пожалуйста, разобраться . я пишу поисковик по ключевым словам по базе данных...

Реализовать поиск данных по ключевым словам на компьютере и в интернете
Получится ли написать программу с интерфэйсом?Ну что-то пишешь,а она отвечает ну или по словам...

Поиск по ключевым словам
Я использую функцию if (_tcsstr(pBook-&gt;ptszWord, m_Find)=NULL) bFound = FALSE; ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2019, vBulletin Solutions, Inc.
Рейтинг@Mail.ru