Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/5: Рейтинг темы: голосов - 5, средняя оценка - 5.00
0 / 0 / 1
Регистрация: 06.04.2016
Сообщений: 17

Программа поиска дубликатов новостей на rss-каналах алгоритмом шинглов

24.04.2018, 20:39. Показов 1117. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Нужно создать программу, которая ищет дубликаты новостей. Новости получают с RSS-каналов, url которых задаются в xml файле. Использовать алгоритм шинглов, найти схожие новости и расчитать процент дубликатов. Результат записать в xml файл. Реализовать это все на Python.

Очень прошу помощи, так так не могу понять как все это реализовать, буду рада хоть каким-то советам, подказкам либо другой помощи!
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
24.04.2018, 20:39
Ответы с готовыми решениями:

Алгоритм шинглов (поиск нечетких дубликатов) на Delphi
ребят! может у кого есть данный алгоритм на языке делфи или паскаль? Именно для поиска нечетких дубликатов в тексте. Рассматриваю проблему...

Количество новостей rss ленты и подключения несколько rss лент
Здравствуйте, возник такой вопрос, у меня есть rss-лента, одна она работает <?php $rss = simplexml_load_file (...

[Ищу] Программа для поиска дубликатов музыки
Работаю трекаплоадером на радио, все треки с радио качаю на жесткий, чтобы не было повторов решил найти программу для поиска дубликатов....

1
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
24.04.2018, 23:22
Цитата Сообщение от SlyMarii Посмотреть сообщение
буду рада хоть каким-то советам
Совет №1: просто погуглите перед тем как создать тему.
http://www.codeisart.ru/blog/p... algorithm/
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
24.04.2018, 23:22
Помогаю со студенческими работами здесь

Алгоритм шинглов - сравнить тексты по методу шинглов
Нужно сравнить тексты по методу шинглов. Теория по этому методу тут: http://www.codeisart.ru/python-shingles-algorithm/ Мне пока...

RSS ленты новостей
Никогда не пользовался RSS лентами новостей и даже толком не знаю, что это такое. По моему пониманию, это передача аннотаций или...

RSS, и количество новостей
Здравствуйте, уже писал по-этому поводу, мне вот дали код для указание количества выводимых новостей, скажите, где мне его прописать и как,...

Вывод rss новостей
Как сделать так, чтобы шапка отображалась на сайте? <link>http://windtravel.ru</link> <description>Главные...

установка RSS новостей на сайт
У кого есть опыт установки RSS новостей? Поделитесь опытом, как это делается, с чего начинать? Спасибо!


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
SDL3 для Web (WebAssembly): Сборка библиотек: SDL3, Box2D, FreeType, SDL3_ttf, SDL3_mixer и SDL3_image из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual Studio. . . .
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru