Форум программистов, компьютерный форум, киберфорум
C# для начинающих
Войти
Регистрация
Восстановить пароль
Другие темы раздела
C# Создать класс для работы с регулярными выражениями https://www.cyberforum.ru/csharp-beginners/thread1201744.html
Создать класс для работы с регулярными выражениями. разработать следущие элементы класса: а) Поля: Regex r; string text b) методы позволяющие: -определить содержит ли тест...
C# Крестики – нолики
Задача игры с участием двух игроков, например, крестики – нолики. Назовем игрока, проставляющего на игровой доске крестики, игроком x, а игрока, проставляющего на игровой доске нолики - игроком 0....
Дана последовательность. Заменить все максимальные элементы нулями C#
Помогите пожалуйсчта!!! Дана последовательность из n действительных чисел. Замечание. Задачи из данного пункта решить, используя одномерный массив ЗАДАНИЕ----Заменить все максимальные...
C# Генерировать случайную букву A-Z Ну вот с цифрами я разобрался это будет Random.Next(1,9), а как делать это с буквами не написано нигде. Пример: нужно генерировать случайную букву A-Z https://www.cyberforum.ru/csharp-beginners/thread1201664.html
C# Ввести с клавиатуры массив произвольного размера состоящий из латинских букв методом ООП https://www.cyberforum.ru/csharp-beginners/thread1201607.html
Ввести с клавиатуры массив произвольного размера состоящий из латинских букв отсортировать:а)в алфавитном порядке по всему массиву;б)в алфавитном порядке по строкам using System; using...
Матрица из алгебраических дополнений C#
Пишу алгоритм по разложению массива матричным способом не могу реализовать матрицу алгебраических дополнений.
Вывести числа побочной диагонали матрицы C#
написать процедуру: Вывести числа побочной диагонали из матрицы.матрица заполняется любыми числами.
C# Вывести из матрицы числа побочной диагонали написать процедуру в С#: вывести из матрицы числа побочной диагонали.матрица должна заполняться произвольными числами. https://www.cyberforum.ru/csharp-beginners/thread1201554.html
C# Socket: как связать клиент и сервер https://www.cyberforum.ru/csharp-beginners/thread1201541.html
Сегодня разбирался в Socket сервер нашел пример объяснения работы с ним, это не много поточный, и пример клиента нашел, теперь не могу их связать. Запускается сервер, а потом клиент и через несколько...
C# Сделать диаграмму классов у меня версия неполная, а экспресс, майкрософт визуал студио с# 2010 :( https://www.cyberforum.ru/csharp-beginners/thread1201498.html
gazlan
3167 / 1926 / 312
Регистрация: 27.08.2010
Сообщений: 5,131
Записей в блоге: 1
07.06.2014, 17:14 0
.NET 4.x

Сравнение 2 текстовых файлов на уникальность текста

07.06.2014, 17:14. Просмотров 1607. Ответов 2
Метки (Все метки)

Ответ

w-shingling
Syntactic Clustering of the Web
Near-duplicates and shingling
Fetterly et al. A Large-Scale Study of the Evolution of Web Pages, www 2003

(Изрядно перевранный) вариант в рунете введен в обращение статьей Зеленкова и Сегаловича "Сравнительный анализ методов определения нечетких дубликатов для Web-документов".

В картинках: Алгоритм шинглов

Поиск нечетких дубликатов. Алгоритм шинглов для веб-документов
Python: Алгоритм Шинглов — поиск нечетких дубликатов текста


Перевести код алгоритма шинглов из PHP в DELPHI

Вернуться к обсуждению:
Сравнение 2 текстовых файлов на уникальность текста
0
QA
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
07.06.2014, 17:14
Готовые ответы и решения:

Сравнение двух текстовых файлов
Добрый вечер! Задачка такая стоит: Сравнить два текстовых файла. Определить одинаковые ли они? То...

Сравнение двух текстовых файлов
Помогите пожалуйста с прогой) В С# уровень Hello World =( В С# выполнить сравнение двух текстовых...

Сравнение текстовых файлов.
Добрый день! Такое вот задание. Даны 2 текстовых файла. Проверить, все ли строки из 1-го...

Сравнение 2 текстовых файлов
Доброго времени суток, я уже создавал здесь тему и мне помогли добрые люди, ещё раз повторюсь я...

2
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2020, vBulletin Solutions, Inc.