Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.86/7: Рейтинг темы: голосов - 7, средняя оценка - 4.86
0 / 0 / 0
Регистрация: 20.10.2013
Сообщений: 3

Хеширование строк большого файла

28.03.2014, 21:24. Показов 1417. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте! Помогите, пожалуйста разобраться с процессом хеширования. Задача состоит в том, что мне дан текстовый файл примерно в 100Мб (в общем, большой). Мне нужно создать файл, который будет содержать значения хеш-функции (в задании надо использовать CRC16, но с ней я разобрался) для каждого слова в этом файле. Как я понимаю, я должен считывать слово из исходного файла, пропускать его через хеш-функцию и получать хеш-код, который как-то должен отображать положение этого слова в исходном файле. Второй файл, который хранит значения хеш-функций, будет представлять собой огромную таблицу, но проблема в том, что я не понимаю, как с ним работать? Что я должен в него записать? Код, который получен из хеш-функции?
И еще, я видел примеры со структурами, где есть два поля: код и значение, для чего они нужны?
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
28.03.2014, 21:24
Ответы с готовыми решениями:

Удаление одинаковых строк из большого файла
Здравствуйте. Подскажите, пожалуйста, как максимально быстро удалить одинаковые строки в большом файле 1кк+ строк. В голову приходит...

Получить количество строк большого файла
Всем привет! Мужики, может есть у кого-то опыт, помогите обмозговать. Собственно есть файл. Размер файла ~ 150 GB. Можно ли из...

Как узнать сколько строк у большого файла ???
Как узнать сколько строк у большого файла ???

1
90 / 90 / 48
Регистрация: 07.12.2011
Сообщений: 215
29.03.2014, 00:45
Цитата Сообщение от Kasard Посмотреть сообщение
И еще, я видел примеры со структурами, где есть два поля: код и значение, для чего они нужны?
Вы имеете ввиду контейнер типа map<key_type, value_type>?

Цитата Сообщение от Kasard Посмотреть сообщение
хеш-код, который как-то должен отображать положение этого слова в исходном файле
Как-то это как?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
29.03.2014, 00:45
Помогаю со студенческими работами здесь

Ускорить считывание большого количества строк (~2500000) из файла
в общем есть файл, в нем около 2500000 строк (в каждой строке есть всего 2 объекта), я пытаюсь сделать список смежности по нему, делаю так ...

Хеширование строк
За один прогон в программе может использоваться до 50-ти string; Подскажите, пожалуйста, несложный (короткий) метод хеширования в byte с...

Хеширование строк
Ребят, помогите! Нужна функция хеширования по Пирсону. И если можно то с комментариями. И какой ее принцип работы?

Алгоритм и структура для поиска большого количества строк в другом массиве строк
Здравствуйте! Я решаю следующую задачу: Есть файл со &quot;строками&quot; (средняя длина которых 40-50 символов) и таких строк порядка 100000....

Вставка большого количества строк
Никак не могу придумать, как наиболее элегантно сделать то, что мне нужно. Есть двумерный массив $m, причём количество строк в нём...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем. . . .
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
SDL3 для Web (WebAssembly): Сборка библиотек: SDL3, Box2D, FreeType, SDL3_ttf, SDL3_mixer и SDL3_image из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual Studio. . . .
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru