Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.82/11: Рейтинг темы: голосов - 11, средняя оценка - 4.82
0 / 0 / 0
Регистрация: 22.09.2015
Сообщений: 11

Программа для поиска соответствие строк, учитывая регистр, в текстовом файле с 10000+ строк

22.09.2015, 20:59. Показов 2151. Ответов 7
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Уважаемые форумчане, прошу у вас помощи я неделю в поисках. Мне нужна программа или код для поиска слов, очень похожую на расширение Pearls Extension от Chroma. Pearls отваливается и не делает поиск (((( Вот пример: Есть у меня фаил тхт в нём 10000+ строк и много много файлов тхт с миллионами строк, мне надобно как то эти 10000+ сравнивать с теми миллионами на нахождение соответствие строк, учитывая регистр. Посоветуйте пожалуйста как это делать и какими способами. первое сообщение на форуме.

Добавлено через 2 часа 33 минуты
Вот я понял что это сложно(((( 1 Файл 10000 строк, для проверки 10 файлов по 17gb с миллиардами строк на схожесть. У меня через CTRL+F года уйдут. Чем это можно делать Python? Java? C++? Я б уже Pearls Extension разобрал бы если я понимал как, Днище я Люди прошу помогите!
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
22.09.2015, 20:59
Ответы с готовыми решениями:

Алгоритм поиска строк в текстовом файле
Доброго времени суток! Есть текстовый файл размером ~65 Мб, ~605000 строк. Из этих строк необходимо выделить строки, котрые содержат...

Создайте функцию strcmp – сравнение двух строк, учитывая регистр символов
Всем привет :) Объясните , пожалуйста, почему не работает программа (работает неправильно ). Несмотря на то , что строки одинаковые ,...

Программа для поиска плагиата в текстовом файле (MsWord)
Требуется написать программу для поиска плагиата. Пример: Есть мой реферат в формате ".docx" и есть еще 3-4 рефераты другие....

7
130 / 25 / 12
Регистрация: 12.08.2015
Сообщений: 221
22.09.2015, 21:33
Вы решили написать программу по поиску в Поквантово-временном Архиве Всея Вселенной с момента сотворения?
Естественно, самый быстрый код - это код, написанный на низком уровне абстракции,который "ближе к железу".
Такой "Экшклюзив" придется писать самому, от начала и до конца, придумывая старые велосипеды и расширяя их возможности.
Вот в общем-то и все, что можно ответить. И будут у тебя не годы поиска, а всего-то недели. Может быть, дни. шутка-ли, 170GB прочесать на наличие 10000 строк N-ной длины...
Вряд ли тебе кто здесь посоветует готовое решение на такие Вселенские Объемы Текстовой Информации.
0
0 / 0 / 0
Регистрация: 22.09.2015
Сообщений: 11
22.09.2015, 21:47  [ТС]
Да сложная ситуация вот Pearls Extension обычное приложение для Chroma за 20мин мне 1.2gb проверил и потом перестал/// В чём причина не пойму, знаю что написан он на С++ а сканирование делал 50мб за 15-20секунд.
0
130 / 25 / 12
Регистрация: 12.08.2015
Сообщений: 221
22.09.2015, 22:01
К слову, 170GB - это 182 536 110 080 байтов. Как известно, 1 байт == одному символу;
Авторский лист - это 40 000 символов (с пробелами и знаками препинания).
Следовательно, 170GB == 4 563 402.752 Авторских листа.
Средний объем книги составляет около 13 А.Л. (авторских листа)
Следовательно, 170GB текста это 351 031 книг.
Всего в мире существует разных, уникальных книг, статей, журналов, брошюр, научных трудов, патентов и пр. около 129 864 880 экземпляров. Мы отбросим за ненадобностью различную мукулатуру с низким содержанием авторских листов (ежемесячные модные и рекламные журналы, газеты, телепрограммы и пр.) и получим количество книг, имеющих какую-либо ценную информацию. Всего таких названий останется 12% от 129 864 880, или 15 583 786 книг.

351 031 книг из 15 583 786 это 1\44 часть всего, что человечество написало за ВСЮ мировую историю книгописания и книгопечатания(начиная от 3350 до н.э.), во ВСЕХ странах мира, которые были или есть и посейчас.

Автор, где Вы нашли, откопали СТОЛЬКО информации? Может, стоит сделать что попроще?
0
Фрилансер
735 / 352 / 96
Регистрация: 05.05.2014
Сообщений: 2,621
22.09.2015, 22:03
GoVanza, Нужно отталкиваться не от языка а от СУБД в данной задаче.
0
130 / 25 / 12
Регистрация: 12.08.2015
Сообщений: 221
22.09.2015, 22:07
Цитата Сообщение от pro_100_gram Посмотреть сообщение
Нужно отталкиваться не от языка а от СУБД в данной задаче.
Автор хочет все решить я так понял, средствами C++. Это имеет принципиальное для автора значение, как видимо, и объем его информации.
Может, всё-таки спросить у автора о желании переместить тему в другой форум и раздел?
0
Фрилансер
735 / 352 / 96
Регистрация: 05.05.2014
Сообщений: 2,621
22.09.2015, 22:09
gledor, Средства С++ позволяют работать с СУБД. С++ вообще со всем позволяет работать
0
0 / 0 / 0
Регистрация: 22.09.2015
Сообщений: 11
22.09.2015, 23:20  [ТС]
У меня есть все части файлов от Pearls Extension, там их 5 скриптов но я не умею собрать ее на С++ да и мало того хотел под Notepad++ ее бы делать как плагин. Думаю требуется с автором программы связаться. Спасибо всем!
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
22.09.2015, 23:20
Помогаю со студенческими работами здесь

Нужно дополнить код, чтобы программа считывала несколько строк в текстовом файле
#include <stdio.h> #include <conio.h> #include <stdlib.h> #include <locale.h> int main() { setlocale(LC_CTYPE,...

Как Excel документ, в котором 10000 строк, разбить по 10 строк и сохранить каждые 10 строк в отдельный файл
Здравствуйте. Подскажите как Excel документ в котором 10000 строк разбить по 10 строк и сохранить каждые 10 строк в отдельный файл. Нашел...

Найти в текстовом файле все группы из одинаковых идущих подряд пустых строк или строк, содержащих только пробелы
Взываю к помощи Помогите решить задачу: Найти во входном файле все группы из одинаковых идущих подряд пустых строк или строк,...

Использовать цикл для обхода и добавления строк в текстовом файле
Доброго времени суток! Плохо "дружу" с циклами, подскажите как реализовать такую вещь: Есть текстовый файл такого содержания: ...

Подсчитать количество пустых строк в текстовом файле. Сформировать новый файл, в котором пустых строк нет
Задано произвольный текстовый файл. Подсчитать количество пустых строк в этом файле. Сформировать новый файл, в котором пустые строки...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru