Форум программистов, компьютерный форум CyberForum.ru

Статистика вхождения слов в массиве файлов (~50Gb) - C++

Восстановить пароль Регистрация
Другие темы раздела
C++ Enum и типы данных. Как задать тип значений явно, и какой тип будет при переполнении? http://www.cyberforum.ru/cpp-beginners/thread157861.html
Пытаюсь сделать функцию с передачей нескольких параметров,используя битовые операции. В качестве параметров думаю использовать не стандартные define-ы,а перечисление enum. Можно ли задать тип значений для членов enum явно(мне в конкретном случае нужен unsigned int)? Что будет при битовой операции,если значение результата выходит за пределы типа (даже не уверен,возможно ли,но вроде бы да)?
C++ ООП реализованная через паттерны проектирования Друзья мои дорогие, очень прошу , если у кого есть готовые приложения на языке С++ где можно увидеть реализацию паттернов проктирования , не могли бы скинуть для проссмотра или хотя бы код с коммментариями , пожалуйста. спс за внимание http://www.cyberforum.ru/cpp-beginners/thread157829.html
Считывние вектора структур из файла .txt C++
Всем доброго времени суток. При выполнении задания, у меня возникла такая проблема: Имеется класс, одно из полей - вектор стуктур. Также дан текстовой файл, в каждой строке которого должен быть записа объект данного класса, т.е тип строчки в файле имеет вид: char ... char... char .... vector<char ... int> (количество элементов вектора неизвестно (каждый раз разное)). Проблема в том, что...
компилятор ругается на структуру C++
попалась вот такая вот структура для графа, но компилятору она не нравится.... template <class V, class E> struct graph { struct v_info; struct e_info; struct v_info {
C++ Непонятная ошибка сегментации http://www.cyberforum.ru/cpp-beginners/thread157793.html
В программе используется дерево, элементы которого описываются и создаются таким образом: struct Node { Node* children; int num; vector <pair <string, unsigned int> > words; }; Node* create_node()
C++ Возврат указателя на массив из функции Здравствуйте. Пытаюсь вернуть указатель на массив из функции. #include <iostream> using namespace std; int* ReturnArray() { подробнее

Показать сообщение отдельно
pixx
0 / 0 / 0
Регистрация: 05.05.2010
Сообщений: 6
07.08.2010, 21:12  [ТС]     Статистика вхождения слов в массиве файлов (~50Gb)
Цитата Сообщение от odip Посмотреть сообщение
То есть ты думаешь если библиотека не упала в segfault, то она и считает правильно ?
Я бы не полагался на кривой код.
А альтернатив нет. Синтаксический парсер русского языка на дороге не валяется. А разбираться в его кишках никакого желания и сил нет.

И библиотека как раз таки вылетает на segfault в зависимости от набора входных данных. Благо что бывает это довольно редко. На моем самопальном решении задачи из сабжа количество segfault ~2%, что лично меня устраивает.
Но т.к. segfalut возникает внезапно, то хочется как-то застраховаться - чтобы приложение не валилось все целиком из-за одного файла а продолжало обработку. Оставил комп на несколько суток работать - и ушел, не думаю о том что там где-то сегфолт вылетит на одном файле. Для сбора статистики этого подхода более чем достаточно

Добавлено через 7 минут
Вообще, решение данной задачи подходит под два паттерна: MapReduce и Fork/Join - но то ли я гуглить не умею, то ли доступных решений для С++ не нашел. Да, надо сказать что MapReduce фреймворки в основном рассчитаны на кластер машин, а не на одну.
 
Текущее время: 04:49. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2016, vBulletin Solutions, Inc.
Рейтинг@Mail.ru