Форум программистов, компьютерный форум, киберфорум
C (Си)
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/8: Рейтинг темы: голосов - 8, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 30.03.2024
Сообщений: 17

Внешняя сортировка прямым слиянием: ошибка "Text file busy"

21.10.2024, 20:02. Показов 4557. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Стоит задача реализации программы на языке С сортировки заданного файла в предположении, что файл нельзя считывать в память целиком.
В бинарном файле записаны целые числа типа long, под каждое число отводится 64 бита. Выходной файл должен содержать те же самые данные, но в отсортированном порядке.
Программа должна поддерживать следующие ключи:
-d up/down - направление сортировки по возрастанию/убыванию;
-i filename - имя входного файла;
-l size - размер лимита памяти в мегабайтах;
-һ - печать короткой информации о программе со списком возможных ключей.
Порядок следования ключей произвольный.
Пример командной строки для запуска программы:
./extSort -1 10 -d up -i in.bin
Если какой-то из ключей командной строки не задан, требуется дать пользователю информацию о корректном способе запуска программы.
Также нужно оснастить программу вспомогательными функциями печати бинарного файла в текстовом виде и генератора бинарного файла, содержащего случайные числа.
Поставленной задаче отвечают алгоритмы внешней сортировки простым(прямым) слиянием.
C
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include <string.h>
// Функция для обмена элементов
void swap(long *a, long *b) {
    long temp = *a;
    *a = *b;
    *b = temp;
}
// Функция для быстрой сортировки
void qs(long *arr, int left, int right, int ascending) {
    if (left >= right) return;
    int i = left, j = right;
    long pivot = arr[left + (right - left) / 2];
    while (i <= j) {
        if (ascending) {
            while (arr[i] < pivot) i++;
            while (arr[j] > pivot) j--;
        } else {
            while (arr[i] > pivot) i++;
            while (arr[j] < pivot) j--;
        }
        if (i <= j) {
            swap(&arr[i], &arr[j]);
            i++;
            j--;
        }
    }
    if (left < j) qs(arr, left, j, ascending);
    if (i < right) qs(arr, i, right, ascending);
}
// Функция для вывода справки
void print_help() {
    printf("Использование: external_sort -i input_file [-l memory_limit_MB] [-d (up|down)]\n");
    printf("Параметры:\n");
    printf("\t-i input_file\t\tИмя входного файла (обязательно)\n");
    printf("\t-d (up|down)\t\tНаправление сортировки (по умолчанию up)\n");
    printf("\t-l memory_limit_MB\tЛимит памяти в мегабайтах\n");
    printf("\t-h\t\t\tПечать этой справки\n");
}
// Функция для парсинга аргументов командной строки
int parse_arguments(int argc, char *argv[], char **input_filename, int *ascending, size_t *memory_limit) {
    for (int i = 1; i < argc; ++i) {
        if (strcmp(argv[i], "-i") == 0) {
            if (i + 1 < argc) {
                *input_filename = argv[++i];
            } else {
                fprintf(stderr, "Ошибка: Не указано имя входного файла.\n");
                print_help();
                return 0;
            }
        } else if (strcmp(argv[i], "-d") == 0) {
            if (i + 1 < argc) {
                if (strcmp(argv[i + 1], "up") == 0) {
                    *ascending = 1;
                } else if (strcmp(argv[i + 1], "down") == 0) {
                    *ascending = 0;
                } else {
                    fprintf(stderr, "Ошибка: Некорректное значение направления сортировки.\n");
                    print_help();
 
                    return 0;
                }
                i++;
            } else {
                fprintf(stderr, "Ошибка: Не указано значение направления сортировки.\n");
                print_help();
                return 0;
            }
        } else if (strcmp(argv[i], "-l") == 0) {
            if (i + 1 < argc) {
                char *endptr;
                long val = strtol(argv[++i], &endptr, 10);
                if (*endptr == '\0' && val > 0) {
                    *memory_limit = val * 1024 * 1024; // Перевод мегабайт в байты
                } else {
                    fprintf(stderr, "Ошибка: Некорректное значение лимита памяти.\n");
                    print_help();
 
                    return 0;
                }
            } else {
                fprintf(stderr, "Ошибка: Не указано значение лимита памяти.\n");
                print_help();
 
                return 0;
            }
        } else if (strcmp(argv[i], "-h") == 0) {
            exit(EXIT_SUCCESS);
        } else {
            fprintf(stderr, "Ошибка: Неизвестный параметр: %s\n", argv[i]);
            print_help();
            return 0;
        }
    }
    if (*input_filename == NULL) {
        fprintf(stderr, "Ошибка: Имя входного файла обязательно.\n");
        print_help();
        return 0;
    }
    return 1;
}
// Функция для создания бинарного файла с случайными числами
void create_binary_file(const char *filename, size_t num_elements) {
    printf("Создаём файл %s с %zu элементами.\n", filename, num_elements);
    FILE *file = fopen(filename, "wb");
    if (!file) {
        perror("Ошибка открытия файла для записи");
        exit(EXIT_FAILURE);
    }
    srand(time(NULL));
    for (size_t i = 0; i < num_elements; ++i) {
        long number = (long)(rand() % 1000000 - 500000); // Диапазон: -500000 до 499999
        fwrite(&number, sizeof(long), 1, file);
    }
    fclose(file);
    printf("Файл %s успешно создан с %zu элементами.\n", filename, num_elements);
}
// Функция для чтения и вывода содержимого бинарного файла
void read_binary_file(const char* filename) {
    FILE* file = fopen(filename, "rb");
    if (!file) {
        perror("Ошибка открытия файла для чтения");
        return;
    }
    long number;
    while (fread(&number, sizeof(long), 1, file) == 1) {
        printf("%ld ", number);
    }
    fclose(file);
    printf("\n");
}
// Функция для разделения исходного файла на отсортированные run'ы
size_t split_into_runs(const char *input_filename, const char *temp1_filename, size_t run_size, int ascending) {
    printf("Разделяем файл %s на run'ы размером %zu.\n", input_filename, run_size);
    FILE *input = fopen(input_filename, "rb");
    if (!input) {
        perror("Ошибка открытия входного файла для разделения");
        exit(EXIT_FAILURE);
    }
    FILE *temp1 = fopen(temp1_filename, "wb");
    if (!temp1) {
        perror("Ошибка открытия временного файла temp1 для run'ов");
        fclose(input);
        exit(EXIT_FAILURE);
    }
    long *buffer = (long *)malloc(run_size * sizeof(long));
    if (!buffer) {
        perror("Ошибка выделения памяти для разделения run'ов");
        fclose(input);
        fclose(temp1);
        exit(EXIT_FAILURE);
    }
    size_t count;
    size_t run_count = 0;
    while ((count = fread(buffer, sizeof(long), run_size, input)) > 0) {
        // Сортируем текущий run
        qs(buffer, 0, count - 1, ascending);
        // Записываем отсортированный run в temp1.bin
        fwrite(buffer, sizeof(long), count, temp1);
        run_count++;
    }
    free(buffer);
    fclose(input);
    fclose(temp1);
    return run_count;
}
// Функция для слияния двух run'ов из temp1.bin в temp2.bin
size_t merge_runs_pass(const char *temp1_filename, const char *temp2_filename, size_t run_size, int ascending) {
    printf("Сливаем run'ы из %s в %s с размером run'а %zu.\n", temp1_filename, temp2_filename, run_size);
    FILE *temp1 = fopen(temp1_filename, "rb");
    if (!temp1) {
        perror("Ошибка открытия temp1.bin для чтения");
        exit(EXIT_FAILURE);
    }
    FILE *temp2 = fopen(temp2_filename, "wb");
    if (!temp2) {
        perror("Ошибка открытия temp2.bin для записи");
        fclose(temp1);
        exit(EXIT_FAILURE);
    }
    long *buffer1 = (long *)malloc(run_size * sizeof(long));
    long *buffer2 = (long *)malloc(run_size * sizeof(long));
    if (!buffer1 || !buffer2) {
        perror("Ошибка выделения памяти для слияния");
        fclose(temp1);
        fclose(temp2);
        exit(EXIT_FAILURE);
    }
    size_t count1, count2;
    size_t merged_runs = 0;
    while (1) {
        // Читаем первый run
        count1 = fread(buffer1, sizeof(long), run_size, temp1);
        if (count1 == 0) {
            break; // Нет больше run'ов
        }
        // Читаем второй run
        count2 = fread(buffer2, sizeof(long), run_size, temp1);
        // Если нет второго run'а, записываем первый run как есть
        if (count2 == 0) {
            fwrite(buffer1, sizeof(long), count1, temp2);
            merged_runs++;
            // Удалён вывод содержимого run'а
            break;
        }
        // Сливаем два run'а и записываем в temp2.bin
        size_t i = 0, j = 0;
        while (i < count1 && j < count2) {
            if ((buffer1[i] <= buffer2[j] && ascending) ||
                (buffer1[i] >= buffer2[j] && !ascending)) {
                fwrite(&buffer1[i++], sizeof(long), 1, temp2);
            }
            else {
                fwrite(&buffer2[j++], sizeof(long), 1, temp2);
            }
        }
        // Записываем оставшиеся элементы из первого run
        while (i < count1) {
            fwrite(&buffer1[i++], sizeof(long), 1, temp2);
        }
        // Записываем оставшиеся элементы из второго run
        while (j < count2) {
            fwrite(&buffer2[j++], sizeof(long), 1, temp2);
        }
        merged_runs++;
        // Удалён вывод содержимого слитого run'а
    }
    free(buffer1);
    free(buffer2);
    fclose(temp1);
    fclose(temp2);
    return merged_runs;
}
// Основная функция внешней сортировки с прямым слиянием
int external_merge_sort_direct(const char *input_filename, size_t num_elements, int ascending, size_t memory_limit) {
    // Вычисляем размер run'а на основе лимита памяти
    // Используем половину памяти для одного run'а, чтобы можно было считывать два run'а одновременно при слиянии
    size_t run_size = memory_limit / (2 * sizeof(long));
    if (run_size == 0) {
        fprintf(stderr, "Ошибка: Лимит памяти слишком мал для выполнения сортировки.\n");
        return -1;
    }
    printf("Начинаем внешнюю сортировку с run_size = %zu.\n", run_size);
    char temp1_filename[256];
    char temp2_filename[256];
    sprintf(temp1_filename, "temp1_%d.bin", rand()%1000000);
    sprintf(temp2_filename, "temp2_%d.bin", rand()%1000000);
    printf("Используем временные файлы: %s и %s\n", temp1_filename, temp2_filename);
    size_t run_count = split_into_runs(input_filename, temp1_filename, run_size, ascending);
    printf("Создано %zu run'ов при начальном разделении.\n", run_count);
    if (run_count <= 1) {
        // Если только один run, переименовываем temp1.bin в исходный файл
        if (run_count == 1) {
            printf("Создан один run, переименовываем %s в %s.\n", temp1_filename, input_filename);
            if (remove(input_filename) != 0) {
                perror("Ошибка при удалении исходного файла");
                return -1;
            }
            if (rename(temp1_filename, input_filename) != 0) {
                perror("Ошибка при переименовании temp1.bin в исходный файл");
                return -1;
            }
            printf("Сортировка завершена за один проход.\n");
        }
        else {
            // Нет элементов для сортировки
            printf("Файл пуст. Сортировка не требуется.\n");
            remove(temp1_filename);
        }
        return 0;
    }
    // Многократное слияние run'ов
    int pass = 1;
    while (run_count > 1) {
        printf("Проход %d: слияние run'ов размером %zu.\n", pass, run_size);
        size_t merged_runs = merge_runs_pass(temp1_filename, temp2_filename, run_size, ascending);
        printf("Проход %d завершён: слито %zu run'ов.\n", pass, merged_runs);
        // Переименовываем temp2.bin в temp1.bin для следующего прохода
        printf("Переименовываем %s в %s.\n", temp2_filename, temp1_filename);
        if (remove(temp1_filename) != 0) {
            perror("Ошибка при удалении temp1.bin");
            return -1;
        }
        if (rename(temp2_filename, temp1_filename) != 0) {
            perror("Ошибка при переименовании temp2.bin в temp1.bin");
            return -1;
        }
        // Обновляем параметры для следующего прохода
        run_size *= 2;
        run_count = merged_runs;
        printf("Новый run_size = %zu, количество run'ов = %zu.\n", run_size, run_count);
        pass++;
    }
    printf("Переименовываем %s в %s.\n", temp1_filename, input_filename);
    if (remove(input_filename) != 0) {
        perror("Ошибка при удалении исходного файла");
        return -1;
    }
    if (rename(temp1_filename, input_filename) != 0) {
        perror("Ошибка при переименовании temp1.bin в исходный файл");
        return -1;
    }
    remove(temp2_filename);
    printf("Сортировка завершена за %d проходов.\n", pass - 1);
    return 0;
}
// Основная функция программы
int main(int argc, char* argv[]) {
    char *file_name_a = NULL;
    int ascending = 1;
    size_t memory_limit = 10 * 1024 * 1024; // По умолчанию 10 МБ
    if (!parse_arguments(argc, argv, &file_name_a, &ascending, &memory_limit)) {
        print_help();
        return EXIT_FAILURE;
    }
    size_t num_elements;
    printf("Введите количество элементов для сортировки: ");
    if (scanf("%zu", &num_elements) != 1 || num_elements <= 0) {
        printf("Ошибка ввода числа элементов.\n");
        return 1;
    }
    create_binary_file(file_name_a, num_elements);
    printf("Содержимое входного файла до сортировки:\n");
    read_binary_file(file_name_a);
    if (external_merge_sort_direct(file_name_a, num_elements, ascending, memory_limit) != 0) {
        fprintf(stderr, "Ошибка во время сортировки.\n");
        return EXIT_FAILURE;
    }
    printf("Содержимое файла после сортировки:\n");
    read_binary_file(file_name_a);
    return 0;
}
Программа практически во всех случаях работает исправно(даже в с случае, когда файл содержит достаточно большое количество элементов (10^9 элементов типа long)), однако с некоторой вероятностью выдаёт одну из ошибок:
C
1
2
Ошибка при удалении temp1.bin: Text file busy
Ошибка во время сортировки
;
C
1
2
Ошибка при переименовании temp2.bin в temp1.bin: Text file busy
Ошибка во время сортировки.
- из-за этого не может гарантированно давать требуемый результат при каждом запуске. Помогите разобраться, из-за чего возникают эти ошибки: из-за уязвимостей в этой реализации программы, или из-за ошибок системы? Или нельзя ответить однозначно на этот вопрос?
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
21.10.2024, 20:02
Ответы с готовыми решениями:

Внешняя однофазовую сортировку прямым слиянием
Здравствуйте, дали задание выполнить внешнюю однофазовую сортировку прямым слиянием из n элементов Застрял на нерабочей фазе разделения...

Внешняя сортировка прямым слиянием
В интернете везде только 1-2 однообразных примера, а на своих примерах ничего не выходит. Допустим последовательность чисел: 8 1 9 5 2 7...

Внешняя сортировка прямым и естественным слиянием
Есть задача: &quot;Разработать программу для сортировки текстового файла, используя сортировку прямым слиянием и естественным слиянием. Измерить...

3
383 / 280 / 112
Регистрация: 28.04.2015
Сообщений: 1,726
20.11.2024, 01:56
ТС, а ты не мог хотя бы количество строк кода сделать относительно красивым числом = 333)

кстати, а как chatGPT на такие проблемы отзывается, ты проверял
0
Злостный нарушитель
 Аватар для Verevkin
10652 / 5801 / 1281
Регистрация: 12.03.2015
Сообщений: 26,792
20.11.2024, 08:10
Цитата Сообщение от FasterHarder Посмотреть сообщение
кстати, а как chatGPT на такие проблемы отзывается, ты проверял
Это он и писал.
0
383 / 280 / 112
Регистрация: 28.04.2015
Сообщений: 1,726
20.11.2024, 08:50
ок)
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
20.11.2024, 08:50
Помогаю со студенческими работами здесь

Внешняя однофазная сортировка прямым (простым) слиянием
По большей части интересует не сама однофазная сортировка прямым слиянием, а слово внешняя. Как я понимаю, сортировать надо данные в файле....

Сортировка прямым слиянием
Подскажите пожалуйста алгоритм для сортировки массива методом прямого слияния.

Сортировка прямым слиянием
Всем привет! Нужно реализовать сортировку прямым слиянием по трем файлам. Не могу найти алгоритм

сортировка прямым слиянием
Попытался реализовать алгоритм, но в коде есть ошибки. По всей видимости напортачил в фазе слияния :( Буду благодарен, если укажете в...

Сортировка прямым слиянием
Получить число n на ввод; сгенерировать массив размером n со случайными числами, значения которых от 1 до n; сделать сортировку...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Настройки VS Code
Loafer 13.04.2026
{ "cmake. configureOnOpen": false, "diffEditor. ignoreTrimWhitespace": true, "editor. guides. bracketPairs": "active", "extensions. ignoreRecommendations": true, . . .
Оптимизация кода на разграничение прав доступа к элементам формы
Maks 13.04.2026
Алгоритм из решения ниже реализован на нетиповом документе, разработанного в конфигурации КА2. Задачи, как таковой, поставлено не было, проделанное ниже исключительно моя инициатива. Было так:. . .
Контроль заполнения и очистка дат в зависимости от значения перечислений
Maks 12.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: реализовать контроль корректности заполнения дат назначения. . .
Архитектура слоя интернета для сервера-слоя.
Hrethgir 11.04.2026
В продолжение https:/ / www. cyberforum. ru/ blogs/ 223907/ 10860. html Знаешь что я подумал? Раз мы все источники пишем в голове ветки, то ничего не мешает добавить в голову такой источник, который сам. . .
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях. Задача: при копировании документа очищать определенные реквизиты и табличную. . .
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели 8ATzM_2aurI
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2. Задача: запретить редактирование документа, если он открыт у другого пользователя. / / . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru