Форум программистов, компьютерный форум CyberForum.ru

Исследование "неизвестного" формата (отрезать начало файла до определённого заголовка) - C++

Восстановить пароль Регистрация
 
Рейтинг: Рейтинг темы: голосов - 12, средняя оценка - 4.75
OSP-Scata
0 / 0 / 0
Регистрация: 24.01.2013
Сообщений: 3
24.01.2013, 19:29     Исследование "неизвестного" формата (отрезать начало файла до определённого заголовка) #1
Здравствуйте!
Программированию я учусь собственными силами, о преподаваемом в университетах или на курсах не имею ни малейшего понятия. Только недавно перешла со всяких хеллоуворлдов и "введите 2 числа, программа посчитает сумму" на что-то относительно серьёзное, и тут вполне предсказуемо споткнулась. Итак, есть такая хорошая старая игрушка - Aliens vs Predator (1999 года). А я решила поучиться разбирать неизвестные форматы файлов. Разобрала звуки, лежащие в папке fastfile и имеющие названия Snd2.ffl, Snd3.ffl и т.д. Вот как выглядят они в hex-виде:
Как видите, в начале идут текстовые данные (в каждом файле свои и разной длины), потом - заголовок WAV (я его красным обвела). Если отрезать начало файла до этого самого заголовка и поменять расширение на .wav, он прекрасно играется в плеере. Собственно, решила я это отрезание автоматизировать. И тут-то споткнулась. Удалить строку из файла (текстового) могу, копировать из файла в файл тоже (но опять-таки текст), а вот как тут? По идее, надо читать файл до RIFF, скопировать данные, начиная с RIFF, в новый файл, и задать ему расширение .wav. Таким образом, начало отбросится. Вопросы:
1) Как читать? С типом byte обращаться не умею совершенно.
2) Как указать RIFF в качестве "места, откуда копируем"? Поскольку файл не текстовый, то явно никаких char и тем более string быть не может. Или может? А если даже может, то как организовать цикл "читаем до тех пор, пока не встретится вот эта строка\массив char"? Счётчик байтов вводить?

В качестве "тренировки на кошках" изучаю стащенный с этого же форума код, который немного подкорректировала:
Кликните здесь для просмотра всего текста
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
#include <iostream>
#include <fstream>
using namespace std;
 
int main()
{   
    int line_number; // переменная для хранения номера строки
    ifstream infile;
    ofstream outfile;
 
    infile.open("testfile.txt");
    outfile.open("newfile.txt");
 
    cout << "Enter number of line: " << endl;
    cin >> line_number;
 
    char buffer[1000];
 
    while(!infile.eof())
    {
    for (int line_counter = 0; line_counter < line_number; line_counter++)  // не берём первые строки
        infile.getline(buffer,sizeof(buffer));
        outfile << buffer << endl;
    }
 
    infile.close();
    outfile.close();
 system("pause");
    return 0;
}

В оригинале это было "перенести весь текст из файла в новый файл". Я попыталась переносить не весь, а с определённой строки (т.е. задача, аналогичная моей с AvP-шными звуками), для чего добавила переменную и цикл for. Но в итоге получается так: в файле 6 строк, вводим, к примеру, число 3. Программа пропускает первые две строки, берёт третью, но следующая таким образом снова оказывается первой. В общем, в новый файл переносится каждая третья строка, а не все, начиная с третьей.

В общем, как всё это провернуть нормально? Заранее спасибо.
Миниатюры
Исследование "неизвестного" формата (отрезать начало файла до определённого заголовка)  
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
24.01.2013, 19:29     Исследование "неизвестного" формата (отрезать начало файла до определённого заголовка)
Посмотрите здесь:

C++ Обчисление введенной строки любого формата(пример:"(2+3)/4*2"или"2+3"или ...)
Работа с файлами (вывести в текстовый файл "g.txt" любую цифру из исходного файла "f.txt" с сохранением строгого порядка) C++
С++ Создать оконную таблицу для корректировки данных в файле формата ".txt" C++
C++ Считать с файла информацию о команде "Название" "Город", количество побед, поражений, ничьих, забитых и пропущенных мячей
C++ Исследование сортировки метода "пузырек" для большого массива
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
lemegeton
 Аватар для lemegeton
2908 / 1337 / 133
Регистрация: 29.11.2010
Сообщений: 2,720
24.01.2013, 20:05     Исследование "неизвестного" формата (отрезать начало файла до определённого заголовка) #2
Считывать такие штуки безо всякого опыта будет проблематично.
В кратце, надо считать заголовок, затем считать все блоки данных.

Первые пять байт -- определенно нуль-терминированная "магическая" строка-сигнатура файла.
C++
1
2
3
4
5
6
7
8
  std::ifstream fflFile("something.ffl");
  
  char signature[5];
  fflFile.read(magicToken, 5);
  if (std::string(magicToken) != "RFFL") {
    // плохой файл, выходим
    return 1;
  }
Добавлено через 8 минут
Затем, с пятого по восьмой байт, явно идет четырехбайтное целое -- количество блоков данных (в приведенном примере 13 штук).
...

Отрежьте заголовочную часть файла по первый WAVE включительно и прикрепите его к сообщению. Лучше у нескольких файлов.
WhiteP
605 / 203 / 23
Регистрация: 20.11.2012
Сообщений: 419
24.01.2013, 20:25     Исследование "неизвестного" формата (отрезать начало файла до определённого заголовка) #3
OSP-Scata,
1) Нужно читать именно из этого файла, или такскзть хочешь написать универсальный тул для выдергивания файлов из ресурсов?
2) Именно C++? Имхо, удобней проецировать файл (MMF) и выдергивать нужное.

В любом случае - файл ресурсов бинарный, а не текстовый. Никаких лайнов там нет (символа перевода строки нет). Нужно забыть о char и int-ами сравнивать с 0x46464952. За сигнатурой ("RIFF") идет 4-х байтный размер chunk'a, т.е. (размер файла-8). Нужно читать именно столько байт (например на приведенном изображении размер файла wav 7Кб).
OSP-Scata
0 / 0 / 0
Регистрация: 24.01.2013
Сообщений: 3
24.01.2013, 21:39  [ТС]     Исследование "неизвестного" формата (отрезать начало файла до определённого заголовка) #4
Спасибо за отклики!
Вот в 7zip-архиве 2 файла: http://www.mediafire.com/?jjbap9bo9z8e9ma Оригинальный FFL и сделанный из него WAV путём отрезания начального фрагмента в WinHex (банальным выделением мышкой и Delete). Это чтоб показать, что так действительно можно сделать.

Не по теме:

например на приведенном изображении размер файла wav 7Кб
На самом деле куда больше, там просто не всё вместилось в заскриненную страницу.



Отрежьте заголовочную часть файла по первый WAVE включительно и прикрепите его к сообщению. Лучше у нескольких файлов.
См. вложение, там как раз 5 разных файлов, отрезанных с начала и до WAVEfmt (ну и по ссылке, где другой файл).

Нужно читать именно из этого файла, или такскзть хочешь написать универсальный тул для выдергивания файлов из ресурсов?
Универсальный для этого формата (там, к слову, не все .ffl - звуки, но в данном случае именно для звуков).
Именно C++? Имхо, удобней проецировать файл (MMF) и выдергивать нужное.
Ну, С++ я хоть чуть-чуть знаю, да и опыта набраться надо. Ибо самое сложное, что до этого писала - генератор случайных чисел и ещё немного операций с текстовыми файлами.

Добавлено через 27 минут
И да, это не "напишите мне прогу, я нипанимаю", а "что сделать, чтобы понять?". Очень хорошо будет, если наведёте на книги какие-нибудь или статьи по этому делу (русские лучше, но и английские пойдут). А то "исследование неизвестных форматов" в Гугле выдаёт хорошие вещи вроде http://3d-orange.com.ua/reversing-ga...you-are-empty/, но мало их.
То, о чём я спрашиваю, ещё простой формат - ни сжатия, ни шифрования, и даже hex-вид очевидный. А ведь потом я и в сложные полезу, так что хочу запастись знаниями, но не знаю, где их взять.
WhiteP
605 / 203 / 23
Регистрация: 20.11.2012
Сообщений: 419
24.01.2013, 21:52     Исследование "неизвестного" формата (отрезать начало файла до определённого заголовка) #5
OSP-Scata, в том файле, который ты выложила (snd3.wav) не один, а более 15 файлов wav. Изучить формат файлов! После сигнатуры "RIFF" идут четыре байта, которые содержат размер chunk'а в байтах. Размер wav-файла == размер_chunk'а_в_байтах + 8 (начиная с сигнатуры RIFF).
OSP-Scata
0 / 0 / 0
Регистрация: 24.01.2013
Сообщений: 3
24.01.2013, 22:03  [ТС]     Исследование "неизвестного" формата (отрезать начало файла до определённого заголовка) #6
в том файле, который ты выложила (snd3.wav) не один, а более 15 файлов wav. Изучить формат файлов! После сигнатуры "RIFF" идут четыре байта, которые содержат размер chunk'а в байтах. Размер wav-файла == размер_chunk'а_в_байтах + 8 (начиная с сигнатуры RIFF).
...Так вот что за список файлов был в начале .ffl! Спасибо, кое-что прояснилось. Но тогда и задача усложнится - надо будет эти файлы разделять.
Тут в общем-то не в файлах дело, а в "научиться хочу". Показалось самым простым для разбора из всего, что у меня есть.
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
24.01.2013, 22:10     Исследование "неизвестного" формата (отрезать начало файла до определённого заголовка)
Еще ссылки по теме:

C++ Как возможно выйти в инструкции switch в начало самой инструкции при нажатии "не правильной" кнопки
Переписать в файл О все элементы файла К с заменой в них символа "0" на символ "1" и наоборот C++
Переписать в файл О все элементы файла К с заменой в них символа "0" на символ "1" и наоборот C++

Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
WhiteP
605 / 203 / 23
Регистрация: 20.11.2012
Сообщений: 419
24.01.2013, 22:10     Исследование "неизвестного" формата (отрезать начало файла до определённого заголовка) #7
Цитата Сообщение от OSP-Scata Посмотреть сообщение
И да, это не "напишите мне прогу, я нипанимаю", а "что сделать, чтобы понять?". Очень хорошо будет, если наведёте на книги какие-нибудь или статьи по этому делу (русские лучше, но и английские пойдут). А то "исследование неизвестных форматов" в Гугле выдаёт хорошие вещи вроде http://3d-orange.com.ua/reversing-ga...you-are-empty/, но мало их.
То, о чём я спрашиваю, ещё простой формат - ни сжатия, ни шифрования, и даже hex-вид очевидный. А ведь потом я и в сложные полезу, так что хочу запастись знаниями, но не знаю, где их взять.
По каждому открытому формату файлов есть спецификации. Ищи в гугле "wav file format cpecification", например. (вместо wav нужное расширение). Каждый бинарный файл имеет сигнатуру (повторяющаяся во всех файлах данного типа последовательность байт, которые обычно являются первыми байтами в файле и имеют коды, входящие в ASCII таблицу (буквы даже)) и некий заголовок помимо самих данных. Если ничего не найдено по запросу "* file format cpecification", то можно попробовать поискать по сигнатуре (например "RIFF" или там "MZ signature"). Это только для открытых и/или сильно распространенных форматов. То, как разработчики игр формируют файлы в ресурсах - зависит в основном от разработчиков. Не факт, что кто-то занимался их (файлов) разбором.
Вот так открыв такой редкий файл в HEX редакторе ничего не поймешь. При разборе хакеры (условно назовем их так) запускают программу, использующую эти файлы, под отладчиком (или в дизассемблере открывают даже), ставят точку останова на CreateFile/ReadFile (если Windows) и наблюдают что и как программа делает с данными в файле, и на основании этой информации понимают формат файла.
Yandex
Объявления
24.01.2013, 22:10     Исследование "неизвестного" формата (отрезать начало файла до определённого заголовка)
Ответ Создать тему
Опции темы

Текущее время: 13:40. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2016, vBulletin Solutions, Inc.
Рейтинг@Mail.ru