Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.63/16: Рейтинг темы: голосов - 16, средняя оценка - 4.63
0 / 0 / 0
Регистрация: 24.01.2013
Сообщений: 3

Исследование "неизвестного" формата (отрезать начало файла до определённого заголовка)

24.01.2013, 19:29. Показов 3409. Ответов 6
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте!
Программированию я учусь собственными силами, о преподаваемом в университетах или на курсах не имею ни малейшего понятия. Только недавно перешла со всяких хеллоуворлдов и "введите 2 числа, программа посчитает сумму" на что-то относительно серьёзное, и тут вполне предсказуемо споткнулась. Итак, есть такая хорошая старая игрушка - Aliens vs Predator (1999 года). А я решила поучиться разбирать неизвестные форматы файлов. Разобрала звуки, лежащие в папке fastfile и имеющие названия Snd2.ffl, Snd3.ffl и т.д. Вот как выглядят они в hex-виде:
Как видите, в начале идут текстовые данные (в каждом файле свои и разной длины), потом - заголовок WAV (я его красным обвела). Если отрезать начало файла до этого самого заголовка и поменять расширение на .wav, он прекрасно играется в плеере. Собственно, решила я это отрезание автоматизировать. И тут-то споткнулась. Удалить строку из файла (текстового) могу, копировать из файла в файл тоже (но опять-таки текст), а вот как тут? По идее, надо читать файл до RIFF, скопировать данные, начиная с RIFF, в новый файл, и задать ему расширение .wav. Таким образом, начало отбросится. Вопросы:
1) Как читать? С типом byte обращаться не умею совершенно.
2) Как указать RIFF в качестве "места, откуда копируем"? Поскольку файл не текстовый, то явно никаких char и тем более string быть не может. Или может? А если даже может, то как организовать цикл "читаем до тех пор, пока не встретится вот эта строка\массив char"? Счётчик байтов вводить?

В качестве "тренировки на кошках" изучаю стащенный с этого же форума код, который немного подкорректировала:
Кликните здесь для просмотра всего текста
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
#include <iostream>
#include <fstream>
using namespace std;
 
int main()
{   
    int line_number; // переменная для хранения номера строки
    ifstream infile;
    ofstream outfile;
 
    infile.open("testfile.txt");
    outfile.open("newfile.txt");
 
    cout << "Enter number of line: " << endl;
    cin >> line_number;
 
    char buffer[1000];
 
    while(!infile.eof())
    {
    for (int line_counter = 0; line_counter < line_number; line_counter++)  // не берём первые строки
        infile.getline(buffer,sizeof(buffer));
        outfile << buffer << endl;
    }
 
    infile.close();
    outfile.close();
 system("pause");
    return 0;
}

В оригинале это было "перенести весь текст из файла в новый файл". Я попыталась переносить не весь, а с определённой строки (т.е. задача, аналогичная моей с AvP-шными звуками), для чего добавила переменную и цикл for. Но в итоге получается так: в файле 6 строк, вводим, к примеру, число 3. Программа пропускает первые две строки, берёт третью, но следующая таким образом снова оказывается первой. В общем, в новый файл переносится каждая третья строка, а не все, начиная с третьей.

В общем, как всё это провернуть нормально? Заранее спасибо.
Миниатюры
Исследование "неизвестного" формата (отрезать начало файла до определённого заголовка)  
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
24.01.2013, 19:29
Ответы с готовыми решениями:

Чтение из файла неизвестного формата
Всем привет.Я изучаю си,по работе и по учебе параллельно.Практически дошел до струтур,но дальше,включая чтение из файла пока не добрался.Но...

Считать матрицу из файла неизвестного формата
Здраствуйте, подскажите пожалуйста, как считать из файла матрицу неизвестного формата?

Поиск и чтение изображений из файла неизвестного формата
Приветствую! Имеется файл http://ge.tt/3nctBLQ/v/0 Известно, что в нем содержатся изображения (как мне кажется, их 256 шт),...

6
 Аватар для lemegeton
4903 / 2696 / 921
Регистрация: 29.11.2010
Сообщений: 5,783
24.01.2013, 20:05
Считывать такие штуки безо всякого опыта будет проблематично.
В кратце, надо считать заголовок, затем считать все блоки данных.

Первые пять байт -- определенно нуль-терминированная "магическая" строка-сигнатура файла.
C++
1
2
3
4
5
6
7
8
  std::ifstream fflFile("something.ffl");
  
  char signature[5];
  fflFile.read(magicToken, 5);
  if (std::string(magicToken) != "RFFL") {
    // плохой файл, выходим
    return 1;
  }
Добавлено через 8 минут
Затем, с пятого по восьмой байт, явно идет четырехбайтное целое -- количество блоков данных (в приведенном примере 13 штук).
...

Отрежьте заголовочную часть файла по первый WAVE включительно и прикрепите его к сообщению. Лучше у нескольких файлов.
0
840 / 347 / 67
Регистрация: 20.11.2012
Сообщений: 809
24.01.2013, 20:25
OSP-Scata,
1) Нужно читать именно из этого файла, или такскзть хочешь написать универсальный тул для выдергивания файлов из ресурсов?
2) Именно C++? Имхо, удобней проецировать файл (MMF) и выдергивать нужное.

В любом случае - файл ресурсов бинарный, а не текстовый. Никаких лайнов там нет (символа перевода строки нет). Нужно забыть о char и int-ами сравнивать с 0x46464952. За сигнатурой ("RIFF") идет 4-х байтный размер chunk'a, т.е. (размер файла-8). Нужно читать именно столько байт (например на приведенном изображении размер файла wav 7Кб).
0
0 / 0 / 0
Регистрация: 24.01.2013
Сообщений: 3
24.01.2013, 21:39  [ТС]
Спасибо за отклики!
Вот в 7zip-архиве 2 файла: http://www.mediafire.com/?jjbap9bo9z8e9ma Оригинальный FFL и сделанный из него WAV путём отрезания начального фрагмента в WinHex (банальным выделением мышкой и Delete). Это чтоб показать, что так действительно можно сделать.

Не по теме:

например на приведенном изображении размер файла wav 7Кб
На самом деле куда больше, там просто не всё вместилось в заскриненную страницу.



Отрежьте заголовочную часть файла по первый WAVE включительно и прикрепите его к сообщению. Лучше у нескольких файлов.
См. вложение, там как раз 5 разных файлов, отрезанных с начала и до WAVEfmt (ну и по ссылке, где другой файл).

Нужно читать именно из этого файла, или такскзть хочешь написать универсальный тул для выдергивания файлов из ресурсов?
Универсальный для этого формата (там, к слову, не все .ffl - звуки, но в данном случае именно для звуков).
Именно C++? Имхо, удобней проецировать файл (MMF) и выдергивать нужное.
Ну, С++ я хоть чуть-чуть знаю, да и опыта набраться надо. Ибо самое сложное, что до этого писала - генератор случайных чисел и ещё немного операций с текстовыми файлами.

Добавлено через 27 минут
И да, это не "напишите мне прогу, я нипанимаю", а "что сделать, чтобы понять?". Очень хорошо будет, если наведёте на книги какие-нибудь или статьи по этому делу (русские лучше, но и английские пойдут). А то "исследование неизвестных форматов" в Гугле выдаёт хорошие вещи вроде http://3d-orange.com.ua/revers... are-empty/, но мало их.
То, о чём я спрашиваю, ещё простой формат - ни сжатия, ни шифрования, и даже hex-вид очевидный. А ведь потом я и в сложные полезу, так что хочу запастись знаниями, но не знаю, где их взять.
0
840 / 347 / 67
Регистрация: 20.11.2012
Сообщений: 809
24.01.2013, 21:52
OSP-Scata, в том файле, который ты выложила (snd3.wav) не один, а более 15 файлов wav. Изучить формат файлов! После сигнатуры "RIFF" идут четыре байта, которые содержат размер chunk'а в байтах. Размер wav-файла == размер_chunk'а_в_байтах + 8 (начиная с сигнатуры RIFF).
1
0 / 0 / 0
Регистрация: 24.01.2013
Сообщений: 3
24.01.2013, 22:03  [ТС]
в том файле, который ты выложила (snd3.wav) не один, а более 15 файлов wav. Изучить формат файлов! После сигнатуры "RIFF" идут четыре байта, которые содержат размер chunk'а в байтах. Размер wav-файла == размер_chunk'а_в_байтах + 8 (начиная с сигнатуры RIFF).
...Так вот что за список файлов был в начале .ffl! Спасибо, кое-что прояснилось. Но тогда и задача усложнится - надо будет эти файлы разделять.
Тут в общем-то не в файлах дело, а в "научиться хочу". Показалось самым простым для разбора из всего, что у меня есть.
0
840 / 347 / 67
Регистрация: 20.11.2012
Сообщений: 809
24.01.2013, 22:10
Цитата Сообщение от OSP-Scata Посмотреть сообщение
И да, это не "напишите мне прогу, я нипанимаю", а "что сделать, чтобы понять?". Очень хорошо будет, если наведёте на книги какие-нибудь или статьи по этому делу (русские лучше, но и английские пойдут). А то "исследование неизвестных форматов" в Гугле выдаёт хорошие вещи вроде http://3d-orange.com.ua/revers... are-empty/, но мало их.
То, о чём я спрашиваю, ещё простой формат - ни сжатия, ни шифрования, и даже hex-вид очевидный. А ведь потом я и в сложные полезу, так что хочу запастись знаниями, но не знаю, где их взять.
По каждому открытому формату файлов есть спецификации. Ищи в гугле "wav file format cpecification", например. (вместо wav нужное расширение). Каждый бинарный файл имеет сигнатуру (повторяющаяся во всех файлах данного типа последовательность байт, которые обычно являются первыми байтами в файле и имеют коды, входящие в ASCII таблицу (буквы даже)) и некий заголовок помимо самих данных. Если ничего не найдено по запросу "* file format cpecification", то можно попробовать поискать по сигнатуре (например "RIFF" или там "MZ signature"). Это только для открытых и/или сильно распространенных форматов. То, как разработчики игр формируют файлы в ресурсах - зависит в основном от разработчиков. Не факт, что кто-то занимался их (файлов) разбором.
Вот так открыв такой редкий файл в HEX редакторе ничего не поймешь. При разборе хакеры (условно назовем их так) запускают программу, использующую эти файлы, под отладчиком (или в дизассемблере открывают даже), ставят точку останова на CreateFile/ReadFile (если Windows) и наблюдают что и как программа делает с данными в файле, и на основании этой информации понимают формат файла.
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
24.01.2013, 22:10
Помогаю со студенческими работами здесь

Разбор неизвестного формата файла (архив, файл из игры на PSP)
Ума не приложу, где ещё можно было создать тему, может быть, кто-нибудь подскажет. Дело в том, что мне приспичило заняться переводом...

Чтение заголовка из внешнего файла формата TGA grayscale (TGAgs)
Подскажите как можно считать заголовок из внешнего файла формата TGA grayscale (TGAgs или Targa grayscale). А именно IDLength,...

Считывание из файла определенного формата
Доброе время суток, запутался тут, помогите пожалуйста. информация в файле представлена следующим образом ...

Отображение названия файла определенного формата
Пишу программ по поиску файлов и путей определенного формата. Пока получилось реализовать поиск файлов и отображение всего пути к файлу....

Можно ли отрезать и отправить в HPA начало ЖД
Можно ли отрезать и отправить в HPA начало ЖД,а не его конец ? Как это сделать ?


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru