Форум программистов, компьютерный форум, киберфорум
Наши страницы

С++ для начинающих

Войти
Регистрация
Восстановить пароль
 
Sobaka_ru
2 / 2 / 0
Регистрация: 16.12.2010
Сообщений: 74
#1

Определение кодировки текстового файла - C++

22.01.2012, 20:41. Просмотров 998. Ответов 2
Метки нет (Все метки)

Нужно написать программу на СИ, которая определяет кодировку текстового файла.
Помогите, весь инет обшарил, ничего подходящего не нашел...
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
22.01.2012, 20:41
Здравствуйте! Я подобрал для вас темы с ответами на вопрос Определение кодировки текстового файла (C++):

Добавить в конец первого текстового файла содержимое второго текстового файла - C++
Даны два текстовых файла. Добавить в конец первого файла содержимое второго файла.

Определение текущей кодировки консоли - C++
В предыдущей теме возник отдельный вопрос, и отвечать на него никто не стал. Итак, задаю повторно: как определить текущую кодировку консоли...

Определение нужной кодировки для символа чёрного квадрата - C++
Добрый день, подскажите, что нужно прописать в setlocale(LC_ALL,""); чтобы в консоли отображался символ чёрного квадрата ■ , а не...

Сохранение кодировки при чтении XML-файла - C++
Всем привет :) Прошу знающих людей помочь советом, или просто пальцем ткнуть в литературу, только пожалуйста, поподробнее, а то я совсем...

В чём отличия кодировки ms dos от кодировки ms windows? - C++
Всем привет, подскажите в чём отличия кодировки ms dos от кодировки ms windows?

Преобразование текстового файла в двоичный и чтение исходных данных из двоичного файла. - C++
#include<iostream> #include<fstream> #include<locale.h> #include<iomanip> #include <cstdlib> using namespace std; struct...

2
Teravisor
31 / 31 / 3
Регистрация: 07.08.2011
Сообщений: 89
22.01.2012, 20:53 #2
Гугль по англоговорящим говорит:
"You can't detect the codepage, you need to be told it."
Нельзя короче автоматически это делать на 100%. Можно попробовать угадать по частотности встречи определенных символов, не более того.
В plan text(.txt от блокнота и т.п.) файле часто нигде не лежит то, какая кодировка используется

+наверно не дураки писали многие дос-подобные редакторы, но даже в них всегда надо руками переключать UTF<->ANSI кодировки...

Добавлено через 5 минут
Гугль нашел проекты, которые пытаются по частотности определять. Советую запросить у него recognize character encoding, ну или detect character encoding. Там не мало.
0
Sobaka_ru
2 / 2 / 0
Регистрация: 16.12.2010
Сообщений: 74
22.01.2012, 21:08  [ТС] #3
Не понял ваще ничего из вышесказанного...
Вот у меня задание короче по предмету " Структуры и алгоритмы обработки данных " , все делаем в СИ:
Имеется текстовый файл, определить его кодировку
0
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
22.01.2012, 21:08
Привет! Вот еще темы с ответами:

Сортировка слов текстового файла путём слияния данных из файла и заданного внутреннего массива - C++
Здравствуйте. Имеется задание, которое я ни в коем случае не прошу за меня сделать. Мне непонятно пару моментов, которые бы мне...

Указание текстового файла-источника и принимающего файла в cmd - C++
Подскажите, как сделать что б при вводе через cmd надо было указывать файл-исходник и принимающий файл? &quot;полный путь\fdsfsd.exe in.txt...

как может корректно выполняющийся оператор >> (чтение из текстового файла) негативно влиять на открытие другого файла? - C++
Друзья! Создадим два текстовых файла, f_0.txt и f_1.txt и что-нибудь в них запизаем, например в первый запихаем 1234 а во второй 5678 и...

Кодировки (ошибки кодировки) в логировании - C++
Здравствуйте. Работаю с WINAPI и оттуда нормально приходят наименования на русском. Вот решил логирование организовать и на этом повалился...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2018, vBulletin Solutions, Inc.