Форум программистов, компьютерный форум, киберфорум
Наши страницы

Определение кодировки текстового файла - C++

Войти
Регистрация
Восстановить пароль
Другие темы раздела
C++ решите 2 задачи. http://www.cyberforum.ru/cpp-beginners/thread433168.html
Срочно,помогите решить 2 задачи,задачи в прикреплённом png
C++ Как узнать, сколько секунд прошло с 1 января 1970 гда до определённой даты? Если дата текущая, то это значение можно получить так: /* time example */ #include <stdio.h> #include <time.h> int main () { time_t seconds; seconds = time (NULL); http://www.cyberforum.ru/cpp-beginners/thread433145.html
дерево (проблема с адресами типов "чар") C++
Англо-русский словарь. При передачи адресов(после ввода english и russian) в метод, передаются все те же начальные адреса, которые и были с самого начала. В результате этого после ввода нескольких...
C++ динамические массивы
Задали квадратную матрицу, все элементы которой равны единице. Написать функцию void func (int ** arr, int n), которая заполняет заштрихована пиксели нулями. Размер массива вводится с клавиатуры.
C++ fstream в многопроцессной среде http://www.cyberforum.ru/cpp-beginners/thread433115.html
Не нашел в гугле ответа на следующие вопросы: 1. Что происходит когда ifstream открывает, затем читает существующий, но уже открытый на запись файл? Какие биты(badbit, failbit, eofbit) при этом...
C++ Нужно определить предельное значение n! если n - int сделал прогу #include <iostream.h> #include <conio.h> #include <limits.h> int main() { clrscr(); int i,F,n,max; max=INT_MAX; подробнее

Показать сообщение отдельно
Teravisor
31 / 31 / 3
Регистрация: 07.08.2011
Сообщений: 89
22.01.2012, 20:53
Гугль по англоговорящим говорит:
"You can't detect the codepage, you need to be told it."
Нельзя короче автоматически это делать на 100%. Можно попробовать угадать по частотности встречи определенных символов, не более того.
В plan text(.txt от блокнота и т.п.) файле часто нигде не лежит то, какая кодировка используется

+наверно не дураки писали многие дос-подобные редакторы, но даже в них всегда надо руками переключать UTF<->ANSI кодировки...

Добавлено через 5 минут
Гугль нашел проекты, которые пытаются по частотности определять. Советую запросить у него recognize character encoding, ну или detect character encoding. Там не мало.
0
 
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru