3 / 3 / 0
Регистрация: 31.10.2012
Сообщений: 142
1

Чтение русских символов. Отрицательные значения у символов

04.08.2014, 22:45. Показов 1605. Ответов 6
Метки нет (Все метки)

Добрый вечер. Считую файл .txt. Но русские буквы получают отрицательное значение. И в итоге при попытке перевести в String не распознаются. Например, "с" = 15. Подскажите как исправить?
Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
 private void readFile(File file, String newDictionaryName) {
        int length = (int) file.length();
        byte[] bytes = new byte[length];
 
        try {
            FileInputStream in = new FileInputStream(file);
            try {
                in.read(bytes);
            } catch (IOException e) {
                Toast.makeText(getApplicationContext(), "Ошибка чтения", Toast.LENGTH_LONG).show();
            } finally {
                in.close();
            }
        } catch (IOException e) {
            Toast.makeText(getApplicationContext(), "Файл отсутствует", Toast.LENGTH_LONG).show();
        }
        String contents = new String(bytes);
        if (contents.length() > 0) {
            writeToDictionary(contents, newDictionaryName);
        } else {
            Toast.makeText(getApplicationContext(), "Файл пустой", Toast.LENGTH_LONG).show();
        }
    }
__________________
Помощь в написании контрольных, курсовых и дипломных работ здесь
0
Лучшие ответы (1)
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
04.08.2014, 22:45
Ответы с готовыми решениями:

XMLPullParser чтение русских символов
Здравствуйте. Согласно заданию, необходимо написать парсер, который будет эммм... парсить(масло...

Чтение из файла русских символов
Помогите плиз)у меня прога должна ИЗ ТЕКСТОВОГО ФАЙЛА считывать русский текст производить...

Чтение русских символов из файла
Файл содержит миллионы русских букв "е". Читаю из файла символ: ch = fin.ReadByte(), сравниваю его...

Чтение русских символов из файла
Помогите пожалуйста с решением проблемы. Программа должна считывать символы из файла написанного...

6
510 / 272 / 60
Регистрация: 14.12.2010
Сообщений: 548
04.08.2014, 22:50 2
Указать кодировку.
1
535 / 504 / 114
Регистрация: 12.03.2014
Сообщений: 1,671
04.08.2014, 22:53 3
Вот рабочий код, символы все отлично отображаются.
Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
private static String readFile(Context context, String fileName){
 
        try {
            String s = "";
            String path = context.getFilesDir().getAbsolutePath();
            File file = new File (path + "/" + fileName);
            Scanner in = null;
            in = new Scanner(file);
            while(in.hasNext())
                s += in.nextLine();
            in.close();
            return s;
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        }
        return null;
    }
1
3 / 3 / 0
Регистрация: 31.10.2012
Сообщений: 142
04.08.2014, 23:26  [ТС] 4
исправил. добавив цикл.
Java
1
2
3
4
5
6
7
8
9
10
11
   char[] rusEngText = new char[bytes.length];
 
        for(int i = 0; i<bytes.length; i++) {
            if(bytes[i]<0) {
                rusEngText[i] = (char) (bytes[i]+1104);
            } else {
                rusEngText[i] = (char) (bytes[i]);
            }
        }
 
        String contents = new String(rusEngText);
Проблема была в том что русские буквы в формате юникод слегка не влезают в byte.
Не понятно зачем правда было делать чтобы FileInputStream.read() мог принимать только byte[], если ясно что туда не влезут все символы.
0
510 / 272 / 60
Регистрация: 14.12.2010
Сообщений: 548
04.08.2014, 23:43 5
Лучший ответ Сообщение было отмечено Flash_2oo9 как решение

Решение

Цитата Сообщение от Flash_2oo9 Посмотреть сообщение
исправил. добавив цикл.
Не делай больше так...

Цитата Сообщение от Flash_2oo9 Посмотреть сообщение
Не понятно зачем правда было делать чтобы FileInputStream.read() мог принимать только byte[], если ясно что туда не влезут все символы.

Файлы только тестовые бывают?
Текстовые файлы в каких кодировках бывают?
Как узнать кодировку файла без его прочтения? (Возможно, у кого-то телепатический модуль есть для Java на этот случай? )
Как читать текстовый файл с неизвестной кодировкой?

How to create a Java String from the contents of a file?
1
3 / 3 / 0
Регистрация: 31.10.2012
Сообщений: 142
05.08.2014, 08:38  [ТС] 6
спасибо, кодировка cp1251 сработала )
0
912 / 560 / 88
Регистрация: 13.02.2014
Сообщений: 2,079
05.08.2014, 09:55 7
Вот еще, на днях тоже испытывал проблемы
Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
StringBuffer sb = new StringBuffer();
BufferedReader br = null;
try {
    br = new BufferedReader(new InputStreamReader(mCtx.getAssets() //mCtx это Context
        .open("file.txt"), "Cp1251"));
    String temp;
    while ((temp = br.readLine()) != null){
        sb.append(temp);
    }
} catch (IOException e) {
        e.printStackTrace();
} finally {
    try {br.close(); 
    } catch (IOException e) {e.printStackTrace();}
}
1
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
05.08.2014, 09:55

Онлайн чтение русских символов
У меня есть txt и в нём русский текст.. HttpWebRequest rew =...

wifstream чтение русских символов
wifstream *fl = new wifstream(&quot;D:\\my.txt&quot;); while (!fl-&gt;eof()) { y += 20; WCHAR line;...

Чтение из файла русских символов
Читаем из файла slo.txt с кодировкой ANSI строки, но появилась странность в том что после...

Чтение русских символов из файла
Есть следующий код static public Edition Input() { using (StreamReader fileIn = new...

Запись (чтение) русских символов в(с) файл(а)
Вот мой кусок кода: string name; name = Console.ReadLine(); FileStream fin = new...

Чтение русских символов из текстового файла
Извините если эта проблема уже обсуждалась, но я к сожалению темы так и не нашел. Цель - считать...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2021, vBulletin Solutions, Inc.