Форум программистов, компьютерный форум, киберфорум
Perl: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/15: Рейтинг темы: голосов - 15, средняя оценка - 4.67
Невнимательный
 Аватар для ft4l
2835 / 1260 / 357
Регистрация: 08.02.2013
Сообщений: 7,337
Записей в блоге: 2

Utf-8 :scalar . + разбор Accept-Language:

09.07.2019, 05:08. Показов 3461. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Как-бы один вопрос больше по Web, не понимаю как сделать правильнее
например такое: закинул в /cgi-bin
Perl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
#!perl
use strict;
use warnings;
#=========================
use utf8;
use open ':encoding(utf8)';
binmode(STDOUT, ":utf8");
# так вроде нормально с utf работают все print и open
use Data::Dumper;
 
print 'Content-type: text/html; charset=utf-8'.$/.$/;
 
# какие-то такие навверно бывают заголовки Accept-Language
my @ALs = (
    'en-ca,en;q=0.8,en-us;q=0.6,de-de;q=0.4,de;q=0.2',
    'ru-RU,ru;q=0.8,en-US;q=0.5,en;q=0.3',
    'en',
    'ru-RU',
    'zh, en-us; q=0.8, en; q=0.6'
    );
 
my $MyVars = ' ru en ';
 
# сначала как-то так думал нормально разбирает
#### my %ha = ($_ =~ /\G([a-z]{2})(?>[^;]*+;q=([.\d]++),?)?/g);
##### не вариант ... значения перезаписываются, хэш сортируется
for (@ALs){
    my @ha = ($_ =~ /\G([a-z]{2})(?>[^;]*+;q=([.\d]++),?)?/g);
    print '<xmp>'.$/. Dumper(\@ha) .'</xmp><hr/>'.$/;
}
# но потом попался где-то тот последний вариант Accept-Language ...
# И ещё такой попался перечень,
# из файлов Apache которые юзает httpd-multilang-errordoc.conf
my $MyVars2 = ' cs de en es fr ga it ja ko nl nb pl pt-br pt ro ru sr sv tr zh-cn zh-tw ';
# типо pt-br это не совсем pt, значить надо выбирать что-то такое ?
for (@ALs){
    my @ha = (/([a-z]{2}(?>-[a-z]{2})?)/ig);
    print '<hr/><hr/><xmp>'.$/. lc Dumper(\@ha) .'</xmp><hr/>'.$/;
}
Вобщем интересует бывают-ли числа типа q=0.5, q=0.3 не в порядке убывания...
Или достаточно просто выбирать то что раньше перечисляется...
Как оно должно быть логически?

И такое ещё ... Больше по Perl.
Например в этом-же файле добавляю дальше такое
Perl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
my $txt = '
    관리 작업이나 용량 문제로 서버가 잠시동안 요청을 처리할 수 없습니다.
    나중에 다시 시도해주시기 바랍니다.
    Сервер временно не имеет возможности обработать Ваш запрос
    по техническим причинам. Пожалуйста, повторите позже.
    由于服务器维护或负载问题,服务器暂时无法处理您的请求。请稍后重试。
';
my $BUFFER = '';
open my $FH, '+>', \$BUFFER; # или '+>:scalar', вроде без разницы
# или я уже перепробывал все возможные :raw :utf8 :unix :encoding....
# или я чего-то не догоняю... в итоге например такое:
while ($txt =~ /.++\v++/gp){
    print $FH ${^MATCH};
}
# 1. просто вывод $BUFFER
print '<hr/><hr/><hr/>1:<xmp>'. $BUFFER .'</xmp><hr/>'.$/;
# 2. вывод $BUFFER после seek
seek $FH ,0,0;
print '2:<xmp>'. $BUFFER .'</xmp><hr/>'.$/;
# 3. вывод $BUFFER чтением $FH
print '3:<xmp>';
print for <$FH>;
print '</xmp>';
close $FH;
Чего я не понимаю ??
.) В смысле мне как-бы удобнее было просто вывести $BUFFER , вместо 3-го варианта
И если такое возможно, то как ?

//Форум тоже поломал кодировку, $text из файла
например Apache2/error/HTTP_SERVICE_UNAVAILABLE.html.var

Добавлено через 55 минут
$txt в редактировании нормально отображается, а так с форума только такое можно скопировать
Perl
1
2
3
4
5
6
7
my $txt = "
        \x{AD00}\x{B9AC} \x{C791}\x{C5C5}\x{C774}\x{B098} \x{C6A9}\x{B7C9} \x{BB38}\x{C81C}\x{B85C} \x{C11C}\x{BC84}\x{AC00} \x{C7A0}\x{C2DC}\x{B3D9}\x{C548} \x{C694}\x{CCAD}\x{C744} \x{CC98}\x{B9AC}\x{D560} \x{C218} \x{C5C6}\x{C2B5}\x{B2C8}\x{B2E4}.
    \x{B098}\x{C911}\x{C5D0} \x{B2E4}\x{C2DC} \x{C2DC}\x{B3C4}\x{D574}\x{C8FC}\x{C2DC}\x{AE30} \x{BC14}\x{B78D}\x{B2C8}\x{B2E4}.
    Сервер временно не имеет возможности обработать Ваш запрос
    по техническим причинам. Пожалуйста, повторите позже.
    \x{7531}\x{4E8E}\x{670D}\x{52A1}\x{5668}\x{7EF4}\x{62A4}\x{6216}\x{8D1F}\x{8F7D}\x{95EE}\x{9898}\x{FF0C}\x{670D}\x{52A1}\x{5668}\x{6682}\x{65F6}\x{65E0}\x{6CD5}\x{5904}\x{7406}\x{60A8}\x{7684}\x{8BF7}\x{6C42}\x{3002}\x{8BF7}\x{7A0D}\x{540E}\x{91CD}\x{8BD5}\x{3002}
";
Добавлено через 3 часа 47 минут
остановился пока на таком выборе Accept-Language
Perl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
#!perl
use strict;
use warnings;
use utf8;
use open ':encoding(utf8)';
binmode(STDOUT, ":utf8");
use List::Util 'first'; # ( ,'uniq');
 
print 'Content-type: text/html; charset=utf-8'.$/.$/;
 
sub check_lang_list ($\@$) {
    my ($ALang, $LRef, $default) = @_;
    return $default unless defined $ALang;
    while ($ALang =~ /\b(([a-z]{2})(?>-[a-z]{2})?)\b(?>(?>\s*;\s*q=[.\d]++)?\s*,\s*\2\b)?/ig) {
        my @X = ($1,$2);
        my $M = (first { $_ eq $X[0] } @$LRef) // (first { $_ =~ /^$X[1]/ } @$LRef);
        return $M if ($M);
    }
    $default;
}
 
my @ALs = (
    'ru-RU,ru;q=0.8,en-US;q=0.5,en;q=0.3',
    'en-ca,en;q=0.8,en-us;q=0.6,de-de;q=0.4,de;q=0.2',
    'es',
    'ru-RU',
    'zh, en-us; q=0.8, en; q=0.6',
    'xx_yy',
);
my @MyVars2 = qw'cs de en es fr ga it ja ko nl nb pl pt-br pt ro ru sr sv tr zh-cn zh-tw';
 
print ''.(defined $_?$_:'undef').'==='.check_lang_list($_, @MyVars2, 'en').'<hr/>'.$/
        for @ALs;
Как-то тоже не очень... усложнил выражение, но всё-равно возможны лишние перелистывания массива @MyVars2,
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
09.07.2019, 05:08
Ответы с готовыми решениями:

Работа Accept-Language
Парни приведите практический пример, как можно посмотреть как работает св-во Accept-Language: ru-ru,ru;q=0.8,en-us;q=0.5,en;q=0.3, а то...

Awesomium изменить User-Agent и Accept-Language
Awesomium изменить User-Agent и Accept-Language. Как? Добавлено через 6 минут Вроде вот тут что то написано, а примера нет, не могу...

getBytes('UTF-16') даёт UTF-16LE или UTF-16BE?
Добрый день! Делаю J2ME-клиента к некому серверу, исходников которого у меня нет, но есть работающий клиент на C#. Выяснилось, что C#...

3
3 / 2 / 1
Регистрация: 15.02.2019
Сообщений: 5
09.07.2019, 07:08
Слушай, отвлекись немного от своего кода. Ты чего вообще хотел в итоге получить? Отдать сообщение об ошибке на языке пользователя? Тогда тебе удобнее будет разобрать Accept-Language на хэш с весами (например, вес в значении), пробежать по ключам-языкам, сортированным по убыванию веса, и как встретишь язык, который поддерживаешь, отдаёшь его. Или мой телепат ошибся?..
1
Невнимательный
 Аватар для ft4l
2835 / 1260 / 357
Регистрация: 08.02.2013
Сообщений: 7,337
Записей в блоге: 2
09.07.2019, 13:05  [ТС]
Цитата Сообщение от netbot Посмотреть сообщение
сообщение об ошибке на языке пользователя
Вобщем да, хотелось без ручного редактирования текста из файлов Apache сделать свои обработчики ошибок...

Типа первый файл запускается из админ-панели, делает изменённые копии сообщений.
Время работы как-бы не важно, но эти $str =~ s///g пришлось внести в тело цикла, из-за того что не смог заставить
нормально работать tell c open H '+>:scalar' , и получаемая строка не utf-8 совсем
Perl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
use Data::Dumper;
use utf8;
use open ':encoding(utf8)';
binmode(STDOUT, ":utf8");
use Encode; 
 
open my $TFH, '<', $FTPL;
ShowTpl $TFH;
 
my %ERRS = (
      '400' => '/X/error/HTTP_BAD_REQUEST.html.var',
      '401' => '/X/error/HTTP_UNAUTHORIZED.html.var',
      '403' => '/X/error/HTTP_FORBIDDEN.html.var',
      '404' => '/X/error/HTTP_NOT_FOUND.html.var',
      '405' => '/X/error/HTTP_METHOD_NOT_ALLOWED.html.var',
      '408' => '/X/error/HTTP_REQUEST_TIME_OUT.html.var',
      '410' => '/X/error/HTTP_GONE.html.var',
      '411' => '/X/error/HTTP_LENGTH_REQUIRED.html.var',
      '412' => '/X/error/HTTP_PRECONDITION_FAILED.html.var',
      '413' => '/X/error/HTTP_REQUEST_ENTITY_TOO_LARGE.html.var',
      '414' => '/X/error/HTTP_REQUEST_URI_TOO_LARGE.html.var',
      '415' => '/X/error/HTTP_UNSUPPORTED_MEDIA_TYPE.html.var',
      
      '500' => '/X/error/HTTP_INTERNAL_SERVER_ERROR.html.var',
      '501' => '/X/error/HTTP_NOT_IMPLEMENTED.html.var',
      '502' => '/X/error/HTTP_BAD_GATEWAY.html.var',
      '503' => '/X/error/HTTP_SERVICE_UNAVAILABLE.html.var',
      '506' => '/X/error/HTTP_VARIANT_ALSO_VARIES.html.var'
);
 
#print '<xmp>'.$/. Dumper(\%ERRS) .'</xmp><hr/>'.$/;
#return;
 
print '<xmp>';
foreach (keys %ERRS) {
    my $key = $_;
    print $key .' === '. $ERRS{$key} .$/;
 
    open my $FH, '<', $ERRS{$key};
    read $FH, my $txt, (stat $ERRS{$key})[7];
    close $FH;
 
    my @poss = ();
    my $StrH;
 
    open $FH, '+>', $DATA.$R_MOD .'/tmp.txt';
#   open $FH, '+>', \$StrH; .............
 
    while($txt =~ /^Body:(-++([a-z]{2}(?>-[a-z]{2})?)-++)\s++((?>^(?!\1)\V*+\v*+)++)\1/gm){
        my $str = $3;
        push @poss, $2;
        push @poss, tell $FH;
        my $title = '';
        $str =~ s/<!--#set var="CONTENT_LANGUAGE" value="([^"]++)[^>]++>//;
        $str =~ s/<!--#set var="TITLE" value="([^"]++)[^>]++>/($title = $1), ''/e;
    $str =~ s/<!--#include [^>]++>//g;
    $str =~ s/^\h*+<!--#(else|endif) *-->/###$1/mg;
    $str =~ s/^\h*+<!--#if[^>]*? expr="(?:-n\s*+)?v\(([^\)]++)\)([^"]*+)"[^>]*+>/###if \$ENV{$1}$2/mg;
    $str =~ s/^(.*)<!--#echo[^>]*? var="([^"]++)"[^>]*+>(\V*+)/'$1'.\$ENV{'$2'} .'$3'/mg;
        print $FH $title .$/;
        print $FH $str .'==='.$/;
    }
    seek $FH,0,0;
 
    open my $FH2, '>', $DATA.$R_MOD .'/'. $key .'.txt';
    print $FH2 join(' ', @poss) .$/;
    print $FH2 $_ for(<$FH>);
    close $FH2;
    close $FH;
    @poss = ();
 
    $r->rflush;
}
print '</xmp>';
ShowTpl $TFH;
unlink $DATA.$R_MOD .'/tmp.txt';
Второй модуль типа клиент для этих файлов
Perl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
#use Apache2::RequestRec ('headers_out');
#use Text::XSlate;
use strict;
use warnings;
#=========================
use utf8;
use open ':encoding(utf8)';
binmode(STDOUT, ":utf8");
use List::Util 'first'; # ( ,'uniq');
use List::Util 'first';
 
 
my @Ls = qw'cs de en es fr ga it ja ko nl nb pl pt-br pt ro ru sr sv tr zh-cn zh-tw';
my $NUMS = ' 400 401 403 404 405 408 410 411 412 413 414 415 500 501 502 503 506';
my $fh;
my $LANG;
my @ERRORS = ();
 
sub check_lang_list ($\@$) {
    my ($ALang, $LRef, $default) = @_;
    return $default unless defined $ALang;
    while ($ALang =~ /\b(([a-z]{2})(?>-[a-z]{2})?)\b(?>(?>\s*;\s*q=[.\d]++)?\s*,\s*\2\b)?/ig) {
        my @X = ($1,$2);
        my $M = (first { $_ eq $X[0] } @$LRef) // (first { $_ =~ /^$X[1]/ } @$LRef);
        return $M if ($M);
    }
    $default;
}
sub get_pos {
    my ($L, $txt) = @_;
    while($txt =~ /\G([-a-z]++)\s++(\d++)\s*+/g){
        return $2 if ($1 eq $L);
    }
    push @ERRORS, 'Can\'t find Lang';
    return 0;
}
 
sub Show_file (\$) {
    my $rFH = shift;
    my $F = 0;
    while(readline $$rFH){
#       print '<xmp>'. $_ .'</xmp><hr/>';
        last if /^===/;
        if (/^###(else|(?>end)?if)/p){
            if ($1 eq 'if') {
                $F = 1 unless( eval '('. ${^POSTMATCH} .')');
            }
#           elsif ($1 eq 'elseif') {}
            elsif ($1 eq 'endif') {
                $F = 0;
            }
            else{ #else
                $F ^= 1;
            }
            next;
        }
        elsif ($F){
            next;
        }
        if (/^'/){
            print eval $_;
        }
        else {
            print $_;
        }
    }
}
 
unless (defined $ENV{'HTTP_ACCEPT_LANGUAGE'} || $ENV{'HTTP_ACCEPT_LANGUAGE'} ne ''){
    $LANG = 'en';
}
else {
    $LANG = check_lang_list($ENV{'HTTP_ACCEPT_LANGUAGE'}, @Ls, 'en');
}
if (!$R_ID || index($NUMS, $R_ID)<0){
    $R_ID = '404';
}
$PG_T = $R_ID.' ';
my $F = $DATA .$R_MOD .'/'. $R_ID .'.txt'; ## file to output
    # $PG_T = 'About';
unless (open $fh, '<', $F) {
    push @ERRORS, 'Can\'t open file '.$F;
    $PG_T .= 'Error';
    $R_ID = '404';
}
 
open my $TFH, '<', $FTPL;
 
if($fh){
    my $pos = get_pos($LANG, scalar readline($fh));# fails without 'scalar'
    seek($fh, $pos, 1) if ($pos);
    $PG_T .= readline($fh);
 ShowTpl $TFH;
#   print '<h1>'. $PG_T .'</h1>'.$/;
    print '<p class="warn">';
    Show_file $fh;
    close $fh;
    print '</p>';
}
 
print '<div class="warn">'. $_ .'</div>'.$/ for @ERRORS;
ShowTpl $TFH;
Здесь пока, как-бы совсем, всё печально ,))
Apache[SUP]®[/SUP] 2.4.39 Perl[SUP]®[/SUP] v5.30.0
0.012695
Время выполнения больше чем на нормальной такой странице .)
Но как-бы всё чисто эксперементально, куча eval запускает кучу eval из под mod_perl
В дальнейшем процессе как-бы пытаюсь определить как делать нельзя, и как можно но лучше не делать...

Насчёт "хэш с весами" не знаю что и курить, всякие rfc или списки возможных HTTP_ACCEPT_LANGUAGE
, формат вообще не понимаю, куча [,;] в разных местах и не понятно в каком порядке могут быть q=0.X, которых может не быть.. .) закрадывается мысль что "веса" соотносятся просто с порядком перечисления строк значений, и q добавляют просто чтобы было
0
3 / 2 / 1
Регистрация: 15.02.2019
Сообщений: 5
09.07.2019, 13:20
Лучший ответ Сообщение было отмечено ft4l как решение

Решение

https://developer.mozilla.org/... t-Language
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
09.07.2019, 13:20
Помогаю со студенческими работами здесь

<globalization fileEncoding='utf-8' requestEncoding='utf-8' responseEncoding='utf-8' />
Если в коде пишу строку скажем Response.Write ('Вася дурак') - все срабатывает нормально, а если в &lt;body&gt;&lt;h1&gt;Вася...

Конвертация из ASCII в UTF-32 или UTF-8 в UTF-32
Собсно сабж.

XmlSerializer.Serialize() как поменять кодировку с UTF-16 на UTF-8
Задача серилизовать объект в string, но с кодировкой UTF-8. подзадача - как представить строку как Stream? // VALIDATE ...

Изменить кодировку из utf-8 без bom в просто utf-8
формируется xls фаил в коде прописано response.setContexType(&quot;application/vnd.ms-excel;charset=UTF-8&quot; в эксел документе отображается...

Разные кодировки файлов (ASCII, UTF-8, UTF-16)
Привет всем! Нужно написать программу поиска файлов, содержащих заданную строку. Т.е. пользователь выбирает начальный каталог, задаёт...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru