Длина строки mb_strlen , utf-8 и русские буквы

Автор: GIN

понедельник, 21 июня 2010 г.

на 16:54 Ярлыки: php, web

Давайте попробуем вывести рузультаты кода


echo mb_strlen('ффф'); //6
echo mb_strlen('fff'); //3

Все правильно, русские символы занимают 2 байта, а английские 1.
Но нам надо унифицированно проверять длину входящей строки. Ответ прост:


echo mb_strlen('ффф','UTF-8'); //3
echo mb_strlen('fff','UTF-8'); //3

Главное, чтобы входящая строка была действительно в utf-8

14 коммент.:

Анонимный комментирует...: Спасибо большое за такую простую статью! Пол часа бился над проблемой, а решение оказывается такое простое :); 22 сентября 2011 г. в 20:29
Cyrill комментирует...: Не забывайте, что BOM (byte order mark) тоже считается за символы в строке, соответствующим образом изменяя ее длину.; 8 декабря 2011 г. в 21:26
GIN комментирует...: Cyrill, ну именно поэтому все стараются сохранять файлы в UTF-8 без BOM. ); 8 декабря 2011 г. в 21:32
Анонимный комментирует...: спасибо; 4 февраля 2012 г. в 13:54
Анонимный комментирует...: Спасибо.; 25 мая 2012 г. в 13:12
Анонимный комментирует...: Как проверить что строка действительно в UTF-8 ?; 30 июля 2012 г. в 11:24
GIN комментирует...: Для проверки кодировки существует функция mb_detect_encoding; 31 июля 2012 г. в 10:16
Анонимный комментирует...: всем пожалуйста; 3 мая 2013 г. в 15:28
GIN комментирует...: Пожалуйста ); 3 мая 2013 г. в 20:00
Анонимный комментирует...: Огромное Спасибо! Коротко,понятно и главное очень полезно!); 26 июня 2013 г. в 13:39
Анонимный комментирует...: Поздравляю, вы — балбесы.

mb_internal_encoding("UTF-8");

и после этого mb_strlen и прочие начинают работать так, как ДОЛЖНЫ.; 16 января 2014 г. в 11:48
GIN комментирует...: Аноним, а в чем балбесность-то?
Никакого костыля предложено не было, все в порядке. Ваш вариант, конечно же, тоже верный.; 24 января 2014 г. в 02:25
Анонимный комментирует...: Благодарю)); 6 января 2016 г. в 18:12
Анонимный комментирует...: Спасибо!; 15 июня 2016 г. в 11:28

Отправить комментарий

WEB IT blog

Длина строки mb_strlen , utf-8 и русские буквы

понедельник, 21 июня 2010 г.

14 коммент.:

Популярные записи

Теги

Архив блога

WEB IT blog

Длина строки mb_strlen , utf-8 и русские буквы

понедельник, 21 июня 2010 г.

14 коммент.:

Популярные записи

Теги

Архив блога

понедельник, 21 июня 2010 г.