Как посчитать количество символов на PHP
В силу рабочих процессов, мне часто приходится заниматься копирайтингом, что обычно подразумевает использование различных сервисов для анализа текста, в том числе и платных. Я думаю, что можно основные инструменты для копирайтинга, такие как “подсчет количества символов” и “подсчет количества слов”, а также подобные задачи, решить с помощью простого PHP скрипта.
Начнем с задачи “как посчитать количество символов на PHP”, ведь это наиболее важно при оптимизации текста.
Создание формы
Скрипт будет работать с текстом пользователя, а соответственно первым делом необходимо создать поле для ввода текста.
Создаём на локальном сервере файл index.php и пишем в него:
Получается вот такая простенькая форма – как раз то, что нам нужно.
1. Как посчитать количество символов на PHP
Чтобы посчитать количество символов на php, насколько я помню, необходимо использовать функции strlen(). Добавим её в наш код:
Пробуем, вводим «1111», получаем:
Вроде бы работает, пробуем «qwerty», получаем:
Неплохо! И последний контрольный, пробуем «Привет», получаем:
И снова, довольные, получаем количество символов…12…стоп! П-р-и-в-е-т – 6 букв, что-то не так.
Давайте разбираться! Оказывается, причина такого расхождения в том, что функция strlen() считает длину строки в байтах, а не в символах, а размер кириллических символов в UTF-8: по 2 байта вместо 1 для латинских, этого то я и не учёл.
Для того, чтобы правильно посчитать количество русских символов на php, необходимо использовать функцию mb_strlen() и не забыть указать кодировку:
<form name="text-form" method="post"> <textarea name="text" cols="80" rows="6"></textarea> <br/> <input type="submit" value="Отправить"/> <input type="reset" value="Очистить"/> </form> <?php $text = $_POST [ 'text' ] ; echo 'Количество символов с пробелами: ' , mb_strlen ( $text , 'utf-8' ) ; ?> //Функция mb_strlen() правильно считает количество кириллических символов </body>
Пробуем ещё раз с помощью php посчитать количество символов в слове «привет»:
Вот теперь всё верно!
2. Как посчитать количество символов без пробелов на PHP
Теперь давайте попробуем посчитать количество символов не считая пробелы, для этого используем функцию обработки строк str_replace( ):
Пишем текст «Привет мир!»
3. Как сделать, чтобы форма не очищалась после отправки
Идём дальше, как мне кажется, не совсем удобно, что текст из формы пропадает после нажатия на кнопку «Отправить». Давайте попробуем это исправить.
Для этого нам нужно, чтобы при загрузке формы проверялось, есть ли значение в Post и, если есть, подставлялось в форму.
Получилось вот так:
<body> <form name="text-form" method="post"> <textarea name="text" cols="80" rows="6"> <?php if ( isset ( $_POST [ 'text' ] ) ) echo $_POST [ 'text' ] ; else echo "Введите текст" ; ?> </textarea> //Определяется, была ли установлена переменная $_POST['text'], если да, выводит её значение, если нет, выводит “Введите текст”
<br/> <input type="submit" value="Отправить"/> <input type="reset" value="Очистить"/> </form> <?php $text = $_POST [ 'text' ] ; $text_nonspace = str_replace ( array ( " " ) , '' , $text ) ; echo 'Количесвто символов с пробелом: ' , mb_strlen ( $text , 'utf-8' ) ; echo '<br/>' , 'Количество символов без пробела: ' , mb_strlen ( $text_nonspace , 'utf-8' ) ; ?> </body>
4. Как посчитать количество слов на PHP
Функционал всё растёт, код всё увеличивается. Что дальше? Как посчитать количество символов на php, мы разобрались, теперь давайте попробуем посчитать количество слов.
Сначала мне пришла в голову мысль, что это можно реализовать просто посчитав все пробелы в тексте, но, как оказалось, PHP нам предлагает готовую функцию — str_word_count().
Однако, и тут всё не так просто, как кажется — попробовав функцию в деле, я обнаружил, что она тоже не умеет работать с кириллицей. Не долго думая я написал
str_word_count($text, ‘utf-8’), но функция совсем перестала работать.
Погуглив, я узнал, что заставить функцию работать правильно можно только прописав в charlist все кириллические символы, причём и верхним и нижним регистром. Что такое charlist? Сейчас объясню.
Функция str_word_count() имеет 3 параметра:
- String – строка. Обязательный параметр, переменная с текстом.
- Format — Указывает возвращаемое значение данной функции.
- 0 — возвращает количество найденных слов
- 1 — возвращается массив, содержащий все слова, входящие в строку string
- 2 — возвращается массив, индексами которого являются позиции в строке string, а знач ениями — соответствующие слова.
- Charlist — Список дополнительных символов, которые будут рассматриваться как «слово».
Синтаксис такой: str_word_count(String, format, ‘charlist’), например, str_word_count($text, 0, ‘абв‘).
Таким образом, наша функция должна выглядеть так:
str_word_count($str,0,»АаБбВвГгДдЕеЁёЖжЗзИиЙйКкЛлМмНнОоПпРрСсТтУуФфХхЦцЧчШшЩщЪъЫыЬьЭэЮюЯя»)
Немного подумав, можно укоротить эту строчку. В таблице ASCII все русские буквы (кроме «Ё» и «ё») имеют коды с 192 по 256. Также, у нас есть функция chr(), которая возвращает символ по его коду. Можно сделать простой цикл, который сам запишет в переменную буквы русского алфавита. Понадобится ещё функция iconv(), чтобы перевести текст из кодировки utf-8 в cp1251, так как в utf-8 другие коды символов.
Получилось не намного короче, зато более логично. Мы же всё таки программированием занимаемся. В итоге наш код будет выглядеть так:
<body> <form name="text-form" method="post"> <textarea name="text" cols="80" rows="6"> <?php if ( isset ( $_POST [ 'text' ] ) ) echo $_POST [ 'text' ] ; else echo "Введите текст" ; ?> </textarea> <br/> <input type="submit" value="Отправить"/> <input type="reset" value="Очистить"/> </form> <?php $text = $_POST [ 'text' ] ; $text_nonspace = str_replace ( array ( " " ) , '' , $text ) ; echo 'Количество символов с пробелами: ' , mb_strlen ( $text , 'utf-8' ) ; echo '<br/>' , 'Количество символов без пробелов: ' , mb_strlen ( $text_nonspace , 'utf-8' ) ; for ( $i = 192 ; $i < 256 ; $i ++ ) { $abc .= chr ( $i ) ; } $abc = iconv ( 'cp1251' , 'utf-8' , $abc ) ; echo '<br/>' , 'Количество слов в тексте: ' , str_word_count ( $text , 0 , $abc ) ;
В браузере же это выглядит вот так:
На сегодня всё, теперь вы легко можете посчитать количество символов на PHP. Если всё-таки у вас остались вопросы – не стесняйтесь, задавайте в комментариях, отвечу всем.