您的位置 首页 php

PHP处理字符中的emoji表情「判断/移除/存储」

目录

  • 判断字符串中是否含有 emoji 表情
  • 移除字符串中的 emoji 表情
  • 含有 emoji 表情的字符串在 MySQL 中的储存

utf-8 编码 的 emoji 表情或者某些特殊字符占用 4 个字节。utf-8 编码的常用中文字符占用 3 个字节。

一、判断字符串中是否含有 emoji 表情

三个 PHP 内置函数:

  • mb_strlen
 mixed mb_strlen ( string $str [, string $encoding = mb_internal_encoding() ] )
// 返回具有 encoding 编码的字符串 str 包含的字符数。多字节的字符被计为 
1。// 如果给定的 encoding 无效则返回 FALSE。  
  • mb_substr
 string mb_substr ( string $str , int $start [, int $length = NULL [, string $encoding = mb_internal_encoding() ]] )
// 根据字符数执行一个多字节安全的 substr() 操作。 位置是从 str 的开始位置进行计数。 第一个字符的位置是 0。第二个字符的位置是 
1。// mb_substr() 函数根据 start 和 length 参数返回 str 中指定的部分。  
  • strlen
 int strlen ( string $string )// 返回给定的字符串 string 的长度。  

函数如下:

 function haveEmojiChar($str){    
  $mbLen = mb_strlen($str);    
$strArr = [];    for ($i = 0; $i < $mbLen; $i++) {        
  $strArr[] = mb_substr($str, $i, 1, 'utf-8');        
  if (strlen($strArr[$i]) >= 4) {            
    return true;        
  }    
}    
  return false;}  

二、移除字符串中的 emoji 表情

函数如下:

 function removeEmojiChar($str){    
  $mbLen = mb_strlen($str);    
  $strArr = [];    
  for ($i = 0; $i < $mbLen; $i++) {        
    $mbSubstr = mb_substr($str, $i, 1, 'utf-8');        
    if (strlen($mbSubstr) >= 4) {            
      continue;        
    }        
    $strArr[] = $mbSubstr;    
  }    
  return implode('', $strArr);}  

三、含有 emoji 表情的字符串在 MySQL 中的储存

1、MySQL 中使用 utf8mb4 字符集。

2、PHP 对字符串进行 base64 编码,从数据库中取出时再对字符串进行解码。

3、直接移除字符串中的 emoji 表情(该方法简单粗暴)

文章来源:智云一二三科技

文章标题:PHP处理字符中的emoji表情「判断/移除/存储」

文章地址:https://www.zhihuclub.com/79107.shtml

关于作者: 智云科技

热门文章

网站地图