




班级通信录导入时大小写导致数据不一致,因PHP默认字符串比较和数据库utf8mb4_bin排序规则均区分大小写,易引发重复录入、关联失败;须在PHP层用mb_strtolower统一转小写并trim预处理,同时注意Excel合并单元格、全角空格及数字类型转换问题。
班级通信录里常见“张三”“张san”“ZHANGSAN”混用,PHP默认字符串比较(如 in_array()、array_key_exists())是大小写敏感的,直接查重或匹配会把同一人当成不同用户。数据库字段若设为 VARCHAR 且排序规则是 utf8mb4_bin,WHERE 查询也区分大小写——结果就是重复录入、关联失败、导出名单漏人。
不是所有场景都适合改数据库 collation 或加 LOWER() 函数做查询,尤其导入阶段要快速去重、合并、校验。统一在 PHP 层转小写,能确保逻辑可控、兼容旧环境、避免 SQL 注入风险(比如拼接字段名时误用大小写变量)。
mb_strtolower($str, 'UTF-8') 替代 strtolower(),防止中文、数字、符号乱码(如“李四-LiSi”变成“li?si”)CS202A vs cs202a)需先确认业务规则再决定是否转换array_map(fn($v) => mb_strtolower(trim($v), 'UTF-8'), $row)
用 PhpSpreadsheet 读取 Excel 后,$cell->getValue() 返回的字符串可能带不可见空格或全角空格,strtolower() 对它无效,导致“王五 ”和“王五”被当成两人。更隐蔽的是 Excel 单元格格式设为“文本”但内容实际是数字(如学号 2025001),PHP 读出来是 float 类型,转小写会报 Warning 并返回 "float" 字符串。
is_string() 判断类型,非字符串则强转:(string)$cell->getValue()
preg_replace('/[\s\u{3000}]+/u', '', $str) 清除全半角空格,再 trimstr_pad((string)$val, 8, '0', STR_PAD_LEFT) 补零对齐,避免 "123" 和 "00000123" 匹配失败即使 PHP 层做了 strtolower,如果数据库字段定义没约束,下次从 DB 查出来仍是原始大小写,后续导出或接口返回又会混乱。这不是 PHP 能单方面解决的问题。
COLLATE utf8mb4_unicode_ci(ci = case-insensitive),而非 _bin
INSERT ... ON DUPLICATE KEY UPDATE 时,UNIQUE 索引字段(如 email)必须确保索引本身不区分大小写,否则 user@A.com 和 user@a.com 会被同时插入error_log("raw: {$raw}, lower: " . mb_strtolower($raw, 'UTF-8'));,比 var_dump 更快定位哪一行没转成功PhpSpreadsheet 对合并单元