




应使用正则/^1[3-9]\d{9}$/校验手机号,始终以字符串处理、trim()去空格、清理不可见字符,用PhpSpreadsheet读取Excel,PHP层预检重复并分批查库。
preg_match 做基础格式过滤直接读取 Excel 或 CSV 后逐行校验手机号,别等全部入库再报错。国内手机号目前以 13x、14x、15x、17x、18x、19x 开头,长度固定 11 位,且第二位不能是 0 或 1(如 130~139、150~159 等有效,1300 这种超长或 1234567890 这种非号段都应拦截)。
推荐正则:/^1[3-9]\d{9}$/ —— 覆盖当前主流号段,比 /^1\d{10}$/ 更精准,能提前筛掉已停用或未分配的号段(如 144、147 中部分号段实际归属物联网卡)。
常见疏漏:
trim() 去首尾空格,导致 " 13812345678" 匹配失败1.3812345678E+10),需强制转字符串再校验\u200b),建议用 preg_replace('/[\s\p{C}]+/u', '', $phone) 清理filter_var($phone, FILTER_VALIDATE_INT) 不靠谱FILTER_VALIDATE_INT 是用来验整数的,不是验手机号。11 位数字超出 PHP 32 位整型上限(约 21 亿),在某些环境会自动转成浮点或截断,13812345678 可能变成 13812345678.0 或科学计数,校验直接失败。
正确做法始终当字符串处理:
fgetcsv() 或 PhpSpreadsheet 读出后,立刻 (string)$cellValue
intval()、settype($phone, 'int') 转类型VARCHAR(11) 存,别用 INT 或 BIGINT —— 手机号本质是标识符,不是数值导入班级通信录常遇到“同班两人填了同一个号码”或“该号码已在其他班级存在”。如果只靠数据库 UNIQUE(phone) 报错,用户看到的是 SQL 异常,没法定位到第几行、谁和谁重复。
建议流程:
array_unique() 对当前批次去重(注意:要 array_map('trim', $phones) 后再去重)WHERE phone IN (".implode(',', array_map(fn($p) => "'$p'", $cleanPhones))."),取出已存在的号码及对应学生姓名/班级
注意:IN 子句别一次性塞几千个值,分批查(如每 500 个一批),否则 MySQL 可能报 max_allowed_packet 错误。
file_get_contents 读 Excel 容易乱码,优先用 PhpSpreadsheet
用 file_get_contents + 正则硬解析 Excel 文件,基本等于自找麻烦 —— Excel 是二进制格式(.xlsx)或 XML 套壳(.xls),不是纯文本。常见问题包括:
姓名 → å§å),因没指定编码或没解压 XML=A1+B1 而非计算值)轻量级方案:装 phpoffice/phpspreadsheet,代码极简:
use PhpOffice\PhpSpreadsheet\IOFactory;
$spreadsheet = IOFactory::load($filePath);
$sheet = $spreadsheet->getActiveSheet();
foreach ($sheet->getRowIterator() as $row) {
$cellIterator = $row->getCellIterator();
$cellIterator->setIterateOnlyExistingCells(false);
foreach ($cellIterator as $cell) {
$value = $cell->getFormattedValue(); // 自动处理日期、数字、字符串
// 校验手机号逻辑放这里
}
}
真正容易被忽略的是:默认 getFormattedValue() 可能返回带空格的字符串,而 getValue() 在数字列可能返回 float,务必按需选择,并在后续统一 trim() 和类型判断。