PHP实现UTF-8文件BOM自动检测与移除实例
发布:smiling 来源: PHP粉丝网 添加日期:2021-04-24 14:05:47 浏览: 评论:0
这篇文章主要介绍了PHP实现UTF-8文件BOM自动检测与移除的方法,实例讲述了UTF-8文件BOM信息的原理与PHP对此的检测与删除方法,是非常实用的技巧,需要的朋友可以参考下
本文实例讲述了PHP实现UTF-8文件BOM自动检测与移除的方法。分享给大家供大家参考。具体实现方法如下:
BOM信息是文件开头的一串隐藏的字符,用于让某些编辑器识别这是个UTF-8编码的文件。但PHP在读取文件时会把这些字符读出,从而形成了文件 开头含有一些无法识别的字符的问题。
比如用UTF-8格式保存的生成图片的PHP文件,因为文件头隐藏的BOM信息也被下发,导致生成的 图片数据不对,浏览器无法识别。
要检测一个UTF-8文件是否含有BOM信息,就是检测文件开头的字三个符,是否为0xEF, 0xBB, 0xBF。下面这个小程序,用户遍历某个目录下所有文件,并检测是否加了BOM,代码如下:
- <?php
- //此文件用于快速测试UTF8编码的文件是不是加了BOM,并可自动移除
- //By Bob Shen
- $basedir="."; //修改此行为需要检测的目录,点表示当前目录
- $auto=1; //是否自动移除发现的BOM信息。1为是,0为否。
- //以 下不用改动
- if ($dh = opendir($basedir)) {
- while (($file = readdir($dh)) !== false) {
- if ($file!='.' && $file!='..' && !is_dir($basedir."/".$file)) echo "filename: $file ".checkBOM("$basedir/$file")." <br>";
- }
- closedir($dh);
- }
- function checkBOM ($filename) {
- global $auto;
- $contents=file_get_contents($filename);
- $charset[1]=substr($contents, 0, 1);
- $charset[2]=substr($contents, 1, 1);
- $charset[3]=substr($contents, 2, 1);
- if (ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191) {
- if ($auto==1) {
- $rest=substr($contents, 3);
- rewrite ($filename, $rest);
- return ("<font color=red>BOM found, automatically removed.</font>");
- } else {
- return ("<font color=red>BOM found.</font>");
- }
- }
- else return ("BOM Not Found.");
- }
- function rewrite ($filename, $data) {
- $filenum=fopen($filename,"w");
- flock($filenum,LOCK_EX);
- fwrite($filenum,$data);
- fclose($filenum);
- }
将以上代码另存为del_bom.php,修改需要检测的目录后运行。这样可能有助于检测是哪个文件带有了BOM信息导致所有页面开头都有 那么一段空白。
把下面 代码保存为 bom.php 记得保存为 utf8 格式,代码如下:
- <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
- <h3><?echo $_POST["dir"];?>目录下的检测结果</h3>
- <?php
- //此文件用于快速测试UTF8编码的文件是 不是加了BOM,并可自动移除
- //By bob 老大
- //风吟修改
- $目录= str_replace(" ", "|", $_POST["dir"]);//接受提交的路径数据
- $basedir="$目录"; //修改此行为需要检测的目录,点表示当前目录
- $auto=1; //是否自动移除发现的BOM信息。1为是,0为否。
- //以下不用改动
- if ($dh = opendir($basedir)) {
- while (($file = readdir($dh)) !== false) {
- if ($file!='.' && $file!='..' && !is_dir($basedir."/".$file)) echo "filename: $file ".checkBOM("$basedir/$file")." <br>";
- }
- closedir($dh);
- }
- function checkBOM ($filename) {
- global $auto;
- $contents=file_get_contents($filename);
- $charset[1]=substr($contents, 0, 1);
- $charset[2]=substr($contents, 1, 1);
- $charset[3]=substr($contents, 2, 1);
- if (ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191) {
- if ($auto==1) {
- $rest=substr($contents, 3);
- rewrite ($filename, $rest);
- return ("<font color=red>--Bom 已经清除完毕。</font>");
- } else {
- return ("<font color=red>--Bom found.</font>");
- }
- }
- else return ("--没有检查到Bom.");
- }
- function rewrite ($filename, $data) {
- $filenum=fopen($filename,"w");
- flock($filenum,LOCK_EX);
- fwrite($filenum,$data);
- fclose($filenum);
- }//www.phpfensi.com
- ?>
- <form action="" method="POST">
- 目录: <input type="text" name="dir" />
- <input type="submit" value="检测目录" >
- </form>
- 请 输入文件夹名比如 plugin/fanfou 后面不需要加/。如果要检测根目录输入“ . ” . 是小数点 提交既可
- </br>
希望本文所述对大家的PHP程序设计有所帮助。
Tags: UTF-8 PHP自动检测
相关文章
- ·php utf-8转换gb2312 字符串被截断解决方法(2013-11-29)
- ·PHP utf-8和gb2312编码转换乱码的问题(2013-12-02)
- ·php json_encode utf-8中文问题(2014-01-12)
- ·php识别中文编码并自动转换为UTF-8(2014-08-26)
- ·UTF-8编码怎么去掉BOM头?(2014-09-21)
- ·php中json_encode UTF-8中文乱码问题(2015-04-04)
- ·php怎么把unicode编码转为utf-8编码(2015-04-08)
- ·PHP 正则判断中文UTF-8或GBK的思路及具体实现(2020-07-06)
- ·正确的PHP匹配UTF-8中文的正则表达式(2021-05-26)
- ·UTF-8正则表达式如何匹配汉字(2021-06-15)
- ·php页面,mysql数据库转utf-8乱码,utf-8编码问题总结(2021-06-16)
- ·PHP页面转UTF-8中文编码乱码的解决办法(2021-06-20)
推荐文章
热门文章
最新评论文章
- 写给考虑创业的年轻程序员(10)
- PHP新手上路(一)(7)
- 惹恼程序员的十件事(5)
- PHP邮件发送例子,已测试成功(5)
- 致初学者:PHP比ASP优秀的七个理由(4)
- PHP会被淘汰吗?(4)
- PHP新手上路(四)(4)
- 如何去学习PHP?(2)
- 简单入门级php分页代码(2)
- php中邮箱email 电话等格式的验证(2)