当前位置:首页 > PHP教程 > php应用 > 列表

PHP实现UTF-8文件BOM自动检测与移除实例

发布:smiling 来源: PHP粉丝网  添加日期:2021-04-24 14:05:47 浏览: 评论:0 

这篇文章主要介绍了PHP实现UTF-8文件BOM自动检测与移除的方法,实例讲述了UTF-8文件BOM信息的原理与PHP对此的检测与删除方法,是非常实用的技巧,需要的朋友可以参考下

本文实例讲述了PHP实现UTF-8文件BOM自动检测与移除的方法。分享给大家供大家参考。具体实现方法如下:

BOM信息是文件开头的一串隐藏的字符,用于让某些编辑器识别这是个UTF-8编码的文件。但PHP在读取文件时会把这些字符读出,从而形成了文件 开头含有一些无法识别的字符的问题。

比如用UTF-8格式保存的生成图片的PHP文件,因为文件头隐藏的BOM信息也被下发,导致生成的 图片数据不对,浏览器无法识别。

要检测一个UTF-8文件是否含有BOM信息,就是检测文件开头的字三个符,是否为0xEF, 0xBB, 0xBF。下面这个小程序,用户遍历某个目录下所有文件,并检测是否加了BOM,代码如下:

  1. <?php 
  2. //此文件用于快速测试UTF8编码的文件是不是加了BOM,并可自动移除 
  3. //By Bob Shen 
  4. $basedir="."//修改此行为需要检测的目录,点表示当前目录 
  5. $auto=1; //是否自动移除发现的BOM信息。1为是,0为否。 
  6.  
  7. //以 下不用改动 
  8.  
  9. if ($dh = opendir($basedir)) { 
  10. while (($file = readdir($dh)) !== false) { 
  11. if ($file!='.' && $file!='..' && !is_dir($basedir."/".$file)) echo "filename: $file ".checkBOM("$basedir/$file")." <br>"
  12. closedir($dh); 
  13.  
  14. function checkBOM ($filename) { 
  15. global $auto
  16. $contents=file_get_contents($filename); 
  17. $charset[1]=substr($contents, 0, 1); 
  18. $charset[2]=substr($contents, 1, 1); 
  19. $charset[3]=substr($contents, 2, 1); 
  20. if (ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191) { 
  21. if ($auto==1) { 
  22. $rest=substr($contents, 3); 
  23. rewrite ($filename$rest); 
  24. return ("<font color=red>BOM found, automatically removed.</font>"); 
  25. else { 
  26. return ("<font color=red>BOM found.</font>"); 
  27. else return ("BOM Not Found."); 
  28.  
  29. function rewrite ($filename$data) { 
  30. $filenum=fopen($filename,"w"); 
  31. flock($filenum,LOCK_EX); 
  32. fwrite($filenum,$data); 
  33. fclose($filenum); 

将以上代码另存为del_bom.php,修改需要检测的目录后运行。这样可能有助于检测是哪个文件带有了BOM信息导致所有页面开头都有 那么一段空白。

把下面 代码保存为 bom.php  记得保存为 utf8 格式,代码如下:

  1. <meta http-equiv="Content-Type" content="text/html; charset=utf-8"
  2. <h3><?echo $_POST["dir"];?>目录下的检测结果</h3> 
  3. <?php 
  4. //此文件用于快速测试UTF8编码的文件是 不是加了BOM,并可自动移除 
  5. //By bob 老大 
  6. //风吟修改 
  7. $目录= str_replace(" ""|"$_POST["dir"]);//接受提交的路径数据 
  8. $basedir="$目录"//修改此行为需要检测的目录,点表示当前目录 
  9. $auto=1; //是否自动移除发现的BOM信息。1为是,0为否。 
  10. //以下不用改动 
  11. if ($dh = opendir($basedir)) { 
  12. while (($file = readdir($dh)) !== false) { 
  13. if ($file!='.' && $file!='..' && !is_dir($basedir."/".$file)) echo "filename: $file ".checkBOM("$basedir/$file")." <br>"
  14. closedir($dh); 
  15. function checkBOM ($filename) { 
  16. global $auto
  17. $contents=file_get_contents($filename); 
  18. $charset[1]=substr($contents, 0, 1); 
  19. $charset[2]=substr($contents, 1, 1); 
  20. $charset[3]=substr($contents, 2, 1); 
  21. if (ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191) { 
  22. if ($auto==1) { 
  23. $rest=substr($contents, 3); 
  24. rewrite ($filename$rest); 
  25. return ("<font color=red>--Bom 已经清除完毕。</font>"); 
  26. else { 
  27. return ("<font color=red>--Bom found.</font>"); 
  28. else return ("--没有检查到Bom."); 
  29. function rewrite ($filename$data) { 
  30. $filenum=fopen($filename,"w"); 
  31. flock($filenum,LOCK_EX); 
  32. fwrite($filenum,$data); 
  33. fclose($filenum); 
  34. }//www.phpfensi.com 
  35. ?> 
  36. <form action="" method="POST"
  37. 目录: <input type="text" name="dir" /> 
  38. <input type="submit" value="检测目录" > 
  39. </form> 
  40. 请 输入文件夹名比如 plugin/fanfou 后面不需要加/。如果要检测根目录输入“ . ”  . 是小数点 提交既可 
  41. </br> 

希望本文所述对大家的PHP程序设计有所帮助。

Tags: UTF-8 PHP自动检测

分享到: