PHP将HTML转换成文本一些方法总结
发布:smiling 来源: PHP粉丝网 添加日期:2014-01-07 16:27:32 浏览: 评论:0
在php中html转换成文本提供了自带的函数strip_tags了,但有时此函数不够用,下面总结了一些用户自定的函数,各位可参考.
最常用的使用php函数strip_tags,代码如下:
- <?php
- $mystr=<<<SATO
- 此处省略几十行HTML代码^_^
- SATO;
- $str=strip_tags($mystr);
- //到这里就已经达到我的HTML转为TXT文本的目的了,哈哈,使用这个函数真方便
- //下面是插件的一些切词等操作,这里就不多说了
- ?>
自定义函数,代码如下:
- <?php
- // $document 应包含一个 HTML 文档。
- // 本例将去掉 HTML 标记,javascript 代码
- // 和空白字符。还会将一些通用的
- // HTML 实体转换成相应的文本。
- $search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
- "'<[/!]*?[^<>]*?>'si", // 去掉 HTML 标记
- "'([rn])[s]+'", // 去掉空白字符
- "'&(quot|#34);'i", // 替换 HTML 实体
- "'&(amp|#38);'i",
- "'&(lt|#60);'i",
- "'&(gt|#62);'i",
- "'&(nbsp|#160);'i",
- "'&(iexcl|#161);'i",
- "'&(cent|#162);'i",
- "'&(pound|#163);'i",
- "'&(copy|#169);'i",
- "'&#(d+);'e"); // 作为 PHP 代码运行
- $replace = array ("",
- "",
- "\1",
- """,
- "&",
- "<",
- ">",
- " ",
- chr(161),
- chr(162),
- chr(163),
- chr(169),
- "chr(\1)");
- $text = preg_replace ($search, $replace, $document);
- ?>
后来我从网上看到了一个使用PHP写的方法,使用这个方法也可以实现将HTML转为TXT文本,个人觉得也还蛮实用的,在这里分享一下,代码如下:
- function HtmlToText($str){
- $str=preg_replace("/<sty(.*)/style>|<scr(.*)/script>|<!--(.*)-->/isU","",$str);//去除CSS样式、JS脚本、HTML注释
- $alltext="";//用于保存TXT文本的变量
- $start=1;//用于检测<左、>右标签的控制开关
- for($i=0;$i<strlen($str);$i++){//遍历经过处理后的字符串中的每一个字符
- if(($start==0)&&($str[$i]==">")){//如果检测到>右标签,则使用$start=1;开启截取功能
- $start=1;
- }else if($start==1){//截取功能
- if($str[$i]=="<"){//如果字符是<左标签,则使用<font color='red'>|</font>替换
- $start=0;
- $alltext.="<font color='red'>|</font>";
- }else if(ord($str[$i])>31){//如果字符是ASCII大于31的有效字符,则将字符添加到$alltext变量中
- $alltext.=$str[$i];
- }
- }
- }
- //下方是去除空格和一些特殊字符的操作
- $alltext = str_replace(" "," ",$alltext);
- $alltext = preg_replace("/&([^;&]*)(;|&)/","",$alltext);
- $alltext = preg_replace("/[ ]+/s"," ",$alltext);
- return $alltext;
- }
使用下面这个方法也可以实现将简答的HTML代码转换为TXT文本,实例代码如下:
- function html2text($str,$encode = 'GB2312')
- {
- $str = preg_replace("/<style .*?</style>/is", "", $str);
- $str = preg_replace("/<script .*?</script>/is", "", $str);
- $str = preg_replace("/<br s*/?/>/i", "n", $str);
- $str = preg_replace("/</?p>/i", "nn", $str);
- $str = preg_replace("/</?td>/i", "n", $str);
- $str = preg_replace("/</?div>/i", "n", $str);
- $str = preg_replace("/</?blockquote>/i", "n", $str);
- $str = preg_replace("/</?li>/i", "n", $str);
- $str = preg_replace("/ /i", " ", $str);
- $str = preg_replace("/ /i", " ", $str);
- $str = preg_replace("/&/i", "&", $str);
- $str = preg_replace("/&/i", "&", $str);
- $str = preg_replace("/</i", "<", $str);
- $str = preg_replace("/</i", "<", $str);
- $str = preg_replace("/“/i", '"', $str);
- $str = preg_replace("/&ldquo/i", '"', $str);
- $str = preg_replace("/‘/i", "'", $str);
- $str = preg_replace("/&lsquo/i", "'", $str);
- $str = preg_replace("/’/i", "'", $str);
- $str = preg_replace("/&rsquo/i", "'", $str);
- $str = preg_replace("/>/i", ">", $str);
- $str = preg_replace("/>/i", ">", $str);
- $str = preg_replace("/”/i", '"', $str);
- $str = preg_replace("/&rdquo/i", '"', $str);
- $str = strip_tags($str);
- $str = html_entity_decode($str, ENT_QUOTES, $encode);
- $str = preg_replace("/&#.*?;/i", "", $str);
- return $str;
- }
Tags: HTML 转换成 文本
相关文章
- ·php 去掉指定的html标签及内容(2014-01-06)
- ·PHP移除指定HTML标签方法总结(2014-01-07)
- ·php把文本框回车转换成html换行(2014-01-14)
- ·php html格式转文本格式代码(2014-01-16)
- ·PHP清除指定html标签实例代码(2014-06-19)
- ·php把html标签转换成合法html代码程序(2014-08-17)
- ·php完美过滤HTML代码的函数(2014-08-21)
- ·php过滤网站敏感关键词例子(2014-08-21)
- ·php html过滤代码,预定义的字符转换为HTML实体(2014-08-25)
- ·php符转换为HTML实体(2014-08-25)
- ·php过滤危险html函数代码(2014-08-25)
- ·php清空字符串中的HTML标签(2014-08-25)
- ·php sql防注入以及 html 过滤安全函数(2014-08-25)
- ·PHP Mail函数发送html格式邮件(2014-09-12)
- ·php中htmlspecialchars,htmlentities用法(2014-09-14)
- ·利用php中mail函数发送HTML邮件实例(2014-09-14)
推荐文章
热门文章
最新评论文章
- 写给考虑创业的年轻程序员(10)
- PHP新手上路(一)(7)
- 惹恼程序员的十件事(5)
- PHP邮件发送例子,已测试成功(5)
- 致初学者:PHP比ASP优秀的七个理由(4)
- PHP会被淘汰吗?(4)
- PHP新手上路(四)(4)
- 如何去学习PHP?(2)
- 简单入门级php分页代码(2)
- php中邮箱email 电话等格式的验证(2)