如何获得正确的内容,避免打破html标签使用strip_tags与substr

How to get correctly content and avoid breaking html tags using strip_tags with substr?

本文关键字:标签 html strip substr tags 何获得      更新时间:2023-09-26

在我的页面上,我有一些来自RSS提要的帖子预览。每个帖子预览显示大约300个字符。当用户点击扩展按钮时,#post-preview将被替换为#post。#post显示了文章的其余部分。

一切都很好,但#post的格式不好,不可读。所以我想到允许<br><b><p>标签,它将使它可以被读取。因为我不想让用户分心,所以我想让标签在300个字符之后出现。

使用以下方法,可以在$start结束和$rest开始的地方打破一些标签。这意味着没有好的可读输出。

$start = strip_tags(substr($entry->description, 0, 300));
$rest = strip_tags(substr($entry->description, 300), '<b><p><br>');
$start . $rest;

我的问题是我如何保持$start$rest相同(没有标签),直到300字符,之后$rest将显示格式化的帖子?还有别的方法吗?

这是一个RSS提要结构的示例(来自视图页源)。

<item><guid isPermaLink="false"></guid><pubDate></pubDate><atom:updated></atom:updated><category domain=""></category><title></title><description></description><link></link><author></author></item>

我正在寻找一种不影响性能的方法。

类似于

$start = substr($entry->description, 0, 300);
if(($pos = stripos($start, "<")) !== false) {
    $start = strip_tags(substr($start, 0, $pos));
    $rest = substr($entry->description, $pos);
}
else {
    $start = strip_tags($start);
    $rest = substr($entry->description, 300);
}

好吧,这只是一个概念。获取前300个字符并检查是否有损坏的标记。如果破掉了,在它之前切掉,并从这一点得到$休息。如果没有破裂,就脱衣休息。至少有一个问题:

  • 你永远不会知道$start的长度(在strip_tags之后可能什么都没有留下),可以使用长度检查的循环,但是eeee…效率

编辑好的,得到它:

$start = "";
$chars = 400;
while(strlen($start) < 300) { 
    $start = strip_tags(substr($rss, 0, $chars));
    $chars += 50;
}
$pos = stripos($rss, substr($start, strlen($start) - 50));
$rest = substr($rss, $pos+50);

好吧,有点讨厌,有些情况下它会失败(与重复的文本可能:D),在Ideone上测试