如何使用javascript处理大型html文本页面

How to handle large html text page using javascript?

本文关键字:文本 html 大型 何使用 javascript 处理      更新时间:2023-09-26

我有一个巨大的(大约20mB)html页面,它只不过是纯文本。它是服务器上运行的某些代码的日志文件。现在,我正在尝试编写一个 chrome 插件,当有人打开它时,它会自动解析此页面,并根据我在某些地方的需要添加适当的链接。

页面如下所示

<html><head></head><body><pre> 20mB of pure text </pre></body></html>

所以,两个问题,第二个取决于第一个,这对我有帮助。(到目前为止,我一直在使用纯JavaScript。还没有库。

1) 如何解析页面?2)前3-4行有一些信息。如何轻松获取前几行并从中获取数据(如果解析整个页面并不容易)?

您要解析页面的目的是什么,您是否正在创建摘要?

对于初学者,您可以通过在 pre 标签中添加 id 并执行以下操作来获取前 4 行:

var first4Lines = document.getElementById("theIdTagOfThePre").innerHTML.split("'n",4);如果这不起作用,则必须将"'"切换到"''r'"。