是否有任何方法可以从HTML文档中删除javascript代码?
Is there any method to remove javascript code from an HTML document?
我想从HTML文档中删除所有javascript代码,并留下实际的文本。是否有任何正则表达式或python脚本来做到这一点?谢谢。
Using BeautifulSoup:
#!/usr/bin/env python
from BeautifulSoup import BeautifulSoup
with open("with-scripts.html", "r") as f:
soup = BeautifulSoup(f.read())
for script in soup("script"):
script.extract()
with open("without-scripts.html", "w") as f:
f.write(soup.prettify())
你可以写一个正则表达式来查找'<script'
和'script>'
,并且做得很好。
编辑:正如@cHao指出的那样- Regex在解析HTML时很糟糕。
Regex在完全控制HTML的地方可能仍然有用。
你可以使用这个jQuery代码来删除:
$(javascript).html('')
和Firebug将jQuery代码注入到网页中:
>>> var x = window.open("");
Window opened
>>> x
Window about:blank
>>> x.document
Document about:blank
>>> x.document.write("$(javascript).html('')");
Alert popped up
相关文章:
- 删除“;NaN”;来自HTML文档
- 如何筛选要写入新文档的HTML,删除JavaScript中的某些类和/或ID
- 从 MonogDB 中删除具有特定密钥计数的文档
- MongoDB 删除重复的子文档
- 如何使用文档的ID从mongoDB集合中删除文档
- 查找文档,然后在数组中查找条目并将其从数组中删除
- 如何删除MongoDB中的文档和所有嵌入文档
- 无论如何都要获取文档.在不删除整个页面的情况下写入即可工作
- 如何删除猫鼬中的特定子文档
- 可以't通过Express路由从Mongodb中删除文档
- 在文档中搜索文本以删除的文本超过找到它的标签
- 如何使用vanillaJS将mp4视频插入到具有特定维度的html文档中,播放2秒,然后删除节点
- 从Express,Node.js应用程序中删除MongoDB文档
- 使用 OR 条件删除带有猫鼬的 MongoDB 中的文档
- 如何删除创建的创建文档片段对象
- 如果当前日期>文档日期,如何删除文档
- 如何使用猫鼬从集合中删除所有文档
- 如何使用 ExtendScript 从 InDesign 文档的所有脚注引用中删除斜体和粗体样式
- JQuery 文档单击取消绑定将删除所有子单击事件
- j查询文档删除键