使用正则表达式验证网址

Validate url using regular expression

本文关键字:验证 正则表达式      更新时间:2023-09-26

有人请帮忙。

我正在尝试编写一些正则表达式以在抓取网页时消除文件。我有这样的网址

允许的网址:

http://example.com/about/
http://example.com/test.html
http://example.com/about/careers.html

我需要消除是否有任何页面不是 html/xml 页面,如下面的 URL。

不允许/必需的网址:

http://example.com/download/file_download.tar.gz
http://example.com/download/file.iso
http://example.com/download/something.dll

如何编写正则表达式来消除无效 URL?我正在使用javascript来实现这一点。

我尝试过这样的事情。

URL = 'http://example.com';
filename = URL.substring(URL.lastIndexOf("/")+1, URL.length);
if(filename.match(/^#/g) || filename.match(/#$/g) || filename.match(/[^html]/g) || filename.match(/[^ ]/g)){    // filename contains id, 

使用以下正则表达式过滤您的网址

(((http://)|(http://www.)|(www.))(example.com)(['/A-z]*)((.html)|(.xml))*)

试试这样/^(.*(?:'/|html|htm|php|xml))'s*$/

if (filename.match(/^(.*(?:'/|html|htm|php|xml))'s*$/)) {
    // yupp, it's ok
}