使用正则表达式验证网址
Validate url using regular expression
有人请帮忙。
我正在尝试编写一些正则表达式以在抓取网页时消除文件。我有这样的网址
允许的网址:
http://example.com/about/
http://example.com/test.html
http://example.com/about/careers.html
我需要消除是否有任何页面不是 html/xml 页面,如下面的 URL。
不允许/必需的网址:
http://example.com/download/file_download.tar.gz
http://example.com/download/file.iso
http://example.com/download/something.dll
如何编写正则表达式来消除无效 URL?我正在使用javascript来实现这一点。
我尝试过这样的事情。
URL = 'http://example.com';
filename = URL.substring(URL.lastIndexOf("/")+1, URL.length);
if(filename.match(/^#/g) || filename.match(/#$/g) || filename.match(/[^html]/g) || filename.match(/[^ ]/g)){ // filename contains id,
使用以下正则表达式过滤您的网址
(((http://)|(http://www.)|(www.))(example.com)(['/A-z]*)((.html)|(.xml))*)
试试这样/^(.*(?:'/|html|htm|php|xml))'s*$/
if (filename.match(/^(.*(?:'/|html|htm|php|xml))'s*$/)) {
// yupp, it's ok
}
相关文章:
- 为什么浏览器为电子邮件验证正则表达式显示不同的反斜杠.如何防止这种情况发生
- 将电子邮件验证正则表达式字符串存储在JSON中
- 即使验证正则表达式错误,也提交表单
- 搜索验证正则表达式在 JavaScript 中不起作用
- MMM dd-yyyy验证正则表达式
- 带有自定义约束的电话号码验证正则表达式
- 如何使用Ruby'在JavaScript中验证正则表达式;的规则
- 真实世界URL的URL验证正则表达式
- 需要与以下标准匹配的特定英国电话验证正则表达式
- 活体验证-正则表达式问题
- 数字验证正则表达式
- 电子邮件验证正则表达式在连字符上失败
- 通过不显眼的验证正则表达式识别有效的youtube url在MVC 3中不起作用
- 需要一个允许所有特殊字符的密码验证正则表达式
- javascript中的MM/DD/YYYY HH:MM:SS AM/PM日期验证正则表达式
- 优化用户名验证正则表达式的前瞻性
- 数学方程验证正则表达式的javascript
- 如何在javascript中验证正则表达式
- 为什么我的日期验证正则表达式不能识别二月(和其他日期)?
- 试图获得“;完美URL验证正则表达式”;使用ruby和javascript