图像属性的JavaScript正则表达式
JavaScript regex for image attribute
我正试图从以下页面获取图像URL:
http://www.amazon.co.uk/The-Classics-3xCD-Box-Set/dp/B000W3Q4X2/ref=sr_1_fkmr0_1/277-3029293-0823745?ie=UTF8&qid=1410727619&sr=8-1-fkmr0&keywords=Classic+Euphoria+3xCD+Box+Chicane+Hybrid+++P%26P
http://www.amazon.co.uk/Hinari-HIN172-Digital-Steam-Generator/dp/B00472M9S8/ref=sr_1_fkmr0_1/280-9070877-0582850?ie=UTF8&qid=1410725454&sr=8-1-fkmr0&keywords=Hinari+HIN172+2500+W+Digital+Steam+Generator+BOXED
该图像可以在imgTagWrapperId
分区内的img
标签的data-a-dynamic-image
属性中找到
最终图像应返回为:
http://ecx.images-amazon.com/images/I/81Vi7ECR9hL.jpg
例如,应将_SX522_
从http://ecx.images-amazon.com/images/I/81Vi7ECR9hL._SX522_.jpg
的原始图像URL中删除
我只需要从源中返回一个图像。
$html=file_get_contents('http://www.amazon.co.uk/The-Classics-3xCD-Box-Set/dp/B000W3Q4X2/ref=sr_1_fkmr0_1/277-3029293-0823745?ie=UTF8&qid=1410727619&sr=8-1-fkmr0&keywords=Classic+Euphoria+3xCD+Box+Chicane+Hybrid+++P%26P');
$html = preg_replace('/'s{2,}/', ' ', $html); // replace all instances of more than one whitespace with a single space
preg_match('/'{'"';(https?':'/'/['S]+)'"';/', $html, $matches); // can be either http or https potentially?
print_r($matches);
阵列(
[0] => {"http://ecx.images-amazon.com/images/I/41pi9o3crTL.jpg" [1] => http://ecx.images-amazon.com/images/I/41pi9o3crTL.jpg
)
相同的正则表达式在Javascript中工作:
document.getElementById('imgTagWrapperId').outerHTML.match(/'{'"';(https?':'/'/['S]+)'"';/);
["{"http://ecx.images-amazon.com/images/I/41pi9o3crTL.jpg"", "http://ecx.images-amazon.com/images/I/41pi9o3crTL.jpg"]
相关文章:
- java.net和javascript之间正则表达式的差异
- Grunt匹配正则表达式
- 不同浏览器中的空白字符正则表达式行为
- 正则表达式在字符串中找到base64
- 子字符串/正则表达式以获取字符串中保存的 SRC 值
- 调用正则表达式匹配的函数
- 使用正则表达式评估电子邮件地址时出现性能问题
- Javascript 正则表达式 : ^[^/s/]+[a-z]{1,}[0-9]*[-_]*[^/][
- JavaScript正则表达式文本与RegExp对象
- 正则表达式只允许 x 个整数
- 使用正则表达式将输入格式设置为单字符逗号、单字符逗号等
- 改进用于验证付款金额的正则表达式
- 正则表达式与数字中的第二个点匹配
- 键按正则表达式以查找具有负值的小数
- 一个正则表达式,用于从JS中的HTML标记中删除id、样式和类属性
- 将po-box javascript正则表达式转换为c#regex
- 在mongoose中使用正则表达式在对象数组中进行查询搜索
- 使用正则表达式捕获“”并分割成阵列
- 将这些正则表达式从javascript转换为Java
- 用于验证JS中逻辑运算符表达式的正则表达式