如何获得<img>XML文件中的SRC值
How to get <img> src value from xml file?
我正在尝试创建一个简单的rss提要网站。
我可以通过这样做获得一些rss提要:
let article = {
'title': item.title,
'image': item.image.url,
'link': item.link,
'description': item.description,
}
大多数rss源的标题和链接工作,但图像和描述不。
由于许多rss收费在描述中使用图像作为html,例如:
{ title: 'The Rio Olympics Are Where TV Finally Sees the Future',
description: '<div class="rss_thumbnail"><img src="http://www.wired.com/wp-content/uploads/2016/08/GettyImages-587338962-660x435.jpg" alt="The Rio Olympics Are Where TV Finally Sees the Future" /></div>Time was, watching the Olympics just meant turning on your TV. That''s changed—and there''s no going back. The post <a href="http://www.wired.com/2016/08/rio-olympics-tv-finally-sees-future/">The Rio Olympics Are Where TV Finally Sees the Future</a> appeared first on <a href="http://www.wired.com">WIRED</a>.',...
我如何从它得到图像的url ?
编辑:http.get("http://www.wired.com/feed/"...
.on('readable', function() {
let stream = this;
let item;
while( item = stream.read()){
let article = {
'title': item.title,
'image': item.image.url,
'link': item.link,
'description': item.description,
}
news.push(article);
}
})
这是我的一些代码,基本上我试图从有线rss获取图像url。
如果我使用'image': item.image。Url,它不起作用。那么我应该把它改成什么呢?
使用xml2js将XML转换为json
var parseString = require('xml2js').parseString;
var xml = '<img title=''A San Bernardino County Fire Department firefighter watches a helitanker make a water drop on a wildfire, seen from Cajon Boulevard in Devore, Calif., Thursday, Aug. 18, 2016. (David Pardo/The Daily Press via AP)'' height=''259'' alt=''APTOPIX California Wildfires'' width=''460'' src=''http://i.cbc.ca/1.3730399.1471835992!/cpImage/httpImage/image.jpg_gen/derivatives/16x9_460/aptopix-california-wildfires.jpg'' />';
parseString(xml, function (err, result) {
console.log(JSON.stringify(result, null, 4));
console.log(result["img"]["$"]["src"]);
});
使用正则表达式:
var res = description.match(/src=.*'.(jpg|jpeg|png|gif)/gi);
小提琴演示
一个想法是使用正则表达式。例:
var re = /(src=)('''htt.*''')/g
var img_string = "your image tag string"
var match = re.exec(img_string)
var result = match[1]
您可以使用DOMDocument解析器获取图像源。
$html = "<img title=''A San Bernardino County Fire Department firefighter watches a helitanker make a water drop on a wildfire, seen from Cajon Boulevard in Devore, Calif., Thursday, Aug. 18, 2016. (David Pardo/The Daily Press via AP)'' height=''259'' alt=''APTOPIX California Wildfires'' width=''460'' src=''http://i.cbc.ca/1.3730399.1471835992!/cpImage/httpImage/image.jpg_gen/derivatives/16x9_460/aptopix-california-wildfires.jpg'' />";
$doc = new DOMDocument();
$doc->loadHTML($html);
$xpath = new DOMXPath($doc);
$src = $xpath->evaluate("string(//img/@src)"); # "/images/image.jpg"
相关文章:
- 获取 HTML 5 音频控制文件位置并在不使用 id 选择器的情况下更新 src
- 内容安全策略指令:;脚本src'self'blob:文件系统:chrome扩展资源:“;获取是否时
- javascript文件中带有php(wordpress)的Src文件路径
- Django,HTML,JS:<img src=“#">可以在HTML中工作,但不能在JS文件中工作
- Gulp js src :首先获取最深的文件
- Grunt 可以直接从文件对象/数组或 glob 中的“src”值通过 HTTP 加载远程文件
- 是否可以在javascript中访问 src的文件创建时间
- <img src=“;数据:..使用gzip文件
- src为null的iframe中的Javascript文件的路径
- 未加载JavaScript src文件
- 将文件编译到dest文件夹和src文件夹
- 可以't在html中打开src文件,因为路径没有'不存在
- 在我的html页面中避免使用多个src文件
- 节点服务器未收到对img元素的src文件更改请求
- 覆盖报告与karma和javascript和typescript src文件的混合
- 使用javascript更改图像src文件不会改变显示的图片
- 删除吞咽.在gulp.dest之后的SRC文件
- 如何从php中的不同src文件夹加载文件
- jquery src文件引用的带有jquery路径的C#变量不工作
- Angular gulp -如何根据每个SRC文件夹拆分dist文件夹中的js文件