无法使用Jsoup从amazon或flipkart页面解析img和名称
Unable to parse img and name from amazon or flipkart pages using Jsoup
我无法使用Jsoup获取亚马逊或Flipkart上产品的主图像和名称。
我的java/jsoup代码是:
// For amazon
Connection connection = Jsoup.connect(url).timeout(5000).maxBodySize(1024*1024*10);
Document doc = connection.get();
Elements imgs = doc.select("img#landingImage");
Elements names = doc.select("span#productTitle");
// For flipkart
Connection connection = Jsoup.connect(url).timeout(5000).maxBodySize(1024*1024*10);
Document doc = connection.get();
Elements imgs = doc.select("h1.title");
Elements names = doc.select("img.productImage.current");
有人能指出我在这里遗漏了什么吗?
我使用过的网址是:
http://www.flipkart.com/lenovo-yoga-2-tablet-android-10-inch/p/itmeyqkznqa2zjf5?pid=TABEYQKXWAXMSGER&srno=b_2&offer=ExchangeOffer_LenovoYoga&ref=9ea008ab-ae95-4f52-8ef7-3ef1a54947ae
和
http://www.amazon.com/gp/product/B00LZGBU3Y/ref=s9_psimh_gw_p504_d0_i5?pf_rd_m=ATVPDKIKX0DER&pf_rd_s=桌面1&pf_rd_r=0ESK1KNE31TBRVC8115Q&pf_rd_t=36701&pf_rd_p=1970559082&pf_rd_i=桌面
此外,如果可能的话,我想使用javascript和jquery在前端进行解析。
有没有同样的方法?
发现问题。
当我们使用java.net.URL的URL获取服务时,GAE中的Jsoup是有效的:
private String read(String url) throws IOException
{
URL urlObj = new URL(url);
BufferedReader reader = new BufferedReader(new InputStreamReader(urlObj .openStream()));
String line;
StringBuffer sbuf = new StringBuffer();
while ((line = reader.readLine()) != null) {
if (line.trim().length() > 0)
sbuf.append(line).append("'n");
}
reader.close();
return sbuf.toString();
}
然后你使用常规Jsoup作为:
String html = read(url);
Document doc = Jsoup.parse(html);
做到以上几点效果很好。
相关文章:
- 如何更改<svg>标记为<img>用js标记
- 有没有一种方法可以防止img get请求使用css或js发生
- Javascript:使用绝对路径设置img src
- Setting default onclick behavior for <img> tag in gene
- 如何在页面加载中使用Jquery/Javascript确定img源
- 图像可以从源<img src=""/>.TEXT可以在没有javascript的情况下从外部
- 使用AngularJs时,如何在img标记具有src-attr时设置数据src
- 插入“;img src"在javascript中
- 检索MongoDB binData并显示为<img>src
- addEventListener的Javascript代码不工作!?(单击时打开放大的img)
- 手柄'img'单击事件并插入'alt'使用jQuery将属性转换为文本框
- 限制对HTML/CSS/IMG或根索引文件夹的访问
- 使用javascript或angularjs特定过滤器搜索字符串中第一个img标记的json值
- 为img设置高度和宽度
- 替换与单词'匹配的文本字符;购物车'替换为img图标
- 我应该如何在 UL 内触发 IMG 标签的点击
- AngularJS提取物<img>来自JSON
- 如何将JSON结果设置为'src'共'img'以在ASP.NET MVC4中显示图像
- 用javascript交换img标记
- 无法使用Jsoup从amazon或flipkart页面解析img和名称