如何从网站上抓取链接和图片

How do I scrape links and images from a website?

本文关键字:链接 抓取 网站      更新时间:2023-09-26

我是javascript的新手,希望我的第一个项目是:

我试图从源代码中获取频道名称和缩略图,使用javascript或php在我的网站上显示所有频道的缩略图。

这是我想捕捉a href="this link"和img src,但来自所有渠道:

<div class="browseThumb">
                <a href="/realmanpwns" target="_top"><img src="//thumbnails.vaughnsoft.com/1427753239/fetch/live/realmanpwns.png" class"browseThumb" width="200" height="113" /></a>
                <div class="browseTxt" onclick="window.location = '/realmanpwns';">
                    <a href="/realmanpwns" target="_top" class="browseTxt">realmanpwns</a>
                </div>
            </div>

任何关于如何开始的指导都将不胜感激。

我在最近的一个项目中使用了scrapy。当时我不懂python,但我已经涉猎了一些其他语言,学习起来并不困难。

他们有大量的资源可以学习。

以下是直接链接:http://scrapy.org

PS。我与他们没有任何关系,只是一个快乐的用户。