在页面上查找网址

Finding a URL on a page

本文关键字:查找      更新时间:2023-09-26

首先,我想说的是,我对HTML和所有编程知识的知识很少,但我的工作涉及找出源代码的某些方面,如链接URL,以改进我的工作过程。

几天以来我一直面临一个问题,尽管其中一个网站试图从中检索某个链接,该链接是用与我认为的HTML不同的语言编写的。它的链接以.aspx结尾,即使我浏览它的页面也永远不会改变。

我试图检查页面的源代码,我需要从哪里找到这个特定的 URL,但它是用 javascript 编写的,我不知道阅读它。我尝试在谷歌上搜索以找到解决方案,但没有遇到任何有用的东西,或者我只是无法理解,因为就像我说的那样,我对编程几乎一无所知。

无论如何,我已经弄清楚了链接在页面上的位置,但我希望有人告诉我如何找出它背后的 URL。在源代码中看起来像这样:

</div> -->
    <input type="submit" name="ctl00$ContentPlaceHolder1$ValidateButton" value="View Image" onclick="javascript:WebForm_DoPostBackWithOptions(new WebForm_PostBackOptions(&quot;ctl00$ContentPlaceHolder1$ValidateButton&quot;, &quot;&quot;, true, &quot;&quot;, &quot;&quot;, false, false))" id="ctl00_ContentPlaceHolder1_ValidateButton" /><br />
</div>

我在页面上的兴趣点开始的整个事情看起来像这样,但不涉及验证码输入。您只需单击该按钮,它就会下载文件:

<a id="ctl00_ContentPlaceHolder1_ImageLink"><h4>[Image]</h4></a> </DIV>
                        <DIV align="center"><span id="ctl00_ContentPlaceHolder1_ImageInfo">- File Size: 582KB | Pages: 1 -</span> </DIV><BR />
                        <DIV align="left"><span id="ctl00_ContentPlaceHolder1_ErrorMessage"></span> </DIV>
                        <DIV align="left"><span id="ctl00_ContentPlaceHolder1_documentError"></span> </DIV>
                                <div align=center>
                                    <!-- <div id="CaptchaDiv">
                                    <script type="text/javascript">
        var RecaptchaOptions = {
            theme : 'clean',
            tabindex : 0
        };
</script><script type="text/javascript" src="http://www.google.com/recaptcha/api/challenge?k=6LfZzsMSAAAAAD2h79x90-FvI0AtkBatVFqydtgE">
</script><noscript>
        <iframe src="http://www.google.com/recaptcha/api/noscript?k=6LfZzsMSAAAAAD2h79x90-FvI0AtkBatVFqydtgE" width="500" height="300" frameborder="0">
        </iframe><br /><textarea name="recaptcha_challenge_field" rows="3" cols="40"></textarea><input name="recaptcha_response_field" value="manual_challenge" type="hidden" />
</noscript>
                                    </div> -->
                                    <input type="submit" name="ctl00$ContentPlaceHolder1$ValidateButton" value="View Image" onclick="javascript:WebForm_DoPostBackWithOptions(new WebForm_PostBackOptions(&quot;ctl00$ContentPlaceHolder1$ValidateButton&quot;, &quot;&quot;, true, &quot;&quot;, &quot;&quot;, false, false))" id="ctl00_ContentPlaceHolder1_ValidateButton" /><br />
                                </div>

也许这些代码会对你有所帮助:

var urlexp = new RegExp('(http|ftp|https)://[a-z0-9'-_]+('.[a-z0-9'-_]+)+([a-z0-9'-'.,@'?^=%&;:/~'+#]*[a-z0-9'-@'?^=%&;/~'+#])?', 'i');
var result = urlexp.exec(document.body.innerHTML);

result是包含匹配 URL 的数组。