正在尝试从ASX网站表中进行数据清理
Attempting to datascrape from ASX website table
我一直在尝试从ASX.com.au网站上获取股票的当前价值。也就是说,我正在努力获取澳交所的当前价值。这可以在这里找到。
http://www.asx.com.au/asx/markets/equityPrices.do?by=asxCodes&asxCodes=asx
这是左起第二个td,在撰写本文时,它位于30.410。
我可以玩一些代码,但一直没能让它发挥作用。
下面是我一直在玩的示例代码,如果有人能帮助我实现这一点,我将不胜感激!
<?php
$data = file_get_contents('http://www.asx.com.au/asx/markets/equityPrices.do?by=asxCodes&asxCodes=asx');
$asx = explode('<th class="row" scope="row">ASX: </th>', $data);
$asx = substr($asx[1], 4, strpos($asx[1], '</td>') - 4);
?><div class="asxvalue"><?php echo $asx . "<br />'n";?></div>
编辑
代码更新
<?php
$data = file_get_contents('http://www.asx.com.au/asx/research/companyInfo.do?by=asxCode&asxCode=DTL');
preg_match('/<td class="last">([^<]*?)</td>/i',$data,$matches);
$valueYouWant = $matches[1];
?><div class="data"><?php echo $valueYouWant ?></div>
每个人都会理所当然地告诉你,你不能用regex解析html,应该使用html解析器(比如simple_dom中的这个),但对于你的特定问题,你可以这样做:
preg_match('/<td class="last">([^<]*?)</td>/i',$data,$matches);
$valueYouWant = $matches[1];
要在另一页上查找日期和最后一次的值,可以使用以下方法:事实上,我建议在未来使用Simple_Dom来处理这样的事情,但在你对它感到满意之前,这将暂时有效:
$data = file_get_contents('http://www.asx.com.au/asx/research/companyInfo.do?by=asxCode&asxCode=DTL');
preg_match('/id="closing-prices".*?<strong>(.*?)<'/strong>.*?<td class="last">(.*?)<'/td>/s',$data,$matches);
$date = $matches[1];
$lastValue = $matches[2];
我已经测试过了,它是有效的。为了使它更健壮,我建议使用其他工具,但这应该会让你起步。祝你好运
谢谢你-我能够在Wordpress PHP代码小部件中使用这些代码,它对ASX股价来说是一种享受:
<?php
$data = file_get_contents('http://www.asx.com.au/asx/research/companyInfo.do?by=asxCode&asxCode=asx');
preg_match('/id="closing-prices".*?<strong>(.*?)<'/strong>.*?<td class="last">(.*?)<'/td>/s',$data,$matches);
$date = $matches[1];
$lastValue = $matches[2];
?><div class="data">$<?php echo $lastValue ?></div>
我想有人可能会把上面的解决方案放在一起,以防有用。
非常感谢您回答这个问题hackmartist:)
相关文章:
- 如何使用AnguarJS动态绑定网站数据
- 加载初始网站后在后台加载数据
- 如何使用XMLHttpRequest()不断地将数据发送到我的网站中的另一个页面
- Json显示来自网站的数据显示仅未定义
- 如何获取网站所有页面的链接以进行数据抓取
- 我想从网站收集数据并使用PHP将它们存储在数据库中
- 我们应该把数据验证放在网站的哪里
- 谷歌脚本-从网站论坛解析HTML-并将数据写入工作表
- 如何使用由Javascript填充的Python从网站获取数据
- 从外部网站获取JSON数据
- Magento网站-按选项排序:上下箭头与排序数据绑定,只需删除上下箭头即可
- 在网站上显示该网站的GA统计数据
- 如何从网站获取数据,然后显示在英特尔 XDK 页面中
- 单击指向外部网站的链接后,通过MySQL保存数据
- 我如何不允许包含我的网站访问页面数据
- 如何在网站中显示Firebase数据库中的数据
- 如何在网站上实现一个按钮,允许用户将生成的数组数据保存为ASCII文件
- 试图在网站上抓取谷歌地图api生成的动态数据,但正常抓取返回空白
- 从Playstation官方网站抓取奖杯数据
- 解析来自网站的数据