用 Python 从 Bloomberg 中抓取交互式图表

时间:2021-07-31 16:28:09

标签: python selenium web-scraping beautifulsoup selenium-chromedriver

早上好。我正在尝试自动化一项任务,该任务需要从彭博的下一个页面 https://www.bloomberg.com/quote/EURUSD:CUR 中提取数据。更具体地说,图表中的每日汇率(手动按下它,选择 1M 视图,然后将鼠标悬停在不同日期的线上以获取每个值)。

我能够获得从中提取数据的链接 (https://www.bloomberg.com/markets2/api/history/EURUSD%3ACUR/PX_LAST?timeframe=1_MONTH&period=daily&volumePeriod=daily)。使用 Chromium,我可以提取该页面上的文本,该文本位于 pre 标记内,但我无法获取特定日期和值。

我当前的代码是

<?php 
include 'koneksi.php';
$nama  = $_POST['nama'];
$kelas = $_POST['kelas'];
$alamat = $_POST['alamat'];

$rand1 = rand();
$rand2 = rand();

$allowed = array('pdf');

$filename1 = $_FILES['file1']['name'];
$filename2 = $_FILES['file2']['name'];

$ekstensi1 = pathinfo($filename1, PATHINFO_EXTENSION);
$ekstensi2 = pathinfo($filename2, PATHINFO_EXTENSION);

if($filename1 != "" && in_array($ekstensi1,$allowed)){
    move_uploaded_file($_FILES['file1']['tmp_name'], 'pdf1/'.$rand1.'_'.$filename1);
    $nama_file1 = $rand1.'_'.$filename1;
}else{
    $nama_file1 = "";
}

if($filename2 != "" && in_array($ekstensi2,$allowed)){
    move_uploaded_file($_FILES['file2']['tmp_name'], 'pdf2/'.$rand2.'_'.$filename2);
    $nama_file2 = $rand2.'_'.$filename2;
}else{
    $nama_file2 = "";
}
mysqli_query($koneksi, "insert into siswa values (NULL,'$nama','$kelas','$alamat','$nama_file1','$nama_file2')");
header("location:index.php");

如果您像我一样运行它,您会看到它似乎是一个字典列表,但我已经尝试了所有方法,但无法访问 BeautifulSoup 中的不同值,每次运行时都会收到不同的错误。有什么想法吗?

0 个答案:

没有答案