将HTML表列导出到文本列表

时间:2012-03-13 21:52:57

标签: html parsing

我想以文本列表的形式从两个网站Allmusic和Wikipedia中导出/复制表格列。两列(每个站点一列)包含特定音乐专辑的曲目列表。我希望以这种形式提供文本列表:

    SongTitle1
    SongTitle2
    etc.

据我了解,这两个网站都没有API。至少,就Allmusic而言,我认为API只适用于付费订阅者。这使我可以直接从HTML页面进行抓取。

实现这一目标最简单的方法是什么?我喜欢像Firefox附加组件那样轻巧的东西。

1 个答案:

答案 0 :(得分:0)

我已经完成了很多关于在线年度报告(大量表格)的工作,并且实际将页面加载到(咳嗽,咳嗽)Dreamweaver或MS Word为您提供了从表格中选择和复制列的最简单界面。