使用注入的JavaScript从网页复制文本

时间:2010-12-17 20:55:04

标签: javascript html code-injection

作为我在网站上工作的一部分,我必须从旧网站的几个页面复制几千行文本,然后将它们粘贴到新网站的HTML中。进入旧页面并复制多行文本然后转到我的编辑器并逐行粘贴它的漫长而艰辛的方式变得非常古老。我想过使用注入的JavaScript来做这个,但我不太清楚从哪里开始。提前感谢您的帮助。

以下是指向旧网站页面和新网站页面的链接。正如您在每个页面的表格中看到的那样,手动复制所有内容需要花费大量时间。

旧网站:http://temp.delridgelegalformscom.officelive.com/macorporation1.aspx

新网站:http://ezwebsites.us/delridge/macorporation1.html

2 个答案:

答案 0 :(得分:2)

为了完成这类工作,您需要做两件事:在该页面上注入或执行脚本的方法,以及对目标站点的文档对象模型的良好工作知识。

我强烈建议您使用Firefox插件FireBug或您选择的浏览器上的一些等效工具。 FireBug允许您从JavaScript控制台执行命令,这将有所帮助。希望旧网站没有一堆<FONT><OBJECT><IFRAME>标签,这会让这更加乏味。

使用像Prototype或JQuery这样的库也有助于选择所需的网站部分。您可以使用JQuery提交结果,如下所示:

$(function() {
    snippet = $('#content-id').html;
    $.post('http://myserver/page', {content: snippet});
});

您很可能遇到的一个问题是许多浏览器强制执行JavaScript的“相同的发起策略”。因此,如果您的JavaScript是从http://myserver加载的,就像在此示例中一样,那么您就可以了。

也许您可以采用的另一种方法是使用Ruby,Python或(如果您真的有耐心)VBA等脚本语言。该脚本可以自动化要刮取的页面列表以及信息的目标位置。如果页面得到更新的话,它可以很容易地将其打包为新服务器的请求。这样您就不必担心注入JavaScript并希望所有工作都没有问题。

答案 1 :(得分:1)

我认为你需要Grease Monkey http://www.greasespot.net/