html页面注释器

时间:2011-03-30 21:08:40

标签: c# javascript python html-parsing data-annotations

我必须写一个网页注释器。 我的要求如下:

1)给定一组页面,我想有效地注释它们(在浏览器中,在知道如何呈现HTML等的外部应用程序中)。

2)我手动选择(突出显示,激活)一串文字,然后出现下拉菜单,允许从一组选项中进行选择

3)之后出现迭代器(如在按下ctrl + F进行搜索时在浏览器中),我希望能够在同一页面上浏览上一步中选择的字符串匹配

4)给出了具有接口的字符串的比较函数:给定两个字符串,它输出1或0,具体取决于字符串匹配

5)当我按下迭代器按钮时,我移动到所选字符串的下一个匹配,然后会出现一个消息框(或者我可以确认它是真正匹配的任何其他东西)

6)确认它是真正匹配后,应修改页面文本,使当前匹配被特殊标记包围 (例如<<<<>>>>匹配的文字<<<< / optionX>>>),其中optionX是根据在第一步中选择的值定义的(下拉菜单) )

5)当在页面上找到所有匹配(由比较函数定义)时,我想在同一页面上标记另一个文本字符串,然后重复该过程,找到所有匹配项,确认其中一些,并相应地修改页面源

6)然后修改后的页面应存储在本地驱动器上

问题: 你能否建议一下这是什么工具?

1)使用javascript并在浏览器中工作是否可以。如果是,那么需要哪些方法,是否有任何有用的库可以做到这一点,或至少涵盖上述某些功能

2)可能更好的是构建一个自定义桌面应用程序,在特殊框架中呈现页面,并有适当的按钮来导航,确认等(考虑python或C#),以及什么类和库可以帮忙

[UPDATE]:

我知道如何使用页面的内容,但我很好奇如何让注释器使用起来很舒服,如何与用户建立正确的对话:获取所有糖果的方法,如下拉菜单和迭代器用户可以看到,确认对话框等。

目标是使用它来注释很多页面,因此界面应该是高效的。我是一名研究员(这不是你可能想到的作业,我只是用正式的方式描述了所需要的东西)而且我在编写面向用户的应用程序方面经验不足。

提前谢谢!

1 个答案:

答案 0 :(得分:0)

这绝对是一个Web浏览器工作。您可以使用JQuery来搜索和修改html页面。此示例将查找homework的所有匹配项,并将文本更改为<< homework >>

$("*").each(function () { 
  if ($(this).children().length == 0) { 
    $(this).text($(this).text().replace('homework','<< homework >>')); 
  } 
});