使用Applet减少HTML

时间:2014-03-24 06:23:20

标签: java html google-chrome applet

我的主管已经通过查看HTML标记以只显示核心内容,以编程方式减少网站内容的任务。重要的是,项目的这个特定部分必须用Java编写。

现在我已经了解了Plugins, Extensions, Applets, and Widgets之间的差异,我认为我想使用一个调用客户端Applet的Extension。我的方法是:

  1. 使用Google-Chrome API,我打算显示一个按钮 用户可以点击。
  2. 如果单击,则操作是启动具有的新浏览器选项卡 嵌入其中的Applet。
  3. 小程序会自动获取被叫标签的HTML代码和 过滤它。
  4. 过滤后,会显示原始网站的简化副本。
  5. 所以我有几个问题。首先,是否可以使用带有Applet的扩展?此外,applet是否有可能看到另一个标签HTML代码?如果没有,是否可以重新加载原始选项卡,现在嵌入其中的Applet并完成该功能。感谢。

2 个答案:

答案 0 :(得分:2)

如何在移动设备上实现本地代理服务器。浏览器只需要配置为使用代理,而自定义代理实现可以转换所需的html但是它喜欢。

答案 1 :(得分:2)

Javascript已经出现在大多数移动网络平台上。 Java不是,移动客户也无法以合理的方式安装Java。运行许多(但不是全部)移动设备的Android具有Java运行时环境,并且基本上是Java应用程序的加载器。但Apple iPhone不是Android设备......也不是Windows Phone。

如果你想在客户端和Javascript中总结内容,我认为你有两个选择:

  1. 天才语言计算领域的数十位最优秀的专家博士刚刚开始探索如何从文本中提取“真正的意义”; OR
  2. 查看document.title并完成它。
  3. 第二种方法假定网页的作者设置标题并设置适合于总结其网站的标题。这不是一个完美的假设,但没关系 大多数时候。它也比#1

    便宜得多

    使用第一种方法,您可以从“自然语言工具包”开始,可以执行扫描文本以查找不常用的单词和短语。要大致了解此区域中构建的软件类型,请查看wikipedia: Outline of natural language processing:: toolkits。 python的流行用途称为NLTK。无论您使用的是java还是python的工具包,都意味着在服务器上工作,因为客户端不具备存储,网络速度或CPU。对于python,有像django或web2py这样的服务器端应用程序框架可以更快地构建服务器应用程序,而在Java上则有servlet框架。最终,你需要大量的帮助,培训或运气,正如我上面所暗示的那样,它很容易超出新员工团队的能力范围,当然也超出了一个新的开发者渴望证明他/她的能力。在有限的帮助下,能力可以在几周内完成。

    大多数网页在下载的HTML开头附近都设置了这样的标题:

    <head><title>My Furry Kittens!</title></head>

    您不需要编写解析器。如果您在浏览器中运行,则标题已经被解析为DOM或文档对象模型。此示例中的字符串"My Furry Kittens!"将在全局变量document.title中可用。

    如果您愿意,可以在按钮中添加一个按钮,然后让人们推送它来总结网站。或者,他们可以只看标题。它已经在页面上了。当然,如果目标是刮掉标题,可以避免编写解析器并使用像“幻影”或类似的“虚假”无头脚本化浏览器。

    您可以在Mozilla Developer Network上详细了解document.title。 MDN是学习Web浏览器工作方式的绝佳参考。他们是Mozilla Firefox浏览器的维护者。您可以在那里学到的大部分内容也适用于Chrome,Internet Explorer和各种移动平台。

    祝你好运!