格式化显式内容的实用方法

时间:2012-04-10 10:36:38

标签: php html content-management-system standards

作为一名博主,我想根据它的具体内容(暴力,色情,剧透,淫秽等等)来标记我的CMS中的任何内容。是否有适当的实用库和标准?

我已经阅读了有关RTA,ICRA,PICS和W3C POWDER的信息,但是他们用meta或header标记了整个页面。 POWDER似乎太复杂了 - 据我所知,它在页面外添加了元数据?如果我使用HTML5 doctype,你能提供一个简单有用的例子。

我想要的是一种基于评级标记HTML元素的方法。我也希望它符合任何父母过滤。将EXIF数据添加到图像中以使其过滤独立于上下文也是很好的。

4 个答案:

答案 0 :(得分:8)

据我所知,没有任何广泛使用的标准可以做你所描述的。另外,最终目标是什么?浏览器是否能够自动识别(并以某种方式处理/过滤)显式内容?

如果您打算自己处理过滤,可以使用HTML5自定义数据属性。有了它们,您可以执行以下操作:

<li class="blogpost" data-rating="G"> [content] </li>

然后使用该自定义属性使用JavaScript,CSS,PHP或其他任何语言过滤/隐藏内容,例如:

li.blogpost[data-rating="R"] { [some styling] }

如何处理这种范式的选项非常广泛。这不是一个标准,显然需要大量的规划和编码。但是,它允许您根据您定义的指标过滤内容。这种类型的解决方案将与其他评论中建议的简单登录系统很好地配对,其中用户可以选择他们想要过滤的内容。您还可以为其定义年龄限制,或使用任意数量的其他选项。

这可能不会给你任何基于标准的自动过滤器或类似的东西,但据我所知,这些技术无论如何都没有得到广泛的支持。

如果这与您正在寻找的内容相差甚远,您是否可以提供有关您希望最终产品如何运作的更多详细信息?

答案 1 :(得分:4)

由于没有微格式,我决定制作一个。将其命名为xrate 1.0,写了article about it并添加了draft to microformats.org

基本上它基于具有这些HTML属性的危险来评价0-100的内容:

  • data-xrate-lang - 淫秽语言
  • data-xrate-sex - 浪漫,色情,色情
  • data-xrate-nude - 裸露程度
  • data-xrate-disgust - 可能引起厌恶(狗屎,幼虫,分解)
  • data-xrate-violence - 暴力及其结果 - 武器,伤口,尸体,血液
  • data-xrate-asocial - 吸烟,酗酒,吸毒,赌博,卖淫
  • data-xrate-blink - 闪烁可能导致癫痫的动画
  • data-xrate-spoiler - 故事重述
  • data-xrate-camera - 如果应用程序(flash / applet?)可以访问videocamera
  • data-xrate-malware - 如果资源可能导致查看者机器上的感染(病毒,特洛伊木马等)

如果有更好的解决方案,请通知。

答案 2 :(得分:1)

我在为您寻找解决方案时偶然发现了这一点

http://www.ehow.com/how_7580400_filter-explicit-content-apache-server.html

也许它会帮助你

  

说明

     

1

     

下载并安装mod_sed Apache模块(参见   Resources)。一些主机帐户可能已经有这个Apache模块   安装;在这种情况下,请联系您的Web托管服务提供商以检查是否   这个模块已经可用。

     

2

     

登录Web服务器并打开“httpd.conf”文件   记事本。如果使用本地Web,则可以在Apache文件夹中找到此文件   服务器和大多数主机帐户的“/ etc / httpd / conf”文件夹。   如果找不到此文件,请与您的Web主机联系   服务提供者协助。

     

3

     

添加命令   过滤显式内容。例如,要自动替换   在所有HTML文件中单词“该死”到“darn”,在您的文件中键入以下内容   “httpd.conf”文件:

     

AddOutputFilter Sed html

     

OutputSed“s / damn / darn / g”

     

4

     

保存更改。

     

阅读更多:如何过滤Apache Web服务器中的显式内容|   eHow.com   http://www.ehow.com/how_7580400_filter-explicit-content-apache-server.html#ixzz1rw85S300

答案 3 :(得分:0)

有一个评级的元标记:name="rating" content="general",但据我所知,它并没有被许多行业真正使用,所以可能有点无意义 - 我不能谈论过滤软件。

我从未在EXIF中听到有关评级的图片。

如果某些 敏感,它应该在年龄检查登录后面,如果没有,您应该信任用户并在他们使用时自动过滤。