用于索引PDF文件的语义标记

时间:2012-07-30 15:59:18

标签: pdf indexing semantic-web schema.org

索引PDF文件的正确方法是什么?我想在其中添加语义信息,并帮助搜索引擎更准确,更准确地呈现文件(特定图像,PDF文件中的文本)。我正在考虑使用引擎已经理解的本体,如Schema.org

1 个答案:

答案 0 :(得分:3)

如何使用schema.org从这样的网页链接到PDF文件:

<div itemscope itemtype="http://schema.org/Article">
  <img itemprop="thumbnailUrl" src="http://www.example.com/how_to_build_a_web_app.jpg"/>
  <a itemprop="url" href="http://www.example.com/how_to_build_a_web_app.pdf">
    <span itemprop="name">How to Build a Web App</span></a>
  by <span itemprop="author">John Smith</span>
  <div itemprop="description">This short e-book explains what a web application 
  is and how to build one.</div>
</div>

这使您可以将标题,图像和文本描述与PDF中的文章相关联。