我知道这个问题可能不适合SO,但请暂时让这个问题在这里。上次我的问题被转移到交叉验证时,它冻结了;没有更多的意见或反馈。
我遇到了一个对我来说没有多大意义的问题。如何通过NLP查询IFC models?将IFC模型视为语义丰富的结构化数据。 IFC定义了一个基于EXPRESS的实体关系模型,该模型由组织成基于对象的继承层次结构的实体组成。实体的示例包括构建元素,几何和基本构造。
如何将NLP用于此类数据?我看不到NLP的相关性。
答案 0 :(得分:1)
一般情况下,我建议使用NLP技术来“询问”已经(非常正式)的结构化数据,例如EXPRESS,最好是过度杀伤,最糟糕的是时间/维护下沉。一般来说,当您已经拥有如此明确的编码时,NLP的优势(人类语言模糊度解析,共参考分辨率,文本摘要,文本蕴涵等)完全没有必要。如果有的话,您可以想象将此架构直接转换为Prolog应用程序以进行直接逻辑查询等(这与NLP的方向完全不同)。
我做了一些搜索,试图找到你可能指的引用。我发现的唯一项目是Extending Building Information Models Semiautomatically Using Semantic Natural Language Processing Techniques:
......作者提出了一种扩展IFC模式的新方法,以客观和半自由的方式整合CC相关信息。该方法利用语义自然语言处理技术和机器学习技术从与CC [一致性检查] (例如,构建代码)相关的文档中提取概念,并将提取的概念与IFC类中的概念相匹配层次结构。
所以在这个例子中,至少,作者不是用NLP“询问”IFC模式,而是使用它来增加现有模式,并从人类可读文本中提取附加信息。这更有意义。如果您想发布包含“NLP询问”短语的实际网址或引用,我应该能够更具体地发表评论。
修改强>
您引用的项目授予摘要在细节方面并不多,但它们有这句话:
...参数化3D模型中嵌入的信息旨在使用适当的软件进行设施或工作场所管理。然而,当与物联网传感器和认知计算相结合时,该信息还具有由环境辅助生活(AAL)环境中的医疗保健专业人员使用的潜力。该项目将研究如何通过自然语言处理来检查医疗设施的构建BIM模型以支持AAL。 ...
我只能推测可能使用NLP框架的原因如下:
虽然BIM模型包括工业基础类(IFC)和aecXML,但还有许多其他格式,其中许多是专有的。有些是CAD集成的,有些是独立的。而不是支付许多专有许可证(这些企业产品中的一些非常昂贵),和/或花时间为各种不同的文件格式规范(在专有案例中可能不公开)开发适当的结构化查询行为,作者选择了一种更自动化的通用解决方案来提取他们正在寻找的内容(我认为几乎在所有情况下都必须是文本或文本标签)。 这几乎类似于搜索引擎“抓取”网站并寻找关键词或短语及其同义词等。好处是,他们不必明确编码所有不同的可能BIM文件格式可以获得良好的覆盖率,也无需支付大笔资金。缺点是它们开辟了NLP带来的新问题和考虑因素,包括培训,验证,监督等。而NLP永远不会具有与真正的结构化查询相对于已知模式获得的相同级别的准确性。