我有一个Excel电子表格,其中包含数千名公司员工针对问题类别(例如CPU错误,磁盘错误等)生成的“票证”(技术投诉)(41个此类),并在列中详细说明了例如,每张票证都以CPU错误为例,其描述将包含CPU使用率,设备ID以及占用那么多功能的进程,但采用段落格式。 (我们必须从这些段落中提取我们需要的内容)
我应该从票证描述中提取所需的实体/参数,然后将其传递给公司的RPA后端,该RPA后端将根据提供给它的参数解决问题。
我是NLP的入门者,所以请帮助我确定我可以选择哪种最佳方法来从一个栏中的5000多个此类条目中成功提取特定于类别的实体数据。手动注释似乎太繁琐,无法在此处实现。