我需要它来做一些实体提取。如何使用SELECT distinct(A.actor_id) as id FROM pull_requests AS A
INNER JOIN repos AS B ON A.repo_id = B.id AND B.language = 'javascript'
获取带注释的数据集?
答案 0 :(得分:1)
如果您没有遇到任何数据集,我建议您这样做。获取维基百科职业列表:https://en.wikipedia.org/wiki/Lists_of_occupations,创建一个地名词典工作列表并编写正则表达式来捕获它们或文本中的任何变体,并且您有注释数据:)。