C# - 标题大写 - 检测文本中的标题

时间:2012-04-03 08:42:02

标签: c# text extract title

我只是在寻找有关此事的一些建议。我想要做的是提取一段文字中的标题。这是主要标题,而不是文本中的小标题。我所说的标题是“描述性标题或标题,如章节,章节或书籍的其他部分。”

这些文字摘录将以字符串格式存储。在通常情况下,文本提取中的单词的第一个句子将是标题,例如:

  

要查找的文字

     

这是段落的其他部分等等。

你认为这会像以下一样简单:

  • 检查文本提取中出现的第一个单词是否为文本中断。
  • 如果发现文本中断,请确保没有完全停止(标题不会有完全停止)。
  • 如果上述匹配,则可将其归类为标题并使用。

我可以更进一步寻找标题式的首饰(http://www.writersblock.ca/tips/monthtip/tipmar98.htm),但这可能过于严格,因此可能会忽略一些标题。是否有任何我忽略的问题/是否有找到标题的方法?

我知道TextInfo.ToTitleCase,但是这只是将每个单词的所有首字母转换为大写字母,还是遵循“标题样式大小写”规则?

感谢。

0 个答案:

没有答案