有没有办法从分解的单词中找回句子?例如,我有以下文本:
THIS IS
A TITLE
hello my
name
is Sam
Some of the text is formatted.
But others
are
not
我现在正在做的事情就是为它提供一些结构。
我想从上面得到的结果是这样的:
THIS IS A TITLE
----
hello my name is Sam
----
Some of the text is formatted.
----
But others are not
----
“ ----”上方是一个句子。 (格式化)
但是,我似乎不得不考虑很多极端情况。 我可以做一些自然语言处理来简化此工作吗?