data =“阿米塔布·巴昌(Amitabh Bachchan)先生,1942年10月11日出生,是印度电影演员,电影制片人,电视节目主持人,偶尔回放的歌手和前政客。他于1970年代初因赞杰尔(Zanjeer),迪瓦(Deewaar)和肖莱(Sholay)等电影而广受欢迎,并因在印地语电影中的银幕角色而被称为印度的“生气的年轻人”。被称为宝莱坞的莎恩莎(Shahenshah of Bollywood)(以他的1988年电影《莎恩莎》(Shahenshah)为参考),萨迪·卡·马哈纳亚克(Sadi ka Mahanayak)(印地语为“本世纪最杰出的演员” “),千年之星或大B,自那以后他已经出现在超过200部印度电影中,涉足了超过50年的职业生涯。巴尚被认为是印度电影史上最伟大的演员之一。”
输出:“阿米塔布·巴昌先生(1942年10月11日出生,是印度电影演员,电影制片人,电视节目主持人,偶尔回放的歌手和前政客。)
从这个非结构化字符串中,我只想读取第一行。 我尝试使用readlines()和splitlines()函数,但没有成功。我有多个包含非结构化数据的段落,我只想读取该段落的第一行。请帮助。
答案 0 :(得分:0)
如果文本已经包含在变量中,则可以按句点分隔文本并获取第一个元素:
x = "your text..."
first_line = x.split('.')[0]
这会将文本按句点(.
)拆分为一个数组,并获得该数组的第一个元素,从而为您提供第一句。