我在txt文件中有数据,需要分隔数据。道歉,但我真的很难(可能很难解释)。以下是txt文件的前几行(一千行)。我需要第0行中的第一个*和第700行中的最后一个*之间的所有数据。我不想按行号进行选择,因为数字可以更改,但是我想要一个可以在*之间选择数据的代码。其次,数据不分成几列,而是一大行。我想要第二段代码可以将数据分成几列,即后报告,计算日期,索引代码是列(我不能在空间上分开,因为当它们应该是一列时,它将计算和日期分成单独的列。)请可以有人帮助我,谢谢你!
0
0 *
1 #124 Latter REPORT D51D ...
2 # 1 Calculation Date calc_da...
3 # 2 Index Code modes2_in...
4 # 3 Index Name index_n...
120 #120 5 Years ADPS Growth Rate 5_years...
121 #121 1 Year ADPS Growth Rate 1_year_...
122 #122 Payout Ratio payout_...
123 #123 Reserved 26 reserve...
124 #124 Reserved 27 reserve...
125 *
答案 0 :(得分:-1)
假设数据框名为dat
,第一部分将查找星号:
asterisk_location = dat[0] == '*'
asterisk_location = asterisk_location[asterisk_location]
start, finish = asterisk_location.index
dat = dat.iloc[start+1:finish]
这还假设您要获取前两个星号之间的区域。如果还有更多,则必须稍作调整。