从熊猫输出中删除示例数据框

时间:2020-09-15 21:11:33

标签: python pandas dataframe for-loop

我想从熊猫输出中删除我的示例数据框。但是我在与数据框进行交互时遇到了麻烦。我正在尝试使用pd.DataFrame(df)和data [“ Indexes”] = data [“ Name”]。str.find(sub),但是我的列没有标题。

当前将我打印为空。

from tika import parser
import pandas as pd
import numpy as np
import io


rawtext = parser.from_file(r"D:\Selenium\missing,txt")
text = rawtext['content']

f = io.StringIO(text)

df = pd.read_csv(f, sep='\s+', header=None, names=['col1', 'col2'])

def fill(d):
    idx = range(d['col1'].min(), d['col1'].max() + 1)
    return d.set_index('col1').reindex(idx, method='ffill').reset_index()

g = df['col1'].lt(df['col1'].shift()).cumsum()
df = pd.concat([fill(g) for _, g in df.groupby(g)], ignore_index=True)

dftexts = pd.DataFrame(df)   
lines = [l.strip() for l in open(r"D:\Selenium\missing.txt").readlines()]
for line in lines:
    for dftext in dftexts:
        if dftext.find(line)>0:
            print(dftext)

示例数据框:

1029 400
1035 400
1031 340
1039 340
1020 503
1025 503

当前数据输出

1029 400
1030 400
1031 400
1032 400
1033 400
1034 400
1035 400
1031 340
1032 340
1033 340
1034 340
1035 340
1036 340
1037 340
1038 340
1039 340
1020 503
1021 503
1022 503
1023 503
1024 503
1025 503

预期数据输出:

1030 400
1031 400
1032 400
1033 400
1034 400
1032 340
1033 340
1034 340
1035 340
1036 340
1037 340
1038 340
1021 503
1022 503
1023 503
1024 503

0 个答案:

没有答案