在python中读取两个文件

时间:2012-08-08 00:14:53

标签: python file-io for-loop iteration

我正在尝试读取两个文件,并在Python(2.7.3)上进行比较 它们没有相同的大小/顺序,因为我正在使用ID /名称,它们不会“匹配”。

我不想同时阅读它们,但是“file2”彻底并与“file1”的每一行进行比较,然后读取另一行“file1”等等

从我所做的事情来看,它运作得很糟糕,有些问题。


例如,看看这段代码:

if split_cronus[0] == split_data[0]:


程序执行'if'中的所有内容,然后退出。
如果我再次调用该函数,请执行以下操作:

print final_line + "\n"

它将工作62次然后显示此错误:

  Traceback (most recent call last):
   File "C:\Users\Matheus\Desktop\DBWolfmizator\DBWolfmizator\DBWolfmizator.py", line 40,     in <module>
   File "C:\Users\Matheus\Desktop\DBWolfmizator\DBWolfmizator\DBWolfmizator.py", line 28,     in translate_itemdb
translate_itemdb()

每次程序循环时都会显示“第28行”错误。

然后:

   File "C:\Users\Matheus\Desktop\DBWolfmizator\DBWolfmizator\DBWolfmizator.py", line 15, in translate_itemdb
for line2 in data:
   ValueError: I/O operation on closed file




这意味着,使用'if',我只能获得一个匹配,就像文件只有一行一样;但是使用递归,我可以在第二个文件结束之前使其工作几次。

如果你不明白:
我必须阅读两个文件 “file1”和“file2”
从理论上讲,它是这样读的:

file1_line1 -> file2_line1
file1_line1 -> file2_line2
file1_line1 -> file2_line3
...
file1_line2 -> file2_line1
file1_line2 -> file2_line1
...

但是当我得到一个匹配时,程序退出循环。
我该怎么做?
在PHP中它很棒,我试图制作类似“端口”的东西。

Python代码:

cronus = open("item_db.txt", "r+")
data = open("idnum2itemdisplaynametable.txt", 'r')
new_item = open("item_db_new.txt", 'w')
def translate_itemdb():
    try:
        try:
            for line in cronus:
                if line.startswith("//") or len(line) < 3:
                    new_item.write(line)
                    continue

                split_cronus = str.split(line, ",")
                del split_cronus[len(split_cronus) - 1]

                for line2 in data:
                    if line2.startswith("//") or len(line2) < 3:
                        continue

                    split_data = str.split(line2, "#")
                    del split_data[len(split_data) - 1]

                    if split_cronus[0] == split_data[0]:
                        split_cronus[1] = str.replace(split_data[1], " ", "_")
                        split_cronus[2] = str.replace(split_data[1], "_", " ")
                        final_line = ','.join(split_cronus)
                        new_item.write(final_line + "\n")
                        print final_line + "\n"

        finally:
            cronus.close()
            data.close()
            new_item.close()

    except IOError:
        raise

    return

translate_itemdb()



PHP代码:

<?php
set_time_limit(0);

$Cronus = file('item_db.txt');
$Data = file('idnum2itemdisplaynametable.txt');

for( $i = 0; $Cronus[$i]; $i++ ) {
    if( $Cronus[$i][0] == '/' || strlen($Cronus[$i]) < 3 ) {
        echo $Cronus[$i]."<br />";
        continue;
    }

    $ExplodeCronus = explode( ',', $Cronus[$i] );

    for( $j = 0; @$Data[$j]; $j++ ) {
        if( $Data[$j][0] == '/' || strlen($Data[$j]) < 3 )
            continue;

        $ExplodeData = explode( '#', $Data[$j] );

        if( $ExplodeData[0] == $ExplodeCronus[0] ) {
            $ExplodeCronus[1] = str_replace( " ", "_", $ExplodeData[1] );
            $ExplodeCronus[2] = str_replace( "_", " ", $ExplodeData[1] );
            $Linha = implode( ',', $ExplodeCronus );
                echo $Linha."<br />";
        }
        }
    }
?>

2 个答案:

答案 0 :(得分:2)

一种解决方法是移动这一行:

   data = open("idnum2itemdisplaynametable.txt", 'r')

就在这一行之前:

   for line2 in data:

这样您就可以根据需要重新打开数据文件。 (根据需要调整异常处理以关闭数据文件。请考虑使用with。)

其次,为了获得您发布的PHP代码的更近端口,您可以使用readlines。毕竟,你正在读几次文件。只需一次阅读它们,然后再进行处理。

因此,将数据打开代码留在原处,您可以这样做:

   data_f = open("idnum2itemdisplaynametable.txt", 'r')
   data = data_f.readlines()

然后你的for line2 in data循环只是重新访问一系列行。

答案 1 :(得分:1)

好吧,我会做这样的事情来比较两个文件:

def compare_two_files(filename1, filename2):

    input1 = open(filename1)
    input2 = open(filename2)

    lines1 = input1.readlines()
    lines2 = input2.readlines()

    # Iterate over the two files
    for l1 in lines1:
        cur_l1 = l1.split(',')
        for l2 in lines2:
            cur_l2 = l2.split(',')
            # Compare file's lines
            if cur_l1[0] == cur_l2[0]:
                print('something')

我没有测试它,但它应该有用。