我被赋予了一个模糊的任务,即自动从各种Visual FoxPro表中提取数据。
有几对.DBF
和.CDX
个文件。使用Python dbf包,我似乎能够使用它们。我有两个文件,ABC.DBF
和ABC.CDX
。我可以使用
>>> import dbf
>>> table = dbf.Table('ABC.DBF')
>>> print(table[3])
0 - table_key : '\x00\x00\x04'
1 - field_1 : -1
2 - field_2 : 0
3 - field_3 : 34
4 - field_ 4 : 2
...
>>>
我的理解是.cdx
文件是索引。我怀疑它对应于table_key
字段。 According to the author,dbf
可以读取索引:
我可以读取IDX文件,但不能更新它们。我的日常工作变了,dbf 文件不是新文件的重要组成部分。 - 伊桑弗曼16年6月26日 在21:05
阅读就是我需要做的。我看到存在四个类,Idx
,Index
,IndexFile
和IndexLocation
。这些似乎是很好的候选人。
Idx
类读入表和文件名,这很有希望。
>>> index = dbf.Idx(table, 'ABC.CDX')
但是,我不确定如何使用这个对象。我看到它有一些生成器,backward
和forward
,但是当我尝试使用它们时出现错误
>>> print(list(index.forward()))
dbf.NotFoundError: 'Record 67305477 is not in table ABC.DBF'
如何将.cdx
索引文件与.dbf
表关联?
答案 0 :(得分:2)
.idx
和.cdx
不一样,dbf
目前无法读取.cdx
个文件。
如果需要对表进行排序,可以创建内存索引:
my_index = table.create_index(key=lambda r: r.table_key)
您还可以创建一个完整的功能:
def active(rec):
# do not show deleted records
if is_deleted(rec):
return DoNotIndex
return rec.table_key
my_index = table.create_index(active)
然后遍历索引而不是表:
for record in my_index:
...