我正在使用" import_csv"加载csv文件。假设我有一个如下所示的文件。
mycsvfile.csv:
col1, col2
1, date(01-01-2015)
然后我使用" import_csv"加载此文件结果如下:
Set = Couplets('col1', '1'), Couplets('col2', 'date(01-01-2015)')
现在我想检查右对联对象(日期)是否介于两个日期之间,如01-01-2014和01-01-2016,并返回false或true。
换句话说,如果我有。
twodates = Set(Couplet('firstdate',read_date('1/1/2014')), Couplet('seconddate',read_date('1/1/2016')))
print(twodates)
onedate = Couplet('twodates', read_date('1/1/2015'))
我想检查onedate right couplet是否在两个对联的两个对联之间。
如果您需要更多解释,请与我们联系。
答案 0 :(得分:1)
以下是我使用的import
和一些示例CSV数据。 (您应该能够复制/粘贴并执行以下代码)。
from datetime import datetime, date
from io import StringIO
from algebraixlib.io.csv import import_csv
from algebraixlib.mathobjects import Set, Couplet
import algebraixlib.algebras.sets as sets
import algebraixlib.algebras.clans as clans
# Sample CSV as a string
mycsvfile = """col1,col2
1,date(01-01-2015)
2,date(01-01-2018)
3,date(04-01-2015)"""
首先,将CSV日期信息导入为Python日期对象,而不是字符串。
def read_date(date_str: str) -> datetime:
return datetime.strptime(date_str, 'date(%m-%d-%Y)').date()
# The read_date helper imports the date(...) strings as Python date objects
data_clan = import_csv(StringIO(mycsvfile), {'col1': int, 'col2': read_date})
这是数据代数翻译(作为一个部落):
{{('col1'->1), ('col2'->datetime.date(2015, 1, 1))}, {('col1'->2), ('col2'->datetime.date(2018, 1, 1))}, {('col1'->3), ('col2'->datetime.date(2015, 4, 1))}}
如果记录(作为关系)在日期范围内,则此函数record_in_range
返回True
。注意:此氏族中的每个关系都是左 - >右的函数;这会启用rel(left_value)
语法。
assert clans.is_functional(data_clan)
def record_in_range(rel):
date_value = rel('col2').value # .value extracts the raw literal from the Atom
return date(2014, 1, 1) < date_value < date(2016, 1, 1)
这可以与sets.restrict
操作配对,将您的战队过滤到该范围内的记录。
only_in_range = sets.restrict(data_clan, record_in_range)
print(only_in_range)
输出:
{{('col1'->1), ('col2'->datetime.date(2015, 1, 1))}, {('col1'->3), ('col2'->datetime.date(2015, 4, 1))}}
在您的问题中,您已使用twodates
关系对日期范围进行了编码。以下代码从那里提取日期值,而不是在record_in_range
函数中对其进行硬编码。
twodates = Set(Couplet('firstdate', date(2014, 1, 1)), Couplet('seconddate', date(2016, 1, 1)))
def between_two_dates(rel):
return twodates('firstdate').value < rel('col2').value < twodates('seconddate').value
only_in_range = sets.restrict(data_clan, between_two_dates)
print(only_in_range)
输出与上述相同。
希望这有帮助!