我对熊猫方法有疑问:read_sql 我从数据库中选择四列,大约选择100行。
import pymysql
sql = "SELECT `opens`,`high`,`low`,`close` FROM `dbname`"
result = ""
try:
with c as cursor:
cursor.execute(sql)
result = cursor.fetchall()
conn.commit()
finally:
conn.close()
print(result)
以上示例的结果以正确的格式返回值,而精度为double和存储在数据库中的数据。
opens high low close
0.00016445 0.00016445 0.00016445 0.00016445
但是:
import pandas as pd
df = pd.read_sql(sql,conn,coerce_float=False)
print(df)
结果是:
opens high low close
0.000164 0.000164 0.000164 0.000164
我需要使用数据库中的数据,并且在重新采样数据时会引起很多问题。有人可以帮我吗?
我正尝试更改演员表,并添加了选项'coerce_float = False' 但这似乎毫无价值
编辑9.07.2018-1:
SQL TABLE SHAME:
CREATE TABLE `dbname` (
`ids` int(11) NOT NULL AUTO_INCREMENT,
`timestamp` int(10) unsigned NOT NULL,
`high` double NOT NULL,
`low` double NOT NULL,
`opens` double NOT NULL,
`close` double NOT NULL,
`volume` double NOT NULL,
`weightedAverage` double NOT NULL,
PRIMARY KEY (`ids`)
) ENGINE=InnoDB AUTO_INCREMENT=16113 DEFAULT CHARSET=latin1
编辑10.07.2018-2: 重采样示例:
df.set_index('timestamp', inplace=True)
#converting timestamp to DatatimeIndex
df.index = pd.to_datetime(df.index, unit='s')
conversion = {'opens': 'first', 'high': 'max', 'low': 'min', 'close': 'last'}
#df = df.resample('15Min', how = conversion, base=0)
df = df.resample(self.period, closed='right').agg(conversion)
print(df)
编辑11.07.2018-编辑1 对于这个问题,我有部分解决方案: 我在执行任何操作前先添加了
pd.set_option('display.float_format', lambda x: ('%.8f' % x).rstrip('.0'))
好的,在该设置下一切正常。我解决了这个问题。也许有人会遇到同样的问题,并迅速找到我的解决方案。