我尝试使用Google CPB100 - Lab3b(train_and_apply.py)运行脚本,使用针对SLQ(mysql ddbb)的dataproc但是我超时了。
Caused by: java.net.ConnectException: Connection timed out (Connection timed out)
从dataproc master我可以使用mysql命令行连接,但不能使用脚本中的python命令。我可以做些什么来诊断这个问题?
成功
$> mysql --host=35.194.7.XXX --user=root --password
超时
$> pyspark
%> jdbcDriver='com.mysql.jdbc.Driver'
%> jdbcUrl='jdbc:mysql://35.194.7.XXX:3306/recommendation_spark?user=root&password=XXXX'
%> dfRates = sqlContext.read.format('jdbc').options(driver=jdbcDriver, url=jdbcUrl, dbtable='Rating').load()
答案 0 :(得分:1)
根据您的问题,我不确定会出现什么问题,但我建议您按照this StackOverflow post中的说明编辑log4j配置,以查看com.mysql或org.apache下是否有重要信息或调试日志.spark.sql.jdbc。