当我在Jupyter笔记本中执行以下代码时出现错误
File "<ipython-input-1-69ae760fc196>", line 11
cd hp1.csv
^
SyntaxError: invalid syntax
我该怎么做才能删除错误
spark = SparkSession \
.builder \
.appName("Python Spark SQL basic example") \
.config("spark.some.config.option", "some-value") \
.getOrCreate()
df = spark.read.csv("hp.csv")
ds=df.select('_c3')
ds.write.csv('hp1.csv')
cd hp1.csv
mv *.csv hp2.csv
cp hp2.csv /home/priya/project
cd ..
答案 0 :(得分:0)
我会为不同的命令创建一个新的单元格,因此,python命令在它们自己的单元格上运行,而bash命令在不同的单元格中运行。
单元格1:
spark = SparkSession \
.builder \
.appName("Python Spark SQL basic example") \
.config("spark.some.config.option", "some-value") \
.getOrCreate()
df = spark.read.csv("hp.csv")
ds=df.select('_c3')
ds.write.csv('hp1.csv')
单元格2:
%%bash
mv *.csv hp2.csv
cp hp2.csv /home/priya/project
cd ..
注意单元格2开头的%%bash
,这告诉jupyter使用bash语法。