我有一个MapReduce程序,可以处理分隔,固定宽度和Excel文件。读取分隔和固定宽度文件没有问题。但Excel文件的问题是setup()和cleanup()方法被调用,而不是map()。我尝试向map()添加注释仍然没有用。
pagination.next_url
Excel Mapper:
from pyspark.sql.types import DecimalType
<your code>
output_df = ip_df.withColumn("col_value",ip_df["col_value"].cast(DecimalType()))