! # $ % & ( ) * , - 0 / : < = > ? @ [ \ ] ^
这是我的csv文件的标题..在:之后你可以看到一个空白空间,比如我的csv文件标题还包含一个标题为blank.how的列,可以通过更新以下代码来删除吗? / p>
feature_list = ""
root_flag = 'false'
fvt_length = 0
output_file="/home/user/Project/Dataset/unigram_FVT.csv"
feature_vector_file1 = "/home/user/Project/Dataset/BST_unigram.txt"
d = os.path.dirname(output_file)
if not os.path.exists(d):
os.makedirs(d)
with open(output_file, "w" ) as fout:
fp_feature = csv.writer(fout)
fileread=open(feature_vector_file1,"r")
read_list=fileread.read()
read_list=dataPreprocessing.remove_words_less_than_3(read_list)
read_list = read_list.replace('\n','')
read_list = re.sub( '\s+', ' ',read_list).strip()
read_list = dataPreprocessing.remove_digits(read_list)
unigram_list=list(set(read_list.split(" ")))
for i in range(0,len(unigram_list)):
unigram_list[i]=unigram_list[i].lstrip().rstrip()
if root_flag == 'false' :
root = Node(unigram_list[i])
root_flag = 'true'
else :
root.insert(unigram_list[i])
feature_list = feature_list + "\n"+unigram_list[i]
feature_list1 = feature_list.strip()
line = feature_list1.split('\n')
line.sort()
line.append("Gender")
root.print_tree()
print len(line)
fp_feature.writerow(line)
FVT_unigram()
任何人都可以帮助我吗?有时我的文件内容包含一些空格,但我添加了这个unigram_list[i]=unigram_list[i].lstrip().rstrip()
,但我的标题仍然包含空格。
答案 0 :(得分:0)
前几天我的程序遇到了类似的问题,我意识到最简单的事情就是写一个简单的if语句,然后创建一个新的字符串/列表:
aStr = "Hello World this is a test!"
newStr = ""
for letter in aStr:
if letter!=" ":
newStr += letter
当我打印newStr时:
HelloWorldthisisatest!