我无法删除 csv 行中的\ u和相关文本,这些文本不以这些特定字符开头,即; \Ú**。
代码:
# Removing \u*?
import pandas as pd
reader=pd.read_csv('string_HT.csv', error_bad_lines=False)
for index,row in reader.iterrows():
if ("\u","\u*?","*?\u") in row['Hashtags'] :
row['Hashtags'] = " "
reader.to_csv("string_HT2.csv", index=False)
示例输入df:
df=pd.DataFrame({"Hashtags" : ["#DefendTheLand", "#526f\u696d\u7d39\u4ecb", "#30ac\u30f3\u30c0\u30e0", "#leadership" ]})
示例输出:
{"Hashtags" : ["#DefendTheLand", " ", " ", "#leadership"]}
我知道有类似的问题已被问及我已经完成了大部分问题,并尝试实施其他用户提供的所有方法,但我仍然无法正确理解。帮助将不胜感激。
注意:
我已在原始文件中尝试使用此代码进行初始清理。
for index,row in df1.iterrows():
df1['Hashtags'] =df1['Hashtags'].str.strip("u' ',").str.strip("u'").str.strip("\u*?]").str.strip("u']").str.strip("',")