很难理解我所知道的标题。我正在以这样的格式从CSV文件导入关键字:
"商业智能&#34 ;; "大数据&#34 ;;
带双引号的然后,我对这些关键字执行HTTP GET请求,如下所示:
"http://www.stepstone.de/5/ergebnisliste.html?ke="+ context.keywordname +"&li=1000000"
我的输出文件执行此操作:
"C:/Talend/workspace/WEBCRAWLER/output/keywords_" + context.keywordname +".txt"
显然你不能在文件名中写双引号。作为解决方法,我该怎么办? 我已经尝试过添加"在获取请求中,但不幸的是它没有成功!
谢谢!
答案 0 :(得分:0)
对文件使用HTML编码:
"Business Intelligence";"Big Data";
会变成
"Business Intelligence";"Big Data";
我使用了以下网站:http://www.opinionatedgeek.com/DotNet/Tools/HTMLEncode/encode.aspx
不幸的是,在Talend中没有简单的方法可以尝试使用: java.net.URLEncoder中 http://docs.oracle.com/javase/7/docs/api/java/net/URLEncoder.html
答案 1 :(得分:0)
如果你想用关键字创建文件名,那么你可以使用替换功能替换/删除关键字双引号,请查看下面的代码,我认为这对你有用。
"C:/Talend/workspace/WEBCRAWLER/output/keywords_" + context.keywordname.replace("\"\"", "") +".txt"