我正在尝试用Java运行这个Python程序。
问题: 当我从Commandline运行这个程序时: Python msp.py dennys-san-jose-2 - 它工作
当我通过这个java程序调用相同的脚本时。它终止了。 我测试了其他python脚本,它们可以工作!
public void pythonrun(String args) throws IOException, InterruptedException
{
String pythonScriptPath = "/yelp/msp.py";
String[] cmd = new String[2 + args.length()];
cmd[0] = "C:\\Python27\\python.exe";
cmd[1] = pythonScriptPath;
for(int i = 0; i < args.length(); i++) {
cmd[i+2] = args;
}
// create runtime to execute external command
Runtime rt = Runtime.getRuntime();
Process pr = rt.exec(cmd);
//pr.waitFor();
// retrieve output from python script
BufferedReader bfr = new BufferedReader(new InputStreamReader(pr.getInputStream()));
String line = "";
while((line = bfr.readLine()) != null) {
// display each output line form python script
System.out.println(line);
}
}
public static void main(String args[]) throws IOException, InterruptedException {
YelpPython demo = new YelpPython();
demo.pythonrun("dennys-san-jose-2");
}
脚本(msp.py):
它做什么? (简而言之,脚本会转到页面并删除评论)
from bs4 import BeautifulSoup
from urllib import urlopen
import sys
queries = 0
while queries <201:
stringQ = sys.argv[1]
page = urlopen('http://www.yelp.com/biz/' + stringQ)
soup = BeautifulSoup(page)
reviews = soup.findAll('p', attrs={'itemprop':'description'})
authors = soup.findAll('span', attrs={'itemprop':'author'})
flag = True
indexOf = 1
for review in reviews:
dirtyEntry = str(review)
while dirtyEntry.index('<') != -1:
indexOf = dirtyEntry.index('<')
endOf = dirtyEntry.index('>')
if flag:
dirtyEntry = dirtyEntry[endOf+1:]
flag = False
else:
if(endOf+1 == len(dirtyEntry)):
cleanEntry = dirtyEntry[0:indexOf]
break
else:
dirtyEntry = dirtyEntry[0:indexOf]+dirtyEntry[endOf+1:]
f=open("reviews.txt", "a")
f.write(cleanEntry)
f.write("\n")
f.close
queries = queries + 40
问题(简而言之):
当我通过命令行运行此脚本时,它可以工作,最终存储 reviews.txt 文件。但是当我通过这个程序运行时没有任何反应。
我玩过pr.wait()和pr.waitfor(),但没有任何反应。
请建议。
谢谢。
答案 0 :(得分:1)
public void pythonrun(String args) throws IOException, InterruptedException {
String pythonScriptPath = "/yelp/msp.py";
String[] cmd = new String[2 + args.length()];
cmd[0] = "C:\\Python27\\python.exe";
cmd[1] = pythonScriptPath;
for(int i = 0; i < args.length(); i++) {
cmd[i+2] = args;
}
:
}
这看起来不太合适。您正在创建一个字符串数组,其大小基于传入的字符串的大小。
这意味着pythonrun("1234")
将最终执行:
C:\Python27\python.exe /yel/msp.py 1234 1234 1234 1234
如果您只想传递脚本的单个参数,您可以执行以下操作:
public void pythonrun(String args) throws IOException, InterruptedException {
String pythonScriptPath = "/yelp/msp.py";
String[] cmd = new String[3];
cmd[0] = "C:\\Python27\\python.exe";
cmd[1] = pythonScriptPath;
cmd[2] = args;
:
}
如果你想传入数组的参数,那么这样的事情会更好:
public void pythonrun(String [] args) throws IOException, InterruptedException {
String pythonScriptPath = "/yelp/msp.py";
String[] cmd = new String[2 + args.length()];
cmd[0] = "C:\\Python27\\python.exe";
cmd[1] = pythonScriptPath;
for(int i = 0; i < args.length(); i++) {
cmd[i+2] = args[i];
}
:
}
您可以通过在设置代码之后放置以下代码,告诉确切正在使用哪些参数:
for (int i = 0; i < cmd.length(); i++)
System.out.println ("DEBUG " + i + ": [" + cmd[i] + "]");
除此之外,您的命令行版本与从Java程序调用的版本之间可能存在差异。
首先,您的Java程序正在调用/yelp/msp.py
而您的命令行版本直接调用msp.py
。您确定msp.py
脚本实际上是 /yelp
吗?
还要确保C:\Python27\python.exe
是正确的Python解释器。
最后,检查Java程序运行时您所在的目录。如果它不是您所期望的,您可能会在一个完全出乎意料的地方创建reviews.txt
。
答案 1 :(得分:0)
String python_script_path ="Path to Python script/";
ProcessBuilder pb = new ProcessBuilder("python","msp.py","parameter1","parameter2");
pb.directory(new File(python_script_path));
Process process = pb.start();
InputStream is = process.getInputStream();
InputStreamReader isr = new InputStreamReader(is);
BufferedReader br1 = new BufferedReader(isr);
String line1;
while ((line1 = br1.readLine()) != null) {
System.out.println(line1);
}
使用Processbuilder并设置路径变量
答案 2 :(得分:0)
我已经设法找到了这个解决方案,尽管我还没有得到它。
我使用相同的代码,它适用于Ubuntu。
cmd[0] = "python";
这是我修改过的所有内容,我运行了相同的脚本和b00m,它可以正常工作!
问题是为什么?