所以我有这段使用JSoup的代码,我认为它不能正常工作(因为大多数使用JSoup的东西需要至少一点点修补才能正确)。但是,我一直在尝试和尝试,但我的代码不会在Android Studio中运行。最后,我试着用Eclipse和唉运气,同样的代码块工作得很好!当然,由于我正在开发一款应用程序,我需要在Android Studio上运行此代码,但我不知道如何让它运行!
以下是在Eclipse上运行的代码块,但不是Studio:
String link= doc.select("div.searchTemplate.listLayout.so_us_en")
.select("div[id= topDynamicContent]")
.select("div.a-row.a-spacing-base.searchUndoAUIHacks")
.select("div.a-row")
.select("div.a-column.a-span8.a-spacing-none")
.select("div.s-first-column")
.select("h2.a-size-base.a-spacing-small.a-spacing-top-small.a-text-normal").first().text();
System.out.println(link);
int listSize= Integer.parseInt(link.substring(2,4));
System.out.println(listSize);
以下是Studio给我的错误消息:
08-09 23:46:30.939 32525-532/com.velesapp.jsouptutorial W/System.err: java.lang.NullPointerException: Attempt to invoke virtual method 'java.lang.String org.jsoup.nodes.Element.text()' on a null object reference
08-09 23:46:30.939 32525-532/com.velesapp.jsouptutorial W/System.err: at com.velesapp.jsouptutorial.MainActivity$getProductAttributes.doInBackground(MainActivity.java:82)
08-09 23:46:30.939 32525-532/com.velesapp.jsouptutorial W/System.err: at com.velesapp.jsouptutorial.MainActivity$getProductAttributes.doInBackground(MainActivity.java:58)
08-09 23:46:30.939 32525-532/com.velesapp.jsouptutorial W/System.err: at android.os.AsyncTask$2.call(AsyncTask.java:305)
08-09 23:46:30.939 32525-532/com.velesapp.jsouptutorial W/System.err: at java.util.concurrent.FutureTask.run(FutureTask.java:237)
08-09 23:46:30.939 32525-532/com.velesapp.jsouptutorial W/System.err: at android.os.AsyncTask$SerialExecutor$1.run(AsyncTask.java:243)
08-09 23:46:30.939 32525-532/com.velesapp.jsouptutorial W/System.err: at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1133)
08-09 23:46:30.939 32525-532/com.velesapp.jsouptutorial W/System.err: at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:607)
08-09 23:46:30.939 32525-532/com.velesapp.jsouptutorial W/System.err: at java.lang.Thread.run(Thread.java:761)
对于这两个IDE,导入完全相同,我通过Android Studio使用AsyncTask运行该过程,但没有在Eclipse中使用任何线程。
以下是完整代码:
import android.os.AsyncTask;
import android.support.v7.app.AppCompatActivity;
import android.os.Bundle;
import android.view.View;
import android.widget.Button;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class MainActivity extends AppCompatActivity {
Button but;
@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
but = (Button)findViewById(R.id.but1);
but.setOnClickListener(new View.OnClickListener() {
@Override
public void onClick(View view) {
new getProductAttributes("https://www.amazon.com/s/ref=nb_sb_noss_1?url=search-alias%3Delectronics&field-keywords=rx+390").execute();
}
});
}
public class getProductAttributes extends AsyncTask<Void,Void,Void>{
String url;
int listSize;
public getProductAttributes(String url){
this.url = url;
}
protected Void doInBackground (Void... voids) {
try{
Document doc = Jsoup.connect(url).get();
String link= doc.select("div.searchTemplate.listLayout.so_us_en")
.select("div[id= topDynamicContent]")
.select("div.a-row.a-spacing-base.searchUndoAUIHacks")
.select("div.a-row")
.select("div.a-column.a-span8.a-spacing-none")
.select("div.s-first-column")
.select("h2.a-size-base.a-spacing-small.a-spacing-top-small.a-text-normal").first().text();
System.out.println(link);
listSize= Integer.parseInt(link.substring(2,4));
System.out.println(listSize);
}catch (Exception e){e.printStackTrace();}
return null;
}
@Override
protected void onPostExecute(Void aVoid) {
super.onPostExecute(aVoid);
}
谢谢你的时间!
答案 0 :(得分:1)
我检查了你的代码,它完全没问题并正常工作。
另一方面,在div
容器上首次选择的是什么不起作用。
我的意思是:
doc.select("div.searchTemplate.listLayout.so_us_en")
因为DOM树中不存在listLayout
。
我对您要解析的网站进行了一些研究。您应该将listLayout
更改为:correctedResultsLayout
。
然后会产生以下结果:
String link = doc.select("div.searchTemplate.correctedResultsLayout.so_us_en")
.select("div[id= topDynamicContent]")
.select("div.a-row.a-spacing-base.searchUndoAUIHacks")
.select("div.a-row")
.select("div.a-column.a-span8.a-spacing-none")
.select("div.s-first-column")
.select("h2.a-size-base.a-spacing-small.a-spacing-top-small.a-text-normal").first().text();
我还对您的substring
方法进行了一些更改:
System.out.println(link);
listSize = Integer.parseInt(link.substring(0, 2));
System.out.println(listSize);
然后将打印找到的结果数量(在我的情况下:21)
注意:请记住,您可能需要更改此内容!
编辑:
给你一点建议或改进的问题。只搜索匹配的ID会不会更好/更好,不是吗?在这种情况下,您可以提高自己代码的可读性。
对于您的选择,这意味着 - 将杀手doc.select(....)...
语句更改为更小的可读性:
String link = doc.select("h2#s-result-count").first().text();