在使用Jsoup解析html时,我需要一些帮助以保持换行符。
我已经尝试过研究和尝试本网站上的内容,但无法找到其中任何一种方法。
我对编码很新,所以更容易解释。
提前致谢!
public class MainActivity extends AppCompatActivity {
TextView content;
@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
content=(TextView)findViewById(R.id.content0);
Button but=(Button) findViewById(R.id.but1);
but.setOnClickListener(new View.OnClickListener() {
@Override
public void onClick(View v) {
System.out.println("parse button pressed");
new doit().execute();
}
});
}
public class doit extends AsyncTask<Void,Void,Void>{
String words;
@Override
protected Void doInBackground(Void... params) {
System.out.println("parsing");
try {
Document doc = Jsoup.connect("http://daltonschool.kr/homeeng/04schoollife/040203schoollife.html").get();
words=doc.select("table.cafeteria tbody tr td").eq(3).text();
}catch(Exception e){e.printStackTrace();}
return null;
}
@Override
protected void onPostExecute(Void aVoid) {
super.onPostExecute(aVoid);
content.setText(words);
}
}
}
答案 0 :(得分:0)
我试图以这种方式保留<br>
。我不知道最好的想法就像黑客一样。
public class Test {
public static void main(String[] args) {
try {
Document doc = Jsoup.connect("http://daltonschool.kr/homeeng/04schoollife/040203schoollife.html").get();
String words = doc.select("table.cafeteria tbody tr td").eq(3).html();
String temp = words.replace("<br>", "$$$");
Document doc1 = Jsoup.parse(temp);
String text = doc1.body().text().replace("$$$", "\n").toString();
System.out.println(text);
} catch (Exception e) {
e.printStackTrace();
}
}
}
输出:
-Korean Food-
Spicy Stir-fried Pork&Kimchi w/Rice
Kelp&Radish Soup
Kkakdugi
*Salad Bar:Spaghetti S
-Western Food-
Hurigake Rice
Sweet Chili Chicken
*Salad Bar:spaghetti S
(Veg: Pollack Pancake)