使用Jsoup解析文本文件

时间:2013-01-13 05:38:15

标签: android parsing html-parsing jsoup android-file

我的res / raw文件夹中有Continent.txt个文件。里面包含以下内容。

<div class="continents"> 
  <a href="#US">US</a> 
  <a href="#CA">Canada</a> 
  <a href="#EU">Europe</a> 
</div> 

我可以使用jsoup解析文本美国,加拿大,欧洲,但是当我将它们显示到TextView时,它们会显示在一行中。输出看起来像这样。

美国加拿大欧洲

我希望输出像这样。

US

加拿大

欧洲

这是我的代码。

package com.example.readfile;


import java.io.InputStream;
import java.util.ArrayList;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import android.os.AsyncTask;
import android.os.Bundle;
import android.app.Activity;
import android.content.res.Resources;
import android.widget.TextView;

public class MainActivity extends Activity {
    TextView txtContinent;

    @Override
    protected void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_main);

        txtContinent = (TextView) findViewById(R.id.textView1);

        new MyTask().execute();
    }

    class MyTask extends AsyncTask<Void, Void, ArrayList<String>> {

        ArrayList<String> arr_linkText = new ArrayList<String>();

        @Override
        protected ArrayList<String> doInBackground(Void... params) {

            Document doc;

            try {
                Resources res = getResources();
                InputStream in_s = res.openRawResource(R.raw.continent);

                byte[] b = new byte[in_s.available()];
                in_s.read(b);

                doc = Jsoup.parse(new String(b));
                Element link = doc.select("a").first();
                String text = doc.body().text(); 

                arr_linkText.add(text);

            } catch (Exception e) {
                // e.printStackTrace();
                txtContinent.setText("Error: can't open file.");
            }

            return arr_linkText; // << retrun ArrayList from here
        }

        @Override
        protected void onPostExecute(ArrayList<String> result) {

            for (String temp_result : result) {

                txtContinent.append(temp_result + "\n");
            }

        }

    }

}

我不知道如何逐行阅读文件,希望有人可以向我说明。谢谢!

2 个答案:

答案 0 :(得分:1)

您正在立即获取整个文档正文。您需要按每个元素解析它,如此

Elements links = doc.select("a");
for (Element link : links) {
    arr_linkText.add(link.text());
}

如果不清楚,上面的代码意味着替换以下内容 -

Element link = doc.select("a").first();
String text = doc.body().text(); 

arr_linkText.add(text);

答案 1 :(得分:0)

您是否已将android:inputType设置为包含textMultiLine