解析Android上的查询字符串

时间:2009-11-03 13:15:25

标签: java android parsing url

Java EE有ServletRequest.getParameterValues()

在非EE平台上,URL.getQuery()只返回一个字符串。

在Java EE上时正确解析URL中的查询字符串的正常方法是什么?


<的咆哮>

在尝试制作自己的解析器的答案中很受欢迎。这是一个非常有趣且令人兴奋的微编码项目,但 我不能说这是一个好主意 :(

下面的代码片段通常有缺陷或破损,顺便说一下。打破它们对读者来说是一个有趣的练习。 黑客攻击使用它们的网站

解析查询字符串是一个明确定义的问题,但阅读规范并理解细微差别并非易事。让一些平台库编码器为你做好工作并为你做好修复会好得多!

<的 /咆哮>

25 个答案:

答案 0 :(得分:200)

在Android上:

import android.net.Uri;

[...]

Uri uri=Uri.parse(url_string);
uri.getQueryParameter("para1");

答案 1 :(得分:64)

答案 2 :(得分:59)

因为Android M的事情变得更加复杂。 android.net.URI。getQueryParameter()的答案有一个在JellyBean之前打破空格的bug。 Apache URLEncodedUtils.parse()工作,但deprecated in Lremoved in M

所以现在最好的答案是UrlQuerySanitizer。这已经存在于API级别1并且仍然存在。它还让您考虑棘手的问题,例如如何处理特殊字符或重复值。

最简单的代码是

UrlQuerySanitizer.ValueSanitizer sanitizer = UrlQuerySanitizer.getAllButNullLegal();
// remember to decide if you want the first or last parameter with the same name
// If you want the first call setPreferFirstRepeatedParameter(true);
sanitizer.parseUrl(url);
String value = sanitizer.getValue("paramname"); // get your value

答案 3 :(得分:25)

这是BalusC's answer,但它会编译并返回结果:

public static Map<String, List<String>> getUrlParameters(String url)
        throws UnsupportedEncodingException {
    Map<String, List<String>> params = new HashMap<String, List<String>>();
    String[] urlParts = url.split("\\?");
    if (urlParts.length > 1) {
        String query = urlParts[1];
        for (String param : query.split("&")) {
            String pair[] = param.split("=");
            String key = URLDecoder.decode(pair[0], "UTF-8");
            String value = "";
            if (pair.length > 1) {
                value = URLDecoder.decode(pair[1], "UTF-8");
            }
            List<String> values = params.get(key);
            if (values == null) {
                values = new ArrayList<String>();
                params.put(key, values);
            }
            values.add(value);
        }
    }
    return params;
}

答案 4 :(得分:22)

如果你的类路径上有jetty(服务器或客户端)库,你可以使用jetty util类(参见javadoc),例如:

import org.eclipse.jetty.util.*;
URL url = new URL("www.example.com/index.php?foo=bar&bla=blub");
MultiMap<String> params = new MultiMap<String>();
UrlEncoded.decodeTo(url.getQuery(), params, "UTF-8");

assert params.getString("foo").equals("bar");
assert params.getString("bla").equals("blub");

答案 5 :(得分:13)

如果你使用的是Spring 3.1或更高版本(yikes,希望支持能够进一步发展),你可以使用UriComponentsUriComponentsBuilder

UriComponents components = UriComponentsBuilder.fromUri(uri).build();
List<String> myParam = components.getQueryParams().get("myParam");

components.getQueryParams()返回MultiValueMap<String, String>

Here's some more documentation

答案 6 :(得分:5)

对于servlet或JSP页面,您可以使用request.getParameter(“paramname”)

获取查询字符串键/值对
String name = request.getParameter("name");

还有其他方法可以做到,但这就是我在我创建的所有servlet和jsp页面中的方式。

答案 7 :(得分:4)

我有实现这个目标的方法:

<强> 1)

public static String getQueryString(String url, String tag) {
    String[] params = url.split("&");
    Map<String, String> map = new HashMap<String, String>();
    for (String param : params) {
        String name = param.split("=")[0];
        String value = param.split("=")[1];
        map.put(name, value);
    }

    Set<String> keys = map.keySet();
    for (String key : keys) {
        if(key.equals(tag)){
         return map.get(key);
        }
        System.out.println("Name=" + key);
        System.out.println("Value=" + map.get(key));
    }
    return "";
}

2)使用Uri课程的最简单方法:

public static String getQueryString(String url, String tag) {
    try {
        Uri uri=Uri.parse(url);
        return uri.getQueryParameter(tag);
    }catch(Exception e){
        Log.e(TAG,"getQueryString() " + e.getMessage());
    }
    return "";
}

这是一个如何使用两种方法之一的例子:

String url = "http://www.jorgesys.com/advertisements/publicidadmobile.htm?position=x46&site=reform&awidth=800&aheight=120";      
String tagValue = getQueryString(url,"awidth");

tagValue的值为800

答案 8 :(得分:4)

解析查询字符串比看起来要复杂一些,具体取决于你想要的宽容程度。

首先,查询字符串是ascii字节。您可以一次读取这些字节并将它们转换为字符。如果角色是?或者&amp;然后它发出参数名称的开始信号。如果字符是=则它表示参数值的开始。如果字符是%,则它表示编码字节的开始。这是它变得棘手的地方。

当您读入%char时,您必须读取接下来的两个字节并将它们解释为十六进制数字。这意味着接下来的两个字节将是0-9,a-f或A-F。将这两个十六进制数字粘在一起以获取字节值。但请记住,字节不是字符。您必须知道用于编码字符的编码。字符é在UTF-8中的编码与ISO-8859-1中的编码相同。通常,不可能知道给定字符集使用了什么编码。我总是使用UTF-8,因为我的网站配置为始终使用UTF-8提供所有服务,但实际上你无法确定。一些用户代理会告诉您请求中的字符编码;如果您有完整的HTTP请求,可以尝试阅读。如果你只是孤立的网址,祝你好运。

无论如何,假设您使用的是UTF-8或其他一些多字节字符编码,现在您已经解码了一个编码字节,您必须将它放在一边,直到您捕获下一个字节为止。您需要所有编码的字节在一起,因为您不能一次正确解码一个字节。将所有字节放在一起,然后一次解码它们以重建你的角色。

另外,如果您想要宽容并且考虑到破坏网址的用户代理,它会变得更有趣。例如,一些Webmail客户端对事物进行了双重编码。或者加倍?&amp; =字符(例如:http://yoursite.com/blah??p1==v1&&p2==v2)。如果您想尝试优雅地处理此问题,则需要向解析器添加更多逻辑。

答案 9 :(得分:4)

在Android上,我尝试使用@diyism回答,但我遇到了@rpetrich提出的空格字符问题,例如: 我填写了一个表单,username = "us+us"password = "pw pw"导致网址字符串如下:

http://somewhere?username=us%2Bus&password=pw+pw

但是,@ diyism代码返回"us+us""pw+pw",即它不会检测空格字符。如果使用%20重写了URL,则会识别出空格字符:

http://somewhere?username=us%2Bus&password=pw%20pw

这导致以下修复:

Uri uri = Uri.parse(url_string.replace("+", "%20"));
uri.getQueryParameter("para1");

答案 10 :(得分:3)

在Android上,您可以使用android.net.Uri类的Uri.parse静态方法来完成繁重的工作。如果您正在使用URI和Intent做任何事情,那么无论如何都要使用它。

答案 11 :(得分:3)

在Android上它的简单如下代码:

UrlQuerySanitizer sanitzer = new UrlQuerySanitizer(url);
String value = sanitzer.getValue("your_get_parameter");

此外,如果您不想注册每个预期的查询密钥,请使用:

sanitzer.setAllowUnregisteredParamaters(true)

致电之前:

sanitzer.parseUrl(yourUrl)

答案 12 :(得分:3)

仅供参考,这是我最终得到的结果(基于URLEncodedUtils,并返回Map)。

特点:

  • 它接受网址的查询字符串部分(您可以使用request.getQueryString()
  • 空查询字符串将生成空Map
  • 没有值的参数(?test)将映射到空List<String>

代码:

public static Map<String, List<String>> getParameterMapOfLists(String queryString) {
    Map<String, List<String>> mapOfLists = new HashMap<String, List<String>>();
    if (queryString == null || queryString.length() == 0) {
        return mapOfLists;
    }
    List<NameValuePair> list = URLEncodedUtils.parse(URI.create("http://localhost/?" + queryString), "UTF-8");
    for (NameValuePair pair : list) {
        List<String> values = mapOfLists.get(pair.getName());
        if (values == null) {
            values = new ArrayList<String>();
            mapOfLists.put(pair.getName(), values);
        }
        if (pair.getValue() != null) {
            values.add(pair.getValue());
        }
    }

    return mapOfLists;
}

兼容性帮助程序(值存储在String数组中,就像在ServletRequest.getParameterMap()中一样):

public static Map<String, String[]> getParameterMap(String queryString) {
    Map<String, List<String>> mapOfLists = getParameterMapOfLists(queryString);

    Map<String, String[]> mapOfArrays = new HashMap<String, String[]>();
    for (String key : mapOfLists.keySet()) {
        mapOfArrays.put(key, mapOfLists.get(key).toArray(new String[] {}));
    }

    return mapOfArrays;
}

答案 13 :(得分:3)

这对我有用.. 我不确定为什么每个人都在追踪Map,List&gt; 我只需要一个简单的名称值Map。

为了简单起见,我在URI.getQuery()中使用了构建;

public static Map<String, String> getUrlParameters(URI uri)
    throws UnsupportedEncodingException {
    Map<String, String> params = new HashMap<String, String>();
    for (String param : uri.getQuery().split("&")) {
        String pair[] = param.split("=");
        String key = URLDecoder.decode(pair[0], "UTF-8");
        String value = "";
        if (pair.length > 1) {
            value = URLDecoder.decode(pair[1], "UTF-8");
        }
        params.put(new String(key), new String(value));
    }
    return params;
}

答案 14 :(得分:2)

Guava的Multimap更适合这种情况。这是一个简短的干净版本:

Multimap<String, String> getUrlParameters(String url) {
        try {
            Multimap<String, String> ret = ArrayListMultimap.create();
            for (NameValuePair param : URLEncodedUtils.parse(new URI(url), "UTF-8")) {
                ret.put(param.getName(), param.getValue());
            }
            return ret;
        } catch (URISyntaxException e) {
            throw new RuntimeException(e);
        }
    }

答案 15 :(得分:1)

答案 16 :(得分:0)

在这里回答,因为这是一个受欢迎的话题。这是Kotlin中的干净解决方案,它使用推荐的UrlQuerySanitizer API。 See the official documentation。我添加了一个字符串生成器来连接和显示参数。

    var myURL: String? = null
    // if the url is sent from a different activity where you set it to a value
    if (intent.hasExtra("my_value")) {
        myURL = intent.extras.getString("my_value")
    } else {
        myURL = intent.dataString
    }

    val sanitizer = UrlQuerySanitizer(myURL)
    // We don't want to manually define every expected query *key*, so we set this to true
    sanitizer.allowUnregisteredParamaters = true
    val parameterNamesToValues: List<UrlQuerySanitizer.ParameterValuePair> = sanitizer.parameterList
    val parameterIterator: Iterator<UrlQuerySanitizer.ParameterValuePair> = parameterNamesToValues.iterator()

    // Helper simply so we can display all values on screen
    val stringBuilder = StringBuilder()

    while (parameterIterator.hasNext()) {
        val parameterValuePair: UrlQuerySanitizer.ParameterValuePair = parameterIterator.next()
        val parameterName: String = parameterValuePair.mParameter
        val parameterValue: String = parameterValuePair.mValue

        // Append string to display all key value pairs
        stringBuilder.append("Key: $parameterName\nValue: $parameterValue\n\n")
    }

    // Set a textView's text to display the string
    val paramListString = stringBuilder.toString()
    val textView: TextView = findViewById(R.id.activity_title) as TextView
    textView.text = "Paramlist is \n\n$paramListString"

    // to check if the url has specific keys
    if (sanitizer.hasParameter("type")) {
        val type = sanitizer.getValue("type")
        println("sanitizer has type param $type")
    }

答案 17 :(得分:0)

最初回答here

在Android上,包 android.net 中有Uri类。请注意,Uri是android.net的一部分,而URI是java.net的一部分。

Uri类具有许多提取查询键值对的功能。 enter image description here

以下功能以HashMap的形式返回键值对。

在Java中:

Map<String, String> getQueryKeyValueMap(Uri uri){
    HashMap<String, String> keyValueMap = new HashMap();
    String key;
    String value;

    Set<String> keyNamesList = uri.getQueryParameterNames();
    Iterator iterator = keyNamesList.iterator();

    while (iterator.hasNext()){
        key = (String) iterator.next();
        value = uri.getQueryParameter(key);
        keyValueMap.put(key, value);
    }
    return keyValueMap;
}

在科特林:

fun getQueryKeyValueMap(uri: Uri): HashMap<String, String> {
        val keyValueMap = HashMap<String, String>()
        var key: String
        var value: String

        val keyNamesList = uri.queryParameterNames
        val iterator = keyNamesList.iterator()

        while (iterator.hasNext()) {
            key = iterator.next() as String
            value = uri.getQueryParameter(key) as String
            keyValueMap.put(key, value)
        }
        return keyValueMap
    }

答案 18 :(得分:0)

使用番石榴:

Multimap<String,String> parseQueryString(String queryString, String encoding) {
    LinkedListMultimap<String, String> result = LinkedListMultimap.create();

    for(String entry : Splitter.on("&").omitEmptyStrings().split(queryString)) {
        String pair [] = entry.split("=", 2);
        try {
            result.put(URLDecoder.decode(pair[0], encoding), pair.length == 2 ? URLDecoder.decode(pair[1], encoding) : null);
        } catch (UnsupportedEncodingException e) {
            throw new RuntimeException(e);
        }
    }

    return result;
}

答案 19 :(得分:0)

使用Apache HttpComponents并将其与某些集合代码连接起来以按值访问params:http://www.joelgerard.com/2012/09/14/parsing-query-strings-in-java-and-accessing-values-by-key/

答案 20 :(得分:0)

public static Map <String, String> parseQueryString (final URL url)
        throws UnsupportedEncodingException
{
    final Map <String, String> qps = new TreeMap <String, String> ();
    final StringTokenizer pairs = new StringTokenizer (url.getQuery (), "&");
    while (pairs.hasMoreTokens ())
    {
        final String pair = pairs.nextToken ();
        final StringTokenizer parts = new StringTokenizer (pair, "=");
        final String name = URLDecoder.decode (parts.nextToken (), "ISO-8859-1");
        final String value = URLDecoder.decode (parts.nextToken (), "ISO-8859-1");
        qps.put (name, value);
    }
    return qps;
}

答案 21 :(得分:0)

根据BalusC的回答,我写了一些示例-Java-Code:

    if (queryString != null)
    {
        final String[] arrParameters = queryString.split("&");
        for (final String tempParameterString : arrParameters)
        {
            final String[] arrTempParameter = tempParameterString.split("=");
            if (arrTempParameter.length >= 2)
            {
                final String parameterKey = arrTempParameter[0];
                final String parameterValue = arrTempParameter[1];
                //do something with the parameters
            }
        }
    }

答案 22 :(得分:0)

我认为JRE中没有一个。您可以在Apache HttpClient等其他软件包中找到类似的功能。如果您不使用任何其他包,您只需编写自己的包。这并不难。这是我使用的,

public class QueryString {

 private Map<String, List<String>> parameters;

 public QueryString(String qs) {
  parameters = new TreeMap<String, List<String>>();

  // Parse query string
     String pairs[] = qs.split("&");
     for (String pair : pairs) {
            String name;
            String value;
            int pos = pair.indexOf('=');
            // for "n=", the value is "", for "n", the value is null
         if (pos == -1) {
          name = pair;
          value = null;
         } else {
       try {
        name = URLDecoder.decode(pair.substring(0, pos), "UTF-8");
              value = URLDecoder.decode(pair.substring(pos+1, pair.length()), "UTF-8");            
       } catch (UnsupportedEncodingException e) {
        // Not really possible, throw unchecked
           throw new IllegalStateException("No UTF-8");
       }
         }
         List<String> list = parameters.get(name);
         if (list == null) {
          list = new ArrayList<String>();
          parameters.put(name, list);
         }
         list.add(value);
     }
 }

 public String getParameter(String name) {        
  List<String> values = parameters.get(name);
  if (values == null)
   return null;

  if (values.size() == 0)
   return "";

  return values.get(0);
 }

 public String[] getParameterValues(String name) {        
  List<String> values = parameters.get(name);
  if (values == null)
   return null;

  return (String[])values.toArray(new String[values.size()]);
 }

 public Enumeration<String> getParameterNames() {  
  return Collections.enumeration(parameters.keySet()); 
 }

 public Map<String, String[]> getParameterMap() {
  Map<String, String[]> map = new TreeMap<String, String[]>();
  for (Map.Entry<String, List<String>> entry : parameters.entrySet()) {
   List<String> list = entry.getValue();
   String[] values;
   if (list == null)
    values = null;
   else
    values = (String[]) list.toArray(new String[list.size()]);
   map.put(entry.getKey(), values);
  }
  return map;
 } 
}

答案 23 :(得分:-2)

此方法获取uri并返回par name和par值

的映射
  public static Map<String, String> getQueryMap(String uri) {

    String queryParms[] = uri.split("\\?");

    Map<String, String> map = new HashMap<>();// 

    if (queryParms == null || queryParms.length == 0) return map;

    String[] params = queryParms[1].split("&");
    for (String param : params) {
        String name = param.split("=")[0];
        String value = param.split("=")[1];
        map.put(name, value);
    }
    return map;
}

答案 24 :(得分:-3)

你说的是“Java”,但“不是Java EE”。您是说您使用的是JSP和/或servlet而不是完整的Java EE堆栈?如果是这种情况,那么您仍然可以使用request.getParameter()。

如果您的意思是您正在编写Java,但您不是在编写JSP或servlet,或者您只是使用Java作为参考点,而是在其他没有内置参数解析的平台上。哇,这听起来像是一个不太可能的问题,但如果是这样,那么原则就是:

xparm=0
word=""
loop
  get next char
  if no char
    exit loop
  if char=='='
    param_name[xparm]=word
    word=""
  else if char=='&'
    param_value[xparm]=word
    word=""
    xparm=xparm+1
  else if char=='%'
    read next two chars
    word=word+interpret the chars as hex digits to make a byte
  else
    word=word+char

(我可以编写Java代码,但这样做毫无意义,因为如果你有Java可用,你可以使用request.getParameters。)