如何从字符串中获取子字符串而不拆分?

时间:2019-01-17 09:02:45

标签: java

exports.getprojectcata = function(req, res){
     console.log("First Function");

};
exports.getprojects = function(req, res){
    console.log("Second Function");

};

我想获得“ http://test.com”,所以我这样写。

String str = "internet address : http://test.com Click this!";

但是我认为这是无效的。如何更轻松地获得它?

7 个答案:

答案 0 :(得分:1)

假设您始终使用相同的格式(某些文本:URL更多文本),则可以使用:

public static void main(String[] args) throws IOException {
    String str = "internet address : http://test.com Click this!";
    String first = str.substring(str.indexOf("http://"));
    String second = first.substring(0, first.indexOf(" "));
    System.out.println(second);
}

但是更好的是正则表达式,如不同答案所示

答案 1 :(得分:1)

通常,这可以通过正则表达式或indexOfsubstring完成。

使用正则表达式可以这样做:

    // This is using a VERY simplified regular expression
    String str = "internet address : http://test.com Click this!";
    Pattern pattern = Pattern.compile("[http:|https:]+\\/\\/[\\w.]*");
    Matcher matcher = pattern.matcher(str);
    if (matcher.find()) {
        System.out.println(matcher.group(0));
    }

您可以在此处阅读其简化原因:https://mathiasbynens.be/demo/url-regex-tl; dr:URL的问题在于它们可以具有许多有效的不同模式。

通过拆分,将有一种利用Java的URL类的方法:

   String[] split = str.split(" ");

    for (String value : split) {
        try {
            URL uri = new URL(value);
            System.out.println(value);
        } catch (MalformedURLException e) {
            // no valid url
        }
    }

您可以在OpenJDK源here中检查其有效性。

答案 2 :(得分:0)

我尝试使用正则表达式

String regex = "http?:\\/\\/(www\\.)?[-a-zA-Z0-9@:%._\\+~#=]{2,256}\\.[a-z]{2,6}\\b([-a-zA-Z0-9@:%_\\+.~#?&//=]*)";
String str = "internet address : http://test.com Click this!";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(str);
if (matcher.find()) {
    System.out.println(matcher.group(0));
}

结果:

http://test.com

来源:here

答案 3 :(得分:0)

在字符串中找到http://,然后向前和向后查找空格:

int pos = str.indexOf("http://");
if (pos >= 0) {
  // Look backwards for space.
  int start = Math.max(0, str.lastIndexOf(' ', pos));

  // Look forwards for space.
  int end = str.indexOf(' ', pos + "http://".length());
  if (end < 0) end = str.length();

  return str.substring(start, end);
}

答案 4 :(得分:0)

尚不清楚输入字符串的结构是否恒定,但是,我会这样做:

    String str = "internet address : http://test.com Click this!";
    // get the index of the first letter of an url
    int urlStart = str.indexOf("http://");
    System.out.println(urlStart);
    // get the first space after the url
    int urlEnd = str.substring(urlStart).indexOf(" ");
    System.out.println(urlEnd);
    // get the substring of the url
    String urlString = str.substring(urlStart, urlStart + urlEnd);
    System.out.println(urlString);

答案 5 :(得分:0)

我只是做了一个快速解决方案。它应该为您完美地工作。

package Main.Kunal;

import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class URLOutOfString {

    public static void main(String[] args) {
        String str = "internet address : http://test.com Click this!, internet address : http://tes1t.com Click this!";
        List<String> result= new ArrayList<>();
        int counter = 0;
        final Pattern urlPattern = Pattern.compile(
                "(?:^|[\\W])((ht|f)tp(s?):\\/\\/|www\\.)"
                        + "(([\\w\\-]+\\.){1,}?([\\w\\-.~]+\\/?)*"
                        + "[\\p{Alnum}.,%_=?&#\\-+()\\[\\]\\*$~@!:/{};']*)",
                Pattern.CASE_INSENSITIVE | Pattern.MULTILINE | Pattern.DOTALL);

        Matcher matcher = urlPattern.matcher(str);

        while (matcher.find()) {
            result.add(str.substring(matcher.start(1), matcher.end()));
            counter++;
        }

        System.out.println(result);

    }

}

这将在您的字符串中找到所有URL,并将其添加到arraylist。您可以根据自己的业务需要使用它。

答案 6 :(得分:0)

您可以使用正则表达式

String str = "internet address : http://test.com Click this!";
Pattern pattern = Pattern.compile("((http|https)\\S*)");
Matcher matcher = pattern.matcher(str);
if (matcher.find())
{
    System.out.println(matcher.group(1));
}