众所周知,Java String
是不可变的。从一开始,不可变字符串就是java的重要补充。与C风格的字符串相比,不变性允许快速访问和大量优化,显着减少了错误,并有助于实施安全模型。
可以在不使用黑客的情况下创建一个可变的,即
java.lang.reflect
sun.misc.Unsafe
但是它是否可以只用普通的Java,以便可以随时修改字符串?问题是如何?
答案 0 :(得分:79)
使用Charset构造函数创建java.lang.String
,可以注入自己的Charset,它会带来您自己的CharsetDecoder
。 CharsetDecoder
在decodeLoop方法中获取对CharBuffer
对象的引用。 CharBuffer包装原始String对象的char []。由于CharsetDecoder具有对它的引用,您可以使用CharBuffer更改底层char [],因此您有一个可变的String。
public class MutableStringTest {
// http://stackoverflow.com/questions/11146255/how-to-create-mutable-java-lang-string#11146288
@Test
public void testMutableString() throws Exception {
final String s = createModifiableString();
System.out.println(s);
modify(s);
System.out.println(s);
}
private final AtomicReference<CharBuffer> cbRef = new AtomicReference<CharBuffer>();
private String createModifiableString() {
Charset charset = new Charset("foo", null) {
@Override
public boolean contains(Charset cs) {
return false;
}
@Override
public CharsetDecoder newDecoder() {
CharsetDecoder cd = new CharsetDecoder(this, 1.0f, 1.0f) {
@Override
protected CoderResult decodeLoop(ByteBuffer in, CharBuffer out) {
cbRef.set(out);
while(in.remaining()>0) {
out.append((char)in.get());
}
return CoderResult.UNDERFLOW;
}
};
return cd;
}
@Override
public CharsetEncoder newEncoder() {
return null;
}
};
return new String("abc".getBytes(), charset);
}
private void modify(String s) {
CharBuffer charBuffer = cbRef.get();
charBuffer.position(0);
charBuffer.put("xyz");
}
}
运行代码打印
abc
zzz
我不知道如何正确实现decodeLoop(),但我现在不在乎:)
答案 1 :(得分:9)
这个问题得到了@mhaller的好答案。我说所谓的拼图很简单,只要查看String的可用c-tors,我就应该能够找到 的部分,
<强>操作实例强>
感兴趣的C-tor是下面的,如果你要闯入/破解/寻找安全漏洞总是寻找非最终的任意类。这里的案例是java.nio.charset.Charset
//String
public String(byte bytes[], int offset, int length, Charset charset) {
if (charset == null)
throw new NullPointerException("charset");
checkBounds(bytes, offset, length);
char[] v = StringCoding.decode(charset, bytes, offset, length);
this.offset = 0;
this.count = v.length;
this.value = v;
}
c-tor通过传递Charset而不是chartset名称来提供将byte[]
转换为String的所谓快速方法,以避免查找chartsetName-&gt; charset。
它还允许传递任意Charset对象来创建String。 Charset主路由将java.nio.ByteBuffer
的内容转换为CharBuffer
。 CharBuffer可以保存对char []的引用,它可以通过array()
获得,CharBuffer也可以完全修改。
//StringCoding
static char[] decode(Charset cs, byte[] ba, int off, int len) {
StringDecoder sd = new StringDecoder(cs, cs.name());
byte[] b = Arrays.copyOf(ba, ba.length);
return sd.decode(b, off, len);
}
//StringDecoder
char[] decode(byte[] ba, int off, int len) {
int en = scale(len, cd.maxCharsPerByte());
char[] ca = new char[en];
if (len == 0)
return ca;
cd.reset();
ByteBuffer bb = ByteBuffer.wrap(ba, off, len);
CharBuffer cb = CharBuffer.wrap(ca);
try {
CoderResult cr = cd.decode(bb, cb, true);
if (!cr.isUnderflow())
cr.throwException();
cr = cd.flush(cb);
if (!cr.isUnderflow())
cr.throwException();
} catch (CharacterCodingException x) {
// Substitution is always enabled,
// so this shouldn't happen
throw new Error(x);
}
return safeTrim(ca, cb.position(), cs);
}
为了防止改变char[]
,java开发人员像任何其他String构造一样复制数组(例如public String(char value[])
)。但是有一个例外 - 如果没有安装SecurityManager,则不会复制char []。
//Trim the given char array to the given length
//
private static char[] safeTrim(char[] ca, int len, Charset cs) {
if (len == ca.length
&& (System.getSecurityManager() == null
|| cs.getClass().getClassLoader0() == null))
return ca;
else
return Arrays.copyOf(ca, len);
}
因此,如果没有SecurityManager,它绝对有可能被字符串引用的可修改的CharBuffer / char []。
现在一切看起来都很好 - 除了byte[]
也被复制(上面的粗体)。这是
java开发人员懒惰而且严重错误。
副本是必要的,以防止流氓Charset(上面的例子)能够改变源字节[]。但是,想象一下大约512KB byte[]
缓冲区包含少量String的情况。尝试创建一个小的,少数几个图表 - new String(buf, position, position+32,charset)
导致大量512KB byte []复制。如果缓冲区大约是1KB,那么影响将永远不会被发现。但是,对于大缓冲区,性能影响非常大。简单的解决方法是复制相关部分。
......或者java.nio
的设计者通过引入只读缓冲区来考虑。简单地调用ByteBuffer.asReadOnlyBuffer()
就足够了(如果Charset.getClassLoader()!= null)*
有时即使是在java.lang
工作的人也会完全错误。
* Class.getClassLoader()为引导类返回null,即与JVM本身一起发布的类。
答案 2 :(得分:5)
我会说StringBuilder(或StringBuffer用于多线程使用)。是的,最后你得到一个不可变的字符串。但这是要走的路。
例如,在循环中附加字符串的最佳方法是使用StringBuilder。当您使用“fu”+ variable +“ba”时,Java本身使用StringBuilder。
http://docs.oracle.com/javase/6/docs/api/java/lang/StringBuilder.html
追加(泡壳).append(5).appen( “dfgdfg”)的toString();
答案 3 :(得分:2)
// How to achieve String Mutability
import java.lang.reflect.Field;
public class MutableString {
public static void main(String[] args) {
String s = "Hello";
mutate(s);
System.out.println(s);
}
public static void mutate(String s) {
try {
String t = "Hello world";
Field val = String.class.getDeclaredField("value");
Field count = String.class.getDeclaredField("count");
val.setAccessible(true);
count.setAccessible(true);
count.setInt (s, t.length ());
val.set (s, val.get(t));
}
catch (Exception e) { e.printStackTrace(); }
}
}
答案 4 :(得分:0)
不要重新发明轮子。 Apache commons仅提供了这一点。
MutableObject<String> mutableString = new MutableObject<>();
答案 5 :(得分:-2)
交换java
和javac
的引导类路径的简单方法
1)转到jdk安装并复制到单独的文件夹rt.jar
和src.zip
2)从源zip解包String.java并将其更改为私有字段值 内部字符数组到公共
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
/** The value is used for character storage. */
public final char value[];
3)在javac:
的帮助下编译修改过的String.javajavac String.java
4)将已编译的String.class和其他已编译的类移动到此目录中的rt.jar
5)创建使用String private field
的测试类package exp;
class MutableStringExp {
public static void main(String[] args) {
String letter = "A";
System.out.println(letter);
letter.value[0] = 'X';
System.out.println(letter);
}
}
6)创建空目录target
并编译测试类
javac -Xbootclasspath:rt.jar -d target MutableStringExp.java
7)运行它
java -Xbootclasspath:rt.jar -cp "target" exp.MutableStringExp
输出是:
A
X
P.S这只适用于修改后的rt.jar
,并使用此选项覆盖rt.jar
违反jre
许可。