题
这可能是有史以来问过的最愚蠢的问题,但我认为这对于 Java 新手来说相当令人困惑。
- 有人可以澄清一下是什么意思吗 不可变的?
- 为什么是一个
String
不可变的? - 不可变对象的优点/缺点是什么?
- 为什么应该使用可变对象,例如
StringBuilder
优于字符串,反之亦然?
一个很好的例子(Java)将非常感激。
解决方案
不可变意味着一旦对象的构造函数完成执行,该实例就无法更改。
这很有用,因为它意味着你可以传递对象的引用,而不用担心其他人会改变它的内容。 特别是在处理并发时,对于永不改变的对象没有锁定问题
e.g。
class Foo
{
private final String myvar;
public Foo(final String initialValue)
{
this.myvar = initialValue;
}
public String getValue()
{
return this.myvar;
}
}
Foo
不必担心 getValue()
的调用者可能会更改字符串中的文本。
如果你想象一个类似于 Foo
的类,但是使用 StringBuilder
而不是 String
作为成员,你可以看到调用 getValue()
将能够改变 Foo
实例的 StringBuilder
属性。
还要注意你可能会发现的不同类型的不变性:Eric Lippert写了一篇博客文章。基本上你可以拥有其接口是不可变的但在幕后实际可变的私有状态的对象(因此不能在线程之间安全地共享)。
其他提示
不可变对象是一个对象,其中无法更改内部字段(或至少影响其外部行为的所有内部字段)。
不可变字符串有很多优点:
效果:执行以下操作:
String substring = fullstring.substring(x,y);
substring()方法的底层C可能是这样的:
// Assume string is stored like this:
struct String { char* characters; unsigned int length; };
// Passing pointers because Java is pass-by-reference
struct String* substring(struct String* in, unsigned int begin, unsigned int end)
{
struct String* out = malloc(sizeof(struct String));
out->characters = in->characters + begin;
out->length = end - begin;
return out;
}
请注意没有必须复制的字符!如果String对象是可变的(字符可能会在以后更改),那么您必须复制所有字符,否则更改为substring稍后会反映在另一个字符串中。
并发:如果不可变对象的内部结构有效,它将始终有效。不同的线程不可能在该对象中创建无效状态。因此,不可变对象是线程安全。
垃圾收集:垃圾收集器更容易对不可变对象做出逻辑决策。
然而,不变性也存在缺点:
表现:等等,我以为你说性能是不变的好处!嗯,有时候,但并非总是如此。请使用以下代码:
foo = foo.substring(0,4) + "a" + foo.substring(5); // foo is a String
bar.replace(4,5,"a"); // bar is a StringBuilder
这两行都用字母“a”替换第四个字符。第二段代码不仅更具可读性,而且速度更快。看看你将如何为foo做底层代码。子串很容易,但现在因为在第五空间已经有了一个字符而其他东西可能引用了foo,你不能只改变它;你必须复制整个字符串(当然,这些功能中的一些被抽象为真正的底层C中的函数,但这里的重点是显示在一个地方执行的代码)。
struct String* concatenate(struct String* first, struct String* second)
{
struct String* new = malloc(sizeof(struct String));
new->length = first->length + second->length;
new->characters = malloc(new->length);
int i;
for(i = 0; i < first->length; i++)
new->characters[i] = first->characters[i];
for(; i - first->length < second->length; i++)
new->characters[i] = second->characters[i - first->length];
return new;
}
// The code that executes
struct String* astring;
char a = 'a';
astring->characters = &a;
astring->length = 1;
foo = concatenate(concatenate(slice(foo,0,4),astring),slice(foo,5,foo->length));
请注意,concatenate被称为两次,这意味着整个字符串必须循环通过!将其与 bar
操作的C代码进行比较:
bar->characters[4] = 'a';
可变字符串操作显然要快得多。
结论:在大多数情况下,您需要一个不可变的字符串。但是如果你需要做很多追加和插入字符串,你需要速度的可变性。如果您希望并发安全和垃圾收集带来好处,关键是将可变对象保持在方法的本地:
// This will have awful performance if you don't use mutable strings
String join(String[] strings, String separator)
{
StringBuilder mutable;
boolean first = true;
for(int i = 0; i < strings.length; i++)
{
if(!first) first = false;
else mutable.append(separator);
mutable.append(strings[i]);
}
return mutable.toString();
}
由于 mutable
对象是本地引用,因此您不必担心并发安全性(只有一个线程会触及它)。并且由于它没有在其他任何地方引用,它只在堆栈上分配,所以一旦函数调用完成就会释放它(你不必担心垃圾收集)。并且您可以获得可变性和不变性的所有性能优势。
实际上,如果您使用上面建议的维基百科定义,则字符串不是不可变的。
字符串的状态会改变后期构建。看一下hashcode()方法。 String将哈希码值缓存在本地字段中,但在第一次调用hashcode()之前不会计算它。这种对hashcode的懒惰评估将String置于一个有趣的位置,作为状态改变的不可变对象,但是如果不使用反射就无法观察到它已被改变。
所以也许不可变的定义应该是一个无法观察到的变化的对象。
如果一个不可变对象在创建之后状态发生了变化但没有人能看到它(没有反射),那么该对象仍然是不可变的吗?
不可变对象是无法以编程方式更改的对象。它们特别适用于多线程环境或其他多个进程能够改变(变异)对象中的值的环境。
然而,为了澄清,StringBuilder实际上是一个可变对象,而不是一个不可变对象。常规java String是不可变的(这意味着一旦创建它就不能在不更改对象的情况下更改底层字符串。)
例如,假设我有一个名为ColoredString的类,它具有String值和String颜色:
public class ColoredString {
private String color;
private String string;
public ColoredString(String color, String string) {
this.color = color;
this.string = string;
}
public String getColor() { return this.color; }
public String getString() { return this.string; }
public void setColor(String newColor) {
this.color = newColor;
}
}
在此示例中,ColoredString被认为是可变的,因为您可以更改(mutate)其中一个键属性而无需创建新的ColoredString类。这可能是坏的原因是,例如,假设您有一个具有多个线程的GUI应用程序,并且您正在使用ColoredStrings将数据打印到窗口。如果你有一个创建为
的ColoredString实例new ColoredString("Blue", "This is a blue string!");
然后你会期望字符串始终是“蓝色”。但是,如果另一个线程得到了这个实例并且调用了
blueString.setColor("Red");
你会突然,可能出乎意料地,现在有一个“红色”当你想要一个“蓝色”字符串时一。因此,在传递对象实例时,几乎总是首选不可变对象。当你遇到真正需要可变对象的情况时,你通常只会通过从你的特定控制领域传递副本来保护对象。
回顾一下,在Java中,java.lang.String是一个不可变对象(一旦创建就不能更改),java.lang.StringBuilder是一个可变对象,因为它可以在没有创建一个新实例。
- 在大型应用程序中,字符串文字常见的是占用大量内存。因此,为了有效地处理内存,JVM分配一个名为“String constant pool”的区域。(请注意,在内存中,即使是未引用的String也会携带char [],其长度为int,而hashCode则为另一个。对于一个数字,相比之下,最多八个立即字节是需要)
- 当编译器遇到字符串文字时,它会检查池以查看是否存在相同的字面值。如果找到一个,则对新文本的引用将定向到现有的String,并且不会创建新的“String literal object”(现有的String只会获得一个额外的引用)。
- 因此:字符串可变性可以节省内存......
- 但是当任何变量改变值时,实际上 - 只有它们的引用被改变了,而不是内存中的值(因此它不会影响引用它的其他变量),如下所示.... 醇>
String s1 =&quot; Old string&quot ;;
//s1 variable, refers to string in memory
reference | MEMORY |
variables | |
[s1] --------------->| "Old String" |
String s2 = s1;
//s2 refers to same string as s1
| |
[s1] --------------->| "Old String" |
[s2] ------------------------^
s1 =&quot; New String&quot;;
//s1 deletes reference to old string and points to the newly created one
[s1] -----|--------->| "New String" |
| | |
|~~~~~~~~~X| "Old String" |
[s2] ------------------------^
原始字符串'在内存中'没有改变,但是 引用变量已更改,以便引用新字符串。 如果我们没有s2,“Old String”仍然会在记忆中但是 我们无法访问它......
&QUOT;不可改变&QUOT;意味着你无法改变价值。如果你有一个String类的实例,你调用的任何似乎修改该值的方法实际上都会创建另一个String。
String foo = "Hello";
foo.substring(3);
<-- foo here still has the same value "Hello"
要保留更改,您应该执行此类操作 foo = foo.sustring(3);
使用集合时,Immutable vs mutable可能很有趣。想想如果你使用可变对象作为map的键然后改变值会发生什么(提示:想想 equals
和 hashCode
)。
java.time
可能有点晚了但是为了理解不可变对象是什么,请考虑新Java 8 Date and Time API中的以下示例( java.time )。您可能知道Java 8中的所有日期对象都是不可变的,因此在以下示例中
LocalDate date = LocalDate.of(2014, 3, 18);
date.plusYears(2);
System.out.println(date);
输出:
2014年3月18日
这打印与初始日期相同的年份,因为 plusYears(2)
返回一个新对象,因此旧日期仍然保持不变,因为它是一个不可变对象。创建后,您无法进一步修改它,日期变量仍然指向它。
因此,该代码示例应该捕获并使用实例化的新对象,并通过对 plusYears
的调用返回。
LocalDate date = LocalDate.of(2014, 3, 18);
LocalDate dateAfterTwoYears = date.plusYears(2);
date.toString()&#8230; 2014年3月18日
dateAfterTwoYears.toString()&#8230; 2016年3月18日
我非常喜欢 SCJP Sun认证程序员Java 5学习指南
为了提高Java的内存效率,JVM预留了一个称为“String constant pool”的特殊内存区域。当编译器遇到String文本时,它会检查池以查看是否已存在相同的String。如果找到匹配项,则对新文本的引用将定向到现有String,并且不会创建新的String文本对象。
不可变对象在创建后就无法更改其状态。
尽可能使用不可变对象有三个主要原因,所有这些都有助于减少代码中引入的错误数量:
- 当您知道对象的状态不能通过其他方法更改时,就更容易推理程序如何工作
- 不可变对象自动是线程安全的(假设它们是安全发布的),因此永远不会成为那些难以确定的多线程错误的原因
- 不可变对象将始终具有相同的哈希码,因此它们可以用作 HashMap(或类似)中的键。如果哈希表中某个元素的哈希码要更改,则表项实际上会丢失,因为在表中查找它的尝试最终会查找到错误的位置。这是 String 对象不可变的主要原因 - 它们经常用作 HashMap 键。
当您知道对象的状态是不可变的时,您还可以在代码中进行一些其他优化 - 例如,缓存计算出的哈希 - 但这些都是优化,因此并不是那么有趣。
一个含义与计算机中存储值的关系有关,例如,对于.Net字符串,这意味着内存中的字符串无法更改,当您认为正在更改它时,实际上就是在内存中创建一个新字符串,并将现有变量(它只是指向其他地方的实际字符集合的指针)指向新字符串。
String s1="Hi";
String s2=s1;
s1="Bye";
System.out.println(s2); //Hi (if String was mutable output would be: Bye)
System.out.println(s1); //Bye
s1 =&quot; Hi&quot;
:使用“Hi”创建了一个对象 s1
。它的价值。
s2 = s1
:参照s1对象创建了一个对象 s2
。
s1 =&quot; Bye&quot;
:之前的 s1
对象的值不会改变,因为 s1
具有String类型且String类型是不可变类型,而不是编译器创建一个带有“Bye”的新String对象。值和引用它的 s1
。这里当我们打印 s2
值时,结果将是“Hi”。不是“再见”因为 s2
引用了之前的 s1
对象,它具有“Hi”。值。
不可变意味着一旦创建了对象,其成员就不会改变。 String
是不可变的,因为您无法更改其内容。
例如:
String s1 = " abc ";
String s2 = s1.trim();
在上面的代码中,字符串s1没有改变,另一个对象( s2
)是使用 s1
创建的。
永恒只是意味着不可改变或不可修改。一旦创建了字符串对象,就无法更改其数据或状态
考虑下面的例子,
class Testimmutablestring{
public static void main(String args[]){
String s="Future";
s.concat(" World");//concat() method appends the string at the end
System.out.println(s);//will print Future because strings are immutable objects
}
}
让我们考虑下面的图表,
在此图表中,您可以看到创建为“未来世界”的新对象。但不要改变“未来”。因为String是不可变的
。 s
,仍然引用“未来”。如果您需要致电“未来世界”,
String s="Future";
s=s.concat(" World");
System.out.println(s);//print Future World
为什么字符串对象在java中是不可变的?
因为Java使用字符串文字的概念。假设有5个引用变量,all都引用一个对象“Future”。如果一个引用变量改变了对象的值,它将受到所有引用变量的影响。这就是字符串对象在java中不可变的原因。
一旦实现,就无法改变。考虑一个类,该实例可以用作哈希表或类似的键。查看Java最佳实践。
不可变对象
如果一个对象的状态在构造后不能改变,则该对象被认为是不可变的。最大限度地依赖不可变对象被广泛接受为创建简单,可靠代码的合理策略。
不可变对象在并发应用程序中特别有用。由于它们不能改变状态,因此它们不会被线程干扰破坏或在不一致状态下被观察到。
程序员通常不愿意使用不可变对象,因为他们担心创建新对象的成本而不是更新对象。对象创建的影响经常被高估,并且可以通过与不可变对象相关联的一些效率来抵消。这些包括由于垃圾收集而减少的开销,以及消除保护可变对象免受损坏所需的代码。
以下小节介绍了一个实例可变的类,并从中派生出一个具有不可变实例的类。通过这样做,它们为这种转换提供了一般规则,并展示了不可变对象的一些优点。
如果某个对象的状态在其后无法更改,则该对象被视为不可变 是建造的。最大程度上依赖于不可变对象 被认为是创建简单,可靠代码的合理策略。
不可变对象在并发应用程序中特别有用。 由于它们无法改变状态,因此它们不会被线程破坏 干扰或观察到不一致的状态。
我喜欢发布中的这句话
不可变对象简化了并发编程
不可变对象是您在创建后无法修改的对象。一个典型的例子是字符串文字。
越来越受欢迎的D编程语言具有“不可变性”的概念。通过“不变”关键词。查看Dr.Dobb关于它的文章 - http:// dobbscodetalk .com / index.php?option = com_myblog&amp; show = Invariant-Strings.html&amp; Itemid = 29 。它完美地解释了这个问题。