泛型(Generic): in, out, where
Kotlin 中的类也可以有类型参数, 与 Java 一样:
要创建这样一个类的实例, 只需要指定类型参数:
但是, 如果类型参数可以通过推断得到, 比如, 通过构造器参数类型推断得到, 你可以省略类型参数:
类型变异(Variance)
Java 的类型系统中, 最微妙最难于理解和使用的部分之一, 就是它的通配符类型(wildcard type) (参见 Java 泛型 FAQ). Kotlin 中不存在这样的通配符类型. 而是使用声明处类型变异(declaration-site variance), 以及类型投射(type projection).
Java 中的类型变异(Variance)和通配符(Wildcard)
让我们思考一下为什么 Java 需要这些神秘的通配符类型. 首先, Java 中的泛型类型是 不可变的(invariant), 也就是说 List<String>
不是 List<Object>
的子类型. 因为, 如果 List
不是 不可变的(invariant), 那么下面的代码将可以通过编译, 但会在运行时导致一个异常, 那么 List 就并没有任何优于 Java 数组的地方了:
Java 禁止上面示例中的做法, 以保证运行期的类型安全. 但这个原则背后存在一些隐含的影响. 比如, 我们来看看 Collection
接口的 addAll()
方法. 这个方法的签名应该是什么样的? 你可能会根据第一直觉, 将它定义为:
但是这样的话, 你将无法进行下面这种操作(尽管它是绝对安全的):
因此 addAll()
的签名定义实际上是这样的:
这里的 通配符类型参数(wildcard type argument) ? extends E
表示, 该方法接受的参数是一个集合, 集合元素的类型是 E
或 E
的子类型, 而不限于 E
本身. 这就意味着, 你可以安全地从集合元素中 读取 E
(因为集合的元素是 E
的某个子类型的实例), 但 不能写入 到集合中去, 因为你不知道什么样的对象实例才能与这个 E
的未知子类型匹配. 尽管有这样的限制, 作为回报, 你得到了希望的功能: Collection<String>
是 Collection<? extends Object>
的子类型. 也就是说, 指定了 extends 边界 (上 边界)的通配符类型, 使得我们的类型成为一种 协变(covariant) 类型.
要理解这种模式的工作原理十分简单: 如果你只能从一个集合 取得 元素, 那么就可以使用一个 String
组成的集合, 并从中读取 Object
实例. 反过来, 如果你只能向集合 放入 元素, 那么就可以使用一个 Object
组成的集合, 并向其中放入 String
: 在 Java 中有 List<? super String>
, 它可以接受 String
, 或 String
的任何父类型.
上面的后一种情况称为 反向类型变异(contravariance), 对于 List<? super String>
, 你只能调用那些接受 String
类型参数的方法 (比如, 可以调用 add(String)
, 或 set(int, String)
), 如果你对 List<T>
调用返回类型为 T
的方法时, 你得到的返回值将不会是 String
类型, 而是 Object
类型.
Joshua Bloch 在他的 Effective Java, 第 3 版 详细解释了这个问题, (第 31 条: "为增加 API 的灵活性, 应该使用限定范围的通配符类型(bounded wildcard)"). 他将那些只能 读取 的对象称为 生产者(Producer), 将那些只能 写入 的对象称为 消费者(Consumer). 他建议:
他还提出了下面的记忆口诀: PECS, 表示 生产者(Producer)对应 Extends, 消费者(Consumer) 对应 Super.
声明处的类型变异(Declaration-site variance)
假设有一个泛型接口 Source<T>
, 其中不存在任何接受 T
作为参数的方法, 仅有返回值为 T
的方法:
那么, 完全可以在 Source<Object>
类型的变量中保存一个 Source<String>
类型的实例 - 因为不存在对消费者方法的调用. 但 Java 不能理解这一点, 因此仍然禁止以下代码:
为了解决这个问题, 你需要将对象类型声明为 Source<? extends Object>
, 这样其实是毫无意义的, 因为在这样修改之后, 你所能调用的方法与修改之前其实是完全一样的, 因此, 使用这样复杂的类型声明并未带来什么好处. 但编译器并不理解这一点.
在 Kotlin 中, 我们有办法将这种情况告诉编译器. 这种技术称为 声明处的类型变异(declaration site variance): 你可以对 Source
的 类型参数 T
添加注解, 来确保 Source<T>
的成员函数只会 返回 (生产) T
类型, 而绝不会消费 T
类型. 为了实现这个目的, 可以对 T
使用 out 修饰符:
一般规则是: 当 C
类的类型参数 T
声明为 out
时, 那么在 C
的成员函数中, T
类型只允许出现在 输出 位置, 这样的限制带来的回报就是, C<Base>
可以安全地用作 C<Derived>
的父类型.
也就是说, 你可以将 C
类称为, 在类型参数 T
上 协变的(covariant), 或者说 T
是一个 协变的(covariant) 类型参数. 你可以将 C
类看作 T
类型对象的 生产者, 而不是 T
类型对象的 消费者.
out 修饰符称为 协变注解(variance annotation), 而且, 由于这个注解出现在类型参数的声明处, 它提供了 声明处的类型变异(declaration-site variance). 这种方案与 Java 中的 使用处类型变异(use-site variance) 刚好相反, 在 Java 中, 是类型使用处的通配符产生了类型的协变.
除了 out
之外, Kotlin 还提供了另一种类型变异注解: in
. 这个注解导致类型参数 反向类型变异(contravariant)
: 也就是说这个类型将只能被消费, 而不能被生产. 反向类型变异的一个很好的例子是 Comparable
:
in 和 out 关键字的意义看来是十分直观的(同样的关键字已经在 C# 中使用很长时间了), 因此, 前面提到的记忆口诀也没有必要了, 我们可以将它改写为更高的抽象层次:
存在主义 变形法则: 消费者进, 生产者出!:-)
译注: 上面两句翻译得不够好, 待校
类型投射(Type projection)
使用处的类型变异(Use-site variance): 类型投射(Type projection)
将声明类型参数 T 声明为 out
, 就可以免去使用时子类化的麻烦, 这是十分方便的. 但是有些类 不能 限定为仅仅只返回 T
类型值! 关于这个问题, 一个很好的例子是 Array
类:
这个类对于类型参数 T
既不能协变, 也不能反向协变. 这就带来很大的不便. 我们来看看下面的函数:
这个函数应该将元素从一个 Array 复制到另一个 Array. 我们来试试使用一下这个函数:
在这里, 你又遇到了熟悉的老问题: Array<T>
对于类型参数 T
是 不可变的, 因此 Array<Int>
和 Array<Any>
谁也不是谁的子类型. 为什么不是? 原因与以前一样, 因为 copy
函数内可能发生预想外的行为, 比如, 它可能会试图向 from
数组中写入一个 String
, 这时如果你传入的实际参数是一个 Int
的数组, 就会导致一个 ClassCastException
.
为了禁止 copy()
函数向 from
数组 写入 数据, 你可以这样:
这种声明称为 类型投射(type projection): 其含义是, from
不是一个单纯的数组, 而是一个被限制(投射 )的数组. 你只能对这个数组调用那些返回值为类型参数 T
的方法, 在这个例子中, 只能调用 get()
方法. 这就是 使用处的类型变异(use-site variance) 的实现方案, 对应 Java 的 Array<? extends Object>
, 但略为简单一些.
你也可以使用 in
关键字来投射一个类型:
Array<in String>
与 Java 的 Array<? super String>
相同. 也就是说, 你可以使用 CharSequence
数组, 或者 Object
数组作为 fill()
函数的参数.
星号投射(Star-projection)
有些时候, 你可能想表示你并不知道类型参数的任何信息, 但是仍然希望能够安全地使用它. 这里所谓"安全地使用"是指, 对泛型类型定义一个类型投射, 要求这个泛型类型的所有的实体实例, 都是这个投射的子类型.
对于这个问题, Kotlin 提供了一种语法, 称为 星号投射(star-projection):
假如类型定义为
Foo<out T : TUpper>
, 其中T
是一个协变的类型参数, 上界(Upper Bound)为TUpper
,Foo<*>
等价于Foo<out TUpper>
. 它表示, 当T
未知时, 你可以安全地从Foo<*>
中 读取TUpper
类型的值.假如类型定义为
Foo<in T>
, 其中T
是一个反向协变的类型参数,Foo<*>
等价于Foo<in Nothing>
. 它表示, 当T
未知时, 你不能安全地向Foo<*>
写入 任何东西.假如类型定义为
Foo<T : TUpper>
, 其中T
是一个协变的类型参数, 上界(Upper Bound)为TUpper
, 对于读取值的场合,Foo<*>
等价于Foo<out TUpper>
, 对于写入值的场合, 等价于Foo<in Nothing>
.
如果一个泛型类型中存在多个类型参数, 那么每个类型参数都可以单独的投射. 比如, 如果类型定义为 interface Function<in T, out U>
, 你可以使用以下几种星号投射:
Function<*, String>
, 代表Function<in Nothing, String>
.Function<Int, *>
, 代表Function<Int, out Any?>
.Function<*, *>
, 代表Function<in Nothing, out Any?>
.
泛型函数
不仅类可以有类型参数. 函数一样可以有类型参数. 类型参数放在函数名称 之前:
调用泛型函数时, 应该在函数名称 之后 指定调用端类型参数:
如果可以通过程序上下文推断得到, 类型参数可以省略, 因此下面的例子也可以正确运行:
泛型约束(Generic constraint)
对于一个给定的类型参数, 所允许使用的类型, 可以通过 泛型约束(generic constraint) 来限制.
上界(Upper Bound)
最常见的约束是 上界(Upper Bound), 对应于 Java 中的 extends 关键字:
冒号之后指定的类型就是类型参数的 上界(Upper Bound): 表示对类型参数 T
, 只允许使用 Comparable<T>
的子类型. 比如:
如果没有指定, 则默认使用的上界是 Any?
. 在定义类型参数的尖括号内, 只允许定义唯一一个上界. 如果同一个类型参数需要指定多个上界, 这时需要使用单独的 where 子句:
传入的类型必须同时满足 where
子句中的所有条件. 在上面的示例中, T
类型必须 同时 实现 CharSequence
和 Comparable
接口.
确定不为 null 的类型
为了让与 Java 的泛型类和接口的互操作更加便利, Kotlin 允许将泛型类型参数为声明 确定不为 null.
要将泛型类型 T
声明为确定不为 null, 请使用 & Any
来声明这个类型. 例如: T & Any
.
确定不为 null 的类型的 上界(Upper Bound) 必须是可以为 null 的类型.
确定不为 null 的类型的最常见的使用场景是, 你想要覆盖 override 一个包含 @NotNull
参数的 Java 方法. 例如, 考虑下面的 load()
方法:
要在 Kotlin 中成功的覆盖 load()
方法, 你需要将 T1
声明为确定不为 null:
如果只使用 Kotlin, 那么你不太可能需要明确的声明确定不为 null 的类型, 因为 Kotlin 的类型推断功能会帮你解决这个问题.
类型擦除
对使用泛型声明的代码, Kotlin 在编译期进行类型安全性检查. 在运行期, 泛型类型的实例不保存关于其类型参数的任何信息. 我们称之为, 类型信息 被擦除 了. 比如, Foo<Bar>
和 Foo<Baz?>
的实例, 其类型信息会被擦除, 只剩下 Foo<*>
.
泛型的类型检查与类型转换
由于存在类型擦除的问题, 因此不存在一种通用的办法, 可以在运行期检查一个泛型类的实例是通过什么样的类型参数来创建的, 并且编译器禁止这样的 is
检查, 例如 ints is List<Int>
或 list is T
(T 是类型参数). 但是, 你可以检查实例是否属于星号投射类型:
类似的, 如果(在编译期间)已经对一个实例的类型参数进行了静态检查, 你可以对泛型之外的部分进行 is
检查, 或类型转换. 注意, 下面的示例中省略了尖括号:
对于不涉及类型参数的类型转换, 可以使用的相同语法, 但省略类型参数: list as ArrayList
.
泛型函数调用的类型参数也只在编译期进行检查. 在函数内部, 类型参数不能用来进行类型检查, 而且向类型参数的类型转换 (foo as T
) 也不做检查. 唯一的例外是使用 实体化的类型参数(Reified type parameter) 的内联函数, 会将它们的实际类型参数内联到每一个调用处. 因此可以对类型参数使用类型检查和转换. 但是, 在类型检查或转换内部使用的泛型类型实例, 仍然存在上述限制. 例如, 在类型检查 arg is T
中, 如果 arg
自身是一个泛型类型的实例, 它的类型参数仍然会被擦除.
未检查的类型转换
将类型转换为带有实际类型参数的泛型类型, 例如 foo as List<String>
, 在运行期也无法进行检查. 如果不能由编译器直接推断得到类型安全, 但通过高层的程序逻辑能够保证, 那么可以使用这种未检查的类型转换. 请看下面的示例.
最后一行中的类型转换会出现编译警告. 编译器无法对这个类型转换在运行期进行完整地检查, 因此不能保证 map 中的值是 Int
.
为了避免这种未检查的类型转换, 你可以重新设计你的程序结构. 在上例中, 你可以声明 DictionaryReader<T>
和 DictionaryWriter<T>
接口, 然后对不同的数据类型提供类型安全的实现类. 你可以引入合理的抽象层次, 将未检查的类型转换, 从对接口的调用代码中, 移动到具体的实现类中. 正确使用 泛型类型变异(generic variance) 也可能有助于解决这类问题.
对于泛型函数, 使用 实体化的类型参数(Reified type parameter) 可以使得 arg as T
之类的类型转换变成可被检查的类型转换, 除非 arg
的类型带有 它自己的 类型参数, 并且在运行期间被擦除了.
对类型转换语句, 或这个语句所属的声明, 添加 @Suppress("UNCHECKED_CAST")
注解, 可以屏蔽未检查的类型转换导致的编译警告:
对类型参数的下划线操作符
可以对类型参数使用下划线操作符 _
. 当其他类型已经明确指定时, 使用下划线操作符可以自动推断一个参数的类型: