教程 - 映射 C 语言的字符串

在这个教程系列的最后部分, 我们来看看在 Kotlin/Native 中如何处理 C 字符串.

在本教程中, 你将学习如何:

将 Kotlin 字符串传递到 C
在 Kotlin 中读取 C 字符串
将 C 字符串的字节接收到 Kotlin 字符串中

使用 C 字符串

C 语言没有专门的字符串类型. 方法签名或者文档可以帮助你识别, 特定场景中的一个 char * 是否表示一个 C 字符串.

C 语言中的字符串使用 null 作为终止符, 因此有一个末尾 0 字符 \0 添加到字节序列之后, 表示字符串结束. 通常, 使用 UTF-8 编码的字符串. UTF-8 编码使用变宽字符, 而且向后兼容 ASCII 编码. Kotlin/Native 默认使用 UTF-8 字符编码.

为了理解字符串在 Kotlin 和 C 之间的映射, 首先创建库的头文件. 在这个教程系列的第 1 部分中, 你已经创建了一个 C 库, 以及必要的文件. 在这个教程中:

更新你的 lib.h 文件, 包含以下使用 C 字符串的函数声明:
#ifndef LIB2_H_INCLUDED #define LIB2_H_INCLUDED void pass_string(char* str); char* return_string(); int copy_string(char* str, int size); #endif
这个示例演示了 C 语言中传递或接收一个字符串的常见方式. 要小心处理 return_string() 函数的返回值. 要确保你使用了正确的 free() 函数来释放返回的 char*.
更新 interop.def 文件中 --- 分割行之后的声明:
--- void pass_string(char* str) { } char* return_string() { return "C string"; } int copy_string(char* str, int size) { *str++ = 'C'; *str++ = ' '; *str++ = 'K'; *str++ = '/'; *str++ = 'N'; *str++ = 0; return 0; }

这个 interop.def 文件提供了所有需要的内容, 可以用来编译, 运行, 或在 IDE 中打开应用程序.

查看为 C 库生成的 Kotlin API

我们来看看 C 字符串声明在 Kotlin/Native 中如何映射:

在 src/nativeMain/kotlin 中, 将你在上一篇教程中创建的 hello.kt 文件, 更新为以下内容:
import interop.* import kotlinx.cinterop.ExperimentalForeignApi @OptIn(ExperimentalForeignApi::class) fun main() { println("Hello Kotlin/Native!") pass_string(/*fix me*/) val useMe = return_string() val useMe2 = copy_string(/*fix me*/) }
通过 IntelliJ IDEA 的 Go to declaration 命令 (Cmd + B/Ctrl + B) 可以跳转到为 C 函数生成的 API:
fun pass_string(str: kotlinx.cinterop.CValuesRef<kotlinx.cinterop.ByteVarOf<kotlin.Byte> /* from: kotlinx.cinterop.ByteVar */>?) fun return_string(): kotlinx.cinterop.CPointer<kotlinx.cinterop.ByteVarOf<kotlin.Byte> /* from: kotlinx.cinterop.ByteVar */>? fun copy_string(str: kotlinx.cinterop.CValuesRef<kotlinx.cinterop.ByteVarOf<kotlin.Byte> /* from: kotlinx.cinterop.ByteVar */>?, size: kotlin.Int): kotlin.Int

这些声明非常直观. 在 Kotlin 中, C 的 char * 指针类型, 对于参数会映射为 str: CValuesRef<ByteVarOf>?, 对于返回类型会映射为 CPointer<ByteVarOf>?. Kotlin 将 char 类型表示为 kotlin.Byte, 因为它通常是 8 bit 有符号值.

在生成的 Kotlin 声明中, str 被定义为 CValuesRef<ByteVarOf<Byte>>?. 由于这个类型是可为 null 的, 你可以传递 null 作为参数值.

将 Kotlin 字符串传递到 C

下面来试验在 Kotlin 程序中使用 API. 首先调用 pass_string() 函数:

import interop.*
import kotlinx.cinterop.ExperimentalForeignApi
import kotlinx.cinterop.cstr

@OptIn(ExperimentalForeignApi::class)
fun passStringToC() {
    val str = "This is a Kotlin string"
    pass_string(str.cstr)
}

有了 String.cstr 扩展属性的帮助, 向 C 传递一个 Kotlin 字符串是很简单的. 此外还有 String.wcstr 属性, 用于处理 UTF-16 字符的情况.

在 Kotlin 中读取 C 字符串

现在来接收从 return_string() 函数返回的一个 char *, 并将它转换为一个 Kotlin 字符串:

import interop.*
import kotlinx.cinterop.ExperimentalForeignApi
import kotlinx.cinterop.toKString

@OptIn(ExperimentalForeignApi::class)
fun passStringToC() {
    val stringFromC = return_string()?.toKString()

    println("Returned from C: $stringFromC")
}

这段代码中, .toKString() 扩展函数将 return_string() 函数返回的 C 字符串转换为 Kotlin 字符串.

Kotlin 提供了几个扩展函数, 用于将 C 的 char * 字符串转换为 Kotlin 字符串, 使用不同的编码:

fun CPointer<ByteVarOf<Byte>>.toKString(): String // 标准函数, 处理 UTF-8 字符串
fun CPointer<ByteVarOf<Byte>>.toKStringFromUtf8(): String // 明确转换 UTF-8 字符串
fun CPointer<ShortVarOf<Short>>.toKStringFromUtf16(): String // 转换 UTF-16 编码的字符串
fun CPointer<IntVarOf<Int>>.toKStringFromUtf32(): String // 转换 UTF-32 编码的字符串

在 Kotlin 接收 C 字符串的字节

下面我们使用 C 函数 copy_string() 向一个指定的缓冲区写入一个 C 字符串. 它接受2 个参数: 一个指针, 表示字符串需要写入的内存位置, 以及允许的缓冲区大小.

函数还应该返回某个值, 表示它成功还是失败. 我们假设 0 表示它成功, 并且假设提供的缓冲区足够大:

import interop.*
import kotlinx.cinterop.ExperimentalForeignApi
import kotlinx.cinterop.addressOf
import kotlinx.cinterop.usePinned

@OptIn(ExperimentalForeignApi::class)
fun sendString() {
    val buf = ByteArray(255)
    buf.usePinned { pinned ->
        if (copy_string(pinned.addressOf(0), buf.size - 1) != 0) {
            throw Error("Failed to read string from C")
        }
    }

    val copiedStringFromC = buf.decodeToString()
    println("Message from C: $copiedStringFromC")
}

这段代码中, 一个 native 指针先被传递给 C 函数. .usePinned() 扩展函数临时的固定住字节数组的 native 内存地址. C 函数向这个字节数组填充数据. 另一个扩展函数 ByteArray.decodeToString() 将字节数组转换为一个 Kotlin 字符串, 假设使用 UTF-8 编码.

更新 Kotlin 代码

现在你已经学习了如何在 Kotlin 代码中使用 C 的声明, 请在你的项目中试试吧. hello.kt 文件中的最终代码大致如下:

import interop.*
import kotlinx.cinterop.*

@OptIn(ExperimentalForeignApi::class)
fun main() {
    println("Hello Kotlin/Native!")

    val str = "This is a Kotlin string"
    pass_string(str.cstr)

    val useMe = return_string()?.toKString() ?: error("null pointer returned")
    println(useMe)

    val copyFromC = ByteArray(255).usePinned { pinned ->
        val useMe2 = copy_string(pinned.addressOf(0), pinned.get().size - 1)
        if (useMe2 != 0) throw Error("Failed to read a string from C")
        pinned.get().decodeToString()
    }

    println(copyFromC)
}

为了验证是否一切正确, 请在你的 IDE 中运行 runDebugExecutableNative Gradle task, 或使用以下命令, 运行代码:

./gradlew runDebugExecutableNative

下一步

更多详情请参见与 C 代码交互文档, 其中包含更多高级场景.

2025/10/21