将原始指针转换为16位Unicode字符到Rust中的文件路径

时间:2018-02-02 16:21:21

标签: windows unicode rust

我用在Rust中编写的DLL替换用C ++编写的DLL。 目前DLL中的函数调用如下:

BOOL calledFunction(wchar_t* pFileName)

我相信在这种情况下wchar_t是一个16位的Unicode字符,所以我选择在Rust DLL中公开以下函数:

pub fn calledFunction(pFileName: *const u16)

将原始指针转换为实际用于从Rust DLL打开文件的内容的最佳方法是什么?

2 个答案:

答案 0 :(得分:6)

您需要使用OsString,它表示操作系统使用的本机字符串格式。在Windows中,这些是特定的16位字符串(通常是UTF-16)。

引用文档:

  当您需要在操作系统本身之间传输字符串或捕获外部命令的输出时,

OsStringOsStr非常有用。 OsStringOsStr和Rust字符串之间的转化与CStringCStr的转化相似。

首先需要使用不安全的代码将指针转换为切片:

use std::slice;

// manifest a slice out of thin air!
let ptr = 0x1234 as const *u16;
let nb_elements = 10;
unsafe {
    let slice = slice::from_raw_parts(ptr, nb_elements);
}

这假设您知道字符串的大小,这意味着您的函数也应该将字符数作为参数。

from_wide方法应该是从原生格式转换所需的方法:

use std::ffi::OsString;
use std::os::windows::prelude::*;

// UTF-16 encoding for "Unicode".
let arr = [0x0055, 0x006E, 0x0069, 0x0063, 0x006F, 0x0064, 0x0065];

let string = OsString::from_wide(&arr[..]);

答案 1 :(得分:3)

以下是一些示例代码:

use std::ffi::OsString;
use std::os::windows::prelude::*;

unsafe fn u16_ptr_to_string(ptr: *const u16) -> OsString {
    let len = (0..).take_while(|&i| *ptr.offset(i) != 0).count();
    let slice = std::slice::from_raw_parts(ptr, len);

    OsString::from_wide(slice)
}

// main example
fn main() {
    let buf = vec![97_u16, 98, 99, 100, 101, 102, 0];
    let ptr = buf.as_ptr(); // raw pointer

    let string = unsafe { u16_ptr_to_string(ptr) };

    println!("{:?}", string);
}

u16_ptr_to_string中,您可以做三件事:

  • 使用offset(不安全)计算非零字符来获取字符串的长度
  • 使用from_raw_parts(不安全)
  • 创建切片
  • 将此&[u16]转换为OsString from_wide

最好使用libc crate中的wchar_twcslen并使用另一个crate进行转换。这可能是重新实现已经在箱子中维护的东西的坏主意。