我正在尝试在JCuda中使用cuModuleLoad()
从vectorAdd.ptx
加载/src/main/resources
文件。代码如下:
cuModuleLoad(module, getClass.getResource("vectorAdd.ptx").getPath())
但是cuModuleLoad()
没有拿到这个文件。它仅在我传入ptx file
的绝对路径时才有效。但我希望编译ptx file
附带jar files
。有没有办法实现这个目标?
答案 0 :(得分:4)
cuModuleLoad
function in JCuda是直接映射到相应的cuModuleLoad
function in CUDA。它期望文件名作为第二个参数。
问题是:cuModuleLoad
无法加载PTX文件,因为CUDA根本不存在PTX文件! PTX文件隐藏在JAR文件中。
使用someClass.getResource()
从JAR文件获取资源时,它将指向JAR文件中的资源。当你做
System.out.println(getClass().getResource("vectorAdd.ptx").getPath());
并运行它(作为JAR文件),然后您将看到如下输出:
file:/U:/YourWorkspace/YourJarFile.jar!/vectorAdd.ptx
请注意.jar!
部分:此路径不是实际文件的路径,但只是JAR 中资源的路径。
为了从JAR加载PTX文件,您必须将JAR中的PTX文件读取到Java端的byte[]
数组中,然后将其传递给cuModuleLoadData
function of JCuda(对应的)到cuModuleLoadData
function of CUDA)。
这是一个将来自JAR文件的PTX数据加载到字节数组中的示例,表示可以传递给cuModuleLoadData
的以零结尾的字符串:
import static jcuda.driver.JCudaDriver.cuCtxCreate;
import static jcuda.driver.JCudaDriver.cuDeviceGet;
import static jcuda.driver.JCudaDriver.cuInit;
import static jcuda.driver.JCudaDriver.cuModuleGetFunction;
import static jcuda.driver.JCudaDriver.cuModuleLoadData;
import static jcuda.runtime.JCuda.cudaDeviceReset;
import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.InputStream;
import jcuda.driver.CUcontext;
import jcuda.driver.CUdevice;
import jcuda.driver.CUfunction;
import jcuda.driver.CUmodule;
import jcuda.driver.JCudaDriver;
public class JCudaPtxInJar
{
public static void main(String args[]) throws IOException
{
// Initialization
JCudaDriver.setExceptionsEnabled(true);
cuInit(0);
CUdevice device = new CUdevice();
cuDeviceGet(device, 0);
CUcontext context = new CUcontext();
cuCtxCreate(context, 0, device);
// Read the PTX data into a zero-terminated string byte array
byte ptxData[] = toZeroTerminatedStringByteArray(
JCudaPtxInJar.class.getResourceAsStream(
"JCudaVectorAddKernel.ptx"));
// Load the module data
CUmodule module = new CUmodule();
cuModuleLoadData(module, ptxData);
// Obtain a function pointer to the "add" function
// and print a simple test/debug message
CUfunction function = new CUfunction();
cuModuleGetFunction(function, module, "add");
System.out.println("Got function "+function);
cudaDeviceReset();
}
/**
* Read the contents of the given input stream, and return it
* as a byte array containing the ZERO-TERMINATED string data
* from the stream. The caller is responsible for closing the
* given stream.
*
* @param inputStream The input stream
* @return The ZERO-TERMINATED string byte array
* @throws IOException If an IO error occurs
*/
private static byte[] toZeroTerminatedStringByteArray(
InputStream inputStream) throws IOException
{
ByteArrayOutputStream baos = new ByteArrayOutputStream();
byte buffer[] = new byte[8192];
while (true)
{
int read = inputStream.read(buffer);
if (read == -1)
{
break;
}
baos.write(buffer, 0, read);
}
baos.write(0);
return baos.toByteArray();
}
}
编译并将其打包成JAR(当然还有/resources/JCudaVectorAddKernel.ptx
PTX文件)将允许您启动程序并从JAR中的PTX获取示例函数。