我正在学习使用Rootbeer,但是当我运行示例应用时遇到困难,没有人能回答我的问题:Rootbeer runtime error, how to fix?
所以我下载了Rootbeer的源代码,并看了一下代码,这里问题出在哪里[CUDAContext.java:119]:
public void setKernel(Kernel kernelTemplate) {
this.kernelTemplate = kernelTemplate;
[ 119 ] this.compiledKernel = (CompiledKernel) kernelTemplate;
}
Kernel和CompiledKernel的定义是:
public interface Kernel
{
public void gpuMethod();
}
public interface CompiledKernel
{
public String getCodeUnix();
public String getCodeWindows();
public int getNullPointerNumber();
public int getOutOfMemoryNumber();
public String getCubin32();
public int getCubin32Size();
public boolean getCubin32Error();
public String getCubin64();
public int getCubin64Size();
public boolean getCubin64Error();
public Serializer getSerializer(Memory memory,Memory memory1);
public boolean isUsingGarbageCollector();
}
演员阵容在第119行是否正确完成?如果是,为什么我会收到错误说:
java.lang.ClassCastException: ArrayMult cannot be cast to org.trifort.rootbeer.runtime.CompiledKernel
at org.trifort.rootbeer.runtime.CUDAContext.setKernel(CUDAContext.java:119)
如果它没有正确完成,那么投出它的正确方法是什么?
编辑:以下是示例代码
import java.util.List;
import java.util.ArrayList;
import org.trifort.rootbeer.runtime.Kernel;
import org.trifort.rootbeer.runtime.Rootbeer;
public class ArrayMultApp
{
public ArrayMultApp()
{
int[] array=new int[10];
for (int i=0;i<array.length;++i) array[i]=i;
for (int i=0;i<array.length;++i) Out("start array["+i+"]: "+array[i]);
multArray(array);
for (int i=0;i<array.length;++i) Out("final array["+i+"]: "+array[i]);
}
public void multArray(int[] array)
{
try
{
List<Kernel> jobs=new ArrayList();
for (int i=0;i<array.length;++i) jobs.add(new ArrayMult(array,i));
Rootbeer rootbeer=new Rootbeer();
rootbeer.run(jobs);
}
catch (Exception e) { e.printStackTrace(); }
}
public static void main(String[] args) { ArrayMultApp app=new ArrayMultApp(); }
private static void out(String message) { System.out.print(message); }
private static void Out(String message) { System.out.println(message); }
}
class ArrayMult implements Kernel
{
private int[] m_source;
private int m_index;
public ArrayMult(int[] source,int index)
{
m_source=source;
m_index=index;
}
public void gpuMethod() { m_source[m_index]*=11; }
}
答案 0 :(得分:1)
不,不是。你有两个不同的界面。
public void setKernel(Kernel kernelTemplate) {
this.kernelTemplate = kernelTemplate;
[ 119 ] this.compiledKernel = (CompiledKernel) kernelTemplate;
}
在119上,您正在尝试将内核转换为CompiledKernel,每个内核都有自己的层次结构。如果CompiledKernel extends Kernel
,则可行。
答案 1 :(得分:1)
我没有G卡,因此我无法测试您的代码。我查看了源代码。作者在org.trifort.rootbeer.compiler.Transform2.java中做了这个技巧
public void run(String cls){
OpenCLScene scene = new OpenCLScene();
OpenCLScene.setInstance(scene);
scene.init();
SootClass soot_class1 = Scene.v().getSootClass(cls);
SootMethod method = soot_class1.getMethod("void gpuMethod()");
String uuid = getUuid();
GenerateForKernel generator = new GenerateForKernel(method, uuid);
try {
generator.makeClass();
} catch(Exception ex){
ex.printStackTrace();
OpenCLScene.releaseV();
return;
}
//add an interface to the class
SootClass soot_class = method.getDeclaringClass();
SootClass iface_class = Scene.v().getSootClass("org.trifort.rootbeer.runtime.CompiledKernel");
soot_class.addInterface(iface_class);
System.out.println("added interface CompiledKernel");
OpenCLScene.releaseV();
}
我还查看了他的演示代码,“examples \ sort \ src \ org \ trifort \ rootbeer \ sort \ GPUSort.java”。作者确实启动了Contex,它与您的代码不同。我建议你先试试他的代码。我打赌它会调用Transform2.run函数,而你的代码却没有。
public void sort(){
//should have 192 threads per SM
int size = 2048;
int sizeBy2 = size / 2;
//int numMultiProcessors = 14;
//int blocksPerMultiProcessor = 512;
int numMultiProcessors = 2;
int blocksPerMultiProcessor = 256;
int outerCount = numMultiProcessors*blocksPerMultiProcessor;
int[][] array = new int[outerCount][];
for(int i = 0; i < outerCount; ++i){
array[i] = newArray(size);
}
Rootbeer rootbeer = new Rootbeer();
List<GpuDevice> devices = rootbeer.getDevices();
GpuDevice device0 = devices.get(0);
Context context0 = device0.createContext(4212880);
context0.setCacheConfig(CacheConfig.PREFER_SHARED);
context0.setThreadConfig(sizeBy2, outerCount, outerCount * sizeBy2);
context0.setKernel(new GPUSortKernel(array));
context0.buildState();
......
}
答案 2 :(得分:0)
如果实际对象实现了该接口,则只能转换为接口。我对CUDA知之甚少,但可能有一个方法需要一个内核,并返回一个CompiledKernel。简单的铸造不会那样做。
另一方面,如果您是“ArrayMult”类的创建者,则可以通过实现Kernel和CompiledKernel来解决此问题。