应用错误收集

更新：Apple现在有sample code project执行其中一些步骤。继续阅读那些你仍需要弄清楚自己的人......

几乎所有的作品都是为了你想做的......你大多只需要将它们组合在一起。

您可以通过定期轮询其ARFrame的ARSession或将其推送到您的会话代表来获取currentFrame。（如果您正在构建自己的渲染器，那就是ARSessionDelegate;如果您正在使用ARSCNView或ARSKView，则他们的委托回调会引用该视图，所以你可以从那里回到会话，以获得导致回调的currentFrame。）

ARFrame以CVPixelBuffer的形式提供当前capturedImage。

您可以使用Vision或VNImageRequestHandler类将图像传递到VNSequenceRequestHandler进行处理，这两个类都有将CVPixelBuffer作为输入图像进行处理的方法。

如果您要执行使用单个图片的请求，请使用图片请求处理程序，例如查找 rectangles或QR codes或faces，或者using a Core ML model to identify the image。
您使用序列请求处理程序执行涉及分析多个图像之间更改的请求，例如tracking an object's movement after you've identified it。

您可以找到将图像传递到附加到WWDC17 session on Vision的Vision + Core ML的通用代码，如果您观看该会话，则实时演示还包括将CVPixelBuffer传递给Vision。（他们在该演示中从AVCapture获取像素缓冲区，但如果您从ARKit获取缓冲区，则Vision部分是相同的。）

您可能遇到的一个问题是识别/定位对象。大多数＆＃34;对象识别＆＃34;人们使用Core ML + Vision的模型（包括那些Apple在其ML developer page上提供预转换版本的模型）是场景分类器。也就是说，他们看一张图片然后说，＆＃34;这是（thing）的图片，＆＃34;不是像＆＃34;这张照片中有一个（thing），位于（边界框）＆＃34;。

Vision为处理分类器提供了简单的API - 您的请求结果数组中填充了VNClassificationObservation个对象，告诉您场景是什么（或者＆＃34;可能是＆＃34;，与信心评级）。

如果你找到或训练一个既能识别和定位物体的模型 - 又对于那部分，我必须强调，球在你的球场 - 使用Vision会导致{{3对象。这些类似于任意键值对，因此您从这些键中确定对象的确切方式取决于您如何构建和标记模型的输出。

如果你正在处理Vision已经知道如何识别的东西，而不是使用你自己的模型 - 像面部和QR码这样的东西 - 你可以用Vision＆＃39;来获取图像框架中的那些位置。 s API。

如果在2D图像中找到对象后，您希望在AR中显示与其关联的3D内容（或显示2D内容，但所述内容使用ARKit以3D形式定位），则您需要{{ 3}}那些2D图像指向3D世界。

一旦你完成这一步骤，将AR内容与点击测试放在一起已经很好地涵盖在其他地方，VNCoreMLFeatureValueObservation和hit test。

ARkit和CoreML

1 个答案: