我使用了VATIC视频注释工具(http://www.cs.columbia.edu/~vondrick/vatic/) 第一次为视频中的对象添加标签。
我执行了以下步骤。
1。安装Docker
2。创建容器
sudo docker run -it -p 8111:80 -v $PWD/data:/root/vatic/data npsvisionlab/vatic-docker
3。打开浏览器
localhost:8111/directory
4。在浏览器上标记一些对象
5。输出文件
按下按钮Output Labels
,将自动创建output.xml
文件。
之后,我检查了输出文件output.xml
。
但是,我无法理解<x></x>
和<y></y>
在输出文件中表示什么。
output.xml
中的某些行在此处。
<object><name>potB</name><moving>true</moving><action/><verified>0</verified><id>2</id><createdFrame>85</createdFrame><startFrame>85</startFrame><endFrame>2641</endFrame>
<polygon><t>85</t><pt><x>239</x><y>309</y><l>1</l></pt><pt><x>239</x><y>403</y><l>1</l></pt><pt><x>394</x><y>403</y><l>1</l></pt><pt><x>394</x><y>309</y><l>1</l></pt></polygon>
<polygon><t>86</t><pt><x>238</x><y>303</y><l>0</l></pt><pt><x>238</x><y>400</y><l>0</l></pt><pt><x>392</x><y>400</y><l>0</l></pt><pt><x>392</x><y>303</y><l>0</l></pt></polygon>
<polygon><t>87</t><pt><x>237</x><y>297</y><l>0</l></pt><pt><x>237</x><y>398</y><l>0</l></pt><pt><x>391</x><y>398</y><l>0</l></pt><pt><x>391</x><y>297</y><l>0</l></pt></polygon>
。
。
。
。
<polygon><t>2639</t><pt><x>325</x><y>119</y><l>0</l></pt><pt><x>325</x><y>243</y><l>0</l></pt><pt><x>519</x><y>243</y><l>0</l></pt><pt><x>519</x><y>119</y><l>0</l></pt></polygon>
<polygon><t>2640</t><pt><x>324</x><y>119</y><l>0</l></pt><pt><x>324</x><y>243</y><l>0</l></pt><pt><x>519</x><y>243</y><l>0</l></pt><pt><x>519</x><y>119</y><l>0</l></pt></polygon>
<polygon><t>2641</t><pt><x>324</x><y>119</y><l>1</l></pt><pt><x>324</x><y>243</y><l>1</l></pt><pt><x>520</x><y>243</y><l>1</l></pt><pt><x>520</x><y>119</y><l>1</l></pt></polygon>
</object>
目前,我只知道<polygon></polygon>
之一表示一个边界框信息。
<t></t>
是火焰数。
<x></x>
中有四组<y></y>
和<polygon></polygon>
。
同样,我的问题在这里。
<x></x>
和<y></y>
分别表示什么?
x_min
y_min
x_max
y_max
在哪里?
如果你知道,
x_min
y_min
x_max
y_max
的定义是什么?