(免责声明:我意识到这是一个巨大的文本墙,但我已经尽力将事情归结为基本要素。如果你熟悉libtiff这不是一个非常复杂的问题)
我已经在libtiff邮件列表上问了这个问题,但我认为如果有人和图书馆合作过,我也很有机会在这里。
我正在使用此处的文档将自己的内置标记添加到库中:http://libtiff.maptools.org/addingtags.html
所以,我在tif_dirinfo.c顶部定义的TIFFFieldInfo数组中添加了一个条目,如下所示:
{ TIFFTAG_CUSTOM_XXX, 4, 4, TIFF_SLONG, FIELD_XXX, 1, 0, "XXX" },
然后我在TIFFDirectory
:
tif_dir.h
结构中添加了一个字段
typedef struct {
/* ... */
int32 td_xxx[4];
} TIFFDirectory;
现在我按照指示继续修改了_TIFFVSetField
和_TIFFVGetField
。这是我遇到问题的地方。
在模仿库中已存在的模式时(参见TIFFTAG_YCBCRSUBSAMPLING
的实现,这与我正在做的类似),我将以下代码添加到_TIFFVGetField
:
/* existing, standard tag for reference */
case TIFFTAG_YCBCRSUBSAMPLING:
*va_arg(ap, uint16*) = td->td_ycbcrsubsampling[0];
*va_arg(ap, uint16*) = td->td_ycbcrsubsampling[1];
break;
/* my new tag */
case TIFFTAG_CUSTOM_XXX:
*va_arg(ap, int32*) = td->td_xxx[0];
*va_arg(ap, int32*) = td->td_xxx[1];
*va_arg(ap, int32*) = td->td_xxx[2];
*va_arg(ap, int32*) = td->td_xxx[3];
break;
据我所知,这是完全错误的。这里的目的是基于一组int来填充变量参数列表中的输入。保存的优点是va_list
中提供的参数始终为int32
类型,YcBr代码使用两个int16
。所以,它有效,但我无法复制该实现。
_TIFFVGetField
最终来自TIFFWriteNormalTag
中的tif_dirwrite.c
。相关代码是:
case TIFF_LONG:
case TIFF_SLONG:
case TIFF_IFD:
if (fip->field_passcount) {
uint32* lp;
if (wc == (uint16) TIFF_VARIABLE2) {
TIFFGetField(tif, fip->field_tag, &wc2, &lp);
TDIRSetEntryCount(tif,dir, wc2);
} else { /* Assume TIFF_VARIABLE */
TIFFGetField(tif, fip->field_tag, &wc, &lp);
TDIRSetEntryCount(tif,dir, wc);
}
if (!TIFFWriteLongArray(tif, dir, lp))
return 0;
} else {
if (wc == 1) {
uint32 wp;
/* XXX handle LONG->SHORT conversion */
TIFFGetField(tif, fip->field_tag, &wp);
TDIRSetEntryOff(tif,dir, wp);
} else {
/* ---------------------------------------------------- */
/* this is the code that is called in my scenario */
/* ---------------------------------------------------- */
uint32* lp;
TIFFGetField(tif, fip->field_tag, &lp);
if (!TIFFWriteLongArray(tif, dir, lp))
return 0;
}
}
break;
因此,声明了未初始化的指针lp
,并将其地址传递给TIFFGetField
。这又设置了va_list(lp
作为唯一参数)并调用TIFFVGetField
,它使用提供的_TIFFVGetField
调用va_list
和指向未初始化指针的指针。
这里有两个问题。
首先,这是库提取数据的方式(我的代码,但是再次按照已经存在的模式)
*va_arg(ap, int32*) = td->td_xxx[0];
这似乎不正确。它将原始指针设置为int的值。我推测也许,在我关注的例子中(TIFFTAG_YCBCRSUBSAMPLING),这些整数实际上是地址。好吧,但即使是这种情况,尽管存在另一个问题。
库调用va_args
N
次,其中N
是数组中元素的数量。从我看到的变量参数列表只包含一个参数(指针的地址)。这是标准的未定义行为(开头的重要部分):
如果没有实际的下一个参数,或者类型与类型不兼容 实际的下一个参数(根据默认参数促销提升),行为未定义。
正确的版本是
*va_arg(ap, int32**) = td_xxx;
这会将先前未初始化的指针设置为有效的数组。我不喜欢它指向数据本身而不是副本,但无论如何;至少它不会崩溃并给我正确的结果。
我担心的是我错过了一些微妙的东西。这个软件很老,很多人都在使用。因此,将此称为bug是一种感觉,就像在编译器上指责崩溃一样,几乎总是错误的。
但是,我无法推断出这种方法是正确的,特别是当多次调用时,库如何写入va_arg
返回的内容。
非常感谢任何帮助。提前谢谢。
答案 0 :(得分:0)
所以,这里的答案最终归结为libtiff依赖于UB。虽然它在技术上是UB,但我找不到va_arg
的实现没有做到这样的事情:
( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
因此,只要t
小于原始参数大小(就像在这里一样),就可以安全地多次调用va_arg
。
我最后只是将参数设置为导致我的数据的指针并且它可以工作。我不喜欢直接访问标题数据本身,但没有以显着的方式更改库,这是我唯一的选择。