添加自定义TAG时实现_TIFFVGetField的困惑

时间:2012-02-28 21:27:41

标签: c libtiff

(免责声明:我意识到这是一个巨大的文本墙,但我已经尽力将事情归结为基本要素。如果你熟悉libtiff这不是一个非常复杂的问题)

我已经在libtiff邮件列表上问了这个问题,但我认为如果有人和图书馆合作过,我也很有机会在这里。

我正在使用此处的文档将自己的内置标记添加到库中:http://libtiff.maptools.org/addingtags.html

所以,我在tif_dirinfo.c顶部定义的TIFFFieldInfo数组中添加了一个条目,如下所示:

{ TIFFTAG_CUSTOM_XXX, 4, 4, TIFF_SLONG, FIELD_XXX, 1, 0, "XXX" }, 

然后我在TIFFDirectory

中定义的tif_dir.h结构中添加了一个字段
typedef struct {
    /* ... */
    int32 td_xxx[4]; 
} TIFFDirectory;

现在我按照指示继续修改了_TIFFVSetField_TIFFVGetField。这是我遇到问题的地方。

在模仿库中已存在的模式时(参见TIFFTAG_YCBCRSUBSAMPLING的实现,这与我正在做的类似),我将以下代码添加到_TIFFVGetField

/* existing, standard tag for reference */
case TIFFTAG_YCBCRSUBSAMPLING:
        *va_arg(ap, uint16*) = td->td_ycbcrsubsampling[0];
        *va_arg(ap, uint16*) = td->td_ycbcrsubsampling[1];
        break;
/* my new tag */
case TIFFTAG_CUSTOM_XXX: 
        *va_arg(ap, int32*) = td->td_xxx[0]; 
        *va_arg(ap, int32*) = td->td_xxx[1]; 
        *va_arg(ap, int32*) = td->td_xxx[2]; 
        *va_arg(ap, int32*) = td->td_xxx[3]; 
        break; 

据我所知,这是完全错误的。这里的目的是基于一组int来填充变量参数列表中的输入。保存的优点是va_list中提供的参数始终为int32类型,YcBr代码使用两个int16。所以,它有效,但我无法复制该实现。

_TIFFVGetField最终来自TIFFWriteNormalTag中的tif_dirwrite.c。相关代码是:

case TIFF_LONG: 
    case TIFF_SLONG: 
    case TIFF_IFD: 
        if (fip->field_passcount) { 
            uint32* lp; 
            if (wc == (uint16) TIFF_VARIABLE2) { 
                TIFFGetField(tif, fip->field_tag, &wc2, &lp); 
                TDIRSetEntryCount(tif,dir, wc2); 
            } else {    /* Assume TIFF_VARIABLE */ 
                TIFFGetField(tif, fip->field_tag, &wc, &lp); 
                TDIRSetEntryCount(tif,dir, wc); 
            } 
            if (!TIFFWriteLongArray(tif, dir, lp)) 
                return 0; 
            } else { 
                if (wc == 1) { 
                    uint32 wp; 
                    /* XXX handle LONG->SHORT conversion */ 
                    TIFFGetField(tif, fip->field_tag, &wp); 
                    TDIRSetEntryOff(tif,dir, wp); 
                } else { 
                /* ---------------------------------------------------- */ 
                /* this is the code that is called in my scenario       */
                /* ---------------------------------------------------- */ 
                    uint32* lp; 
                    TIFFGetField(tif, fip->field_tag, &lp); 
                    if (!TIFFWriteLongArray(tif, dir, lp)) 
                        return 0; 
                } 
            } 
            break; 

因此,声明了未初始化的指针lp,并将其地址传递给TIFFGetField。这又设置了va_list(lp作为唯一参数)并调用TIFFVGetField,它使用提供的_TIFFVGetField调用va_list和指向未初始化指针的指针。

这里有两个问题。

首先,这是库提取数据的方式(我的代码,但是再次按照已经存在的模式)

*va_arg(ap, int32*) = td->td_xxx[0]; 

这似乎不正确。它将原始指针设置为int的值。我推测也许,在我关注的例子中(TIFFTAG_YCBCRSUBSAMPLING),这些整数实际上是地址。好吧,但即使是这种情况,尽管存在另一个问题。

库调用va_args N次,其中N是数组中元素的数量。从我看到的变量参数列表只包含一个参数(指针的地址)。这是标准的未定义行为(开头的重要部分):

如果没有实际的下一个参数,或者类型与类型不兼容 实际的下一个参数(根据默认参数促销提升),行为未定义。

正确的版本是

*va_arg(ap, int32**) = td_xxx; 

这会将先前未初始化的指针设置为有效的数组。我不喜欢它指向数据本身而不是副本,但无论如何;至少它不会崩溃并给我正确的结果。

我担心的是我错过了一些微妙的东西。这个软件很老,很多人都在使用。因此,将此称为bug是一种感觉,就像在编译器上指责崩溃一样,几乎总是错误的。

但是,我无法推断出这种方法是正确的,特别是当多次调用时,库如何写入va_arg返回的内容。

非常感谢任何帮助。提前谢谢。

1 个答案:

答案 0 :(得分:0)

所以,这里的答案最终归结为libtiff依赖于UB。虽然它在技术上是UB,但我找不到va_arg的实现没有做到这样的事情:

( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )

因此,只要t小于原始参数大小(就像在这里一样),就可以安全地多次调用va_arg

我最后只是将参数设置为导致我的数据的指针并且它可以工作。我不喜欢直接访问标题数据本身,但没有以显着的方式更改库,这是我唯一的选择。