Question

（免责声明：我意识到这是一个巨大的文本墙，但我已经尽力将事情归结为基本要素。如果你熟悉libtiff这不是一个非常复杂的问题）

我已经在libtiff邮件列表上问了这个问题，但我认为如果有人和图书馆合作过，我也很有机会在这里。

我正在使用此处的文档将自己的内置标记添加到库中：http://libtiff.maptools.org/addingtags.html

所以，我在tif_dirinfo.c顶部定义的TIFFFieldInfo数组中添加了一个条目，如下所示：

{ TIFFTAG_CUSTOM_XXX, 4, 4, TIFF_SLONG, FIELD_XXX, 1, 0, "XXX" },

然后我在TIFFDirectory：

中定义的tif_dir.h结构中添加了一个字段

typedef struct {
    /* ... */
    int32 td_xxx[4]; 
} TIFFDirectory;

现在我按照指示继续修改了_TIFFVSetField和_TIFFVGetField。这是我遇到问题的地方。

在模仿库中已存在的模式时（参见TIFFTAG_YCBCRSUBSAMPLING的实现，这与我正在做的类似），我将以下代码添加到_TIFFVGetField：

/* existing, standard tag for reference */
case TIFFTAG_YCBCRSUBSAMPLING:
        *va_arg(ap, uint16*) = td->td_ycbcrsubsampling[0];
        *va_arg(ap, uint16*) = td->td_ycbcrsubsampling[1];
        break;
/* my new tag */
case TIFFTAG_CUSTOM_XXX: 
        *va_arg(ap, int32*) = td->td_xxx[0]; 
        *va_arg(ap, int32*) = td->td_xxx[1]; 
        *va_arg(ap, int32*) = td->td_xxx[2]; 
        *va_arg(ap, int32*) = td->td_xxx[3]; 
        break;

据我所知，这是完全错误的。这里的目的是基于一组int来填充变量参数列表中的输入。保存的优点是va_list中提供的参数始终为int32类型，YcBr代码使用两个int16。所以，它有效，但我无法复制该实现。

_TIFFVGetField最终来自TIFFWriteNormalTag中的tif_dirwrite.c。相关代码是：

case TIFF_LONG: 
    case TIFF_SLONG: 
    case TIFF_IFD: 
        if (fip->field_passcount) { 
            uint32* lp; 
            if (wc == (uint16) TIFF_VARIABLE2) { 
                TIFFGetField(tif, fip->field_tag, &wc2, &lp); 
                TDIRSetEntryCount(tif,dir, wc2); 
            } else {    /* Assume TIFF_VARIABLE */ 
                TIFFGetField(tif, fip->field_tag, &wc, &lp); 
                TDIRSetEntryCount(tif,dir, wc); 
            } 
            if (!TIFFWriteLongArray(tif, dir, lp)) 
                return 0; 
            } else { 
                if (wc == 1) { 
                    uint32 wp; 
                    /* XXX handle LONG->SHORT conversion */ 
                    TIFFGetField(tif, fip->field_tag, &wp); 
                    TDIRSetEntryOff(tif,dir, wp); 
                } else { 
                /* ---------------------------------------------------- */ 
                /* this is the code that is called in my scenario       */
                /* ---------------------------------------------------- */ 
                    uint32* lp; 
                    TIFFGetField(tif, fip->field_tag, &lp); 
                    if (!TIFFWriteLongArray(tif, dir, lp)) 
                        return 0; 
                } 
            } 
            break;

因此，声明了未初始化的指针lp，并将其地址传递给TIFFGetField。这又设置了va_list（lp作为唯一参数）并调用TIFFVGetField，它使用提供的_TIFFVGetField调用va_list和指向未初始化指针的指针。

这里有两个问题。

首先，这是库提取数据的方式（我的代码，但是再次按照已经存在的模式）

*va_arg(ap, int32*) = td->td_xxx[0];

这似乎不正确。它将原始指针设置为int的值。我推测也许，在我关注的例子中（TIFFTAG_YCBCRSUBSAMPLING），这些整数实际上是地址。好吧，但即使是这种情况，尽管存在另一个问题。

库调用va_args N次，其中N是数组中元素的数量。从我看到的变量参数列表只包含一个参数（指针的地址）。这是标准的未定义行为（开头的重要部分）：

如果没有实际的下一个参数，或者类型与类型不兼容实际的下一个参数（根据默认参数促销提升），行为未定义。

正确的版本是

*va_arg(ap, int32**) = td_xxx;

这会将先前未初始化的指针设置为有效的数组。我不喜欢它指向数据本身而不是副本，但无论如何;至少它不会崩溃并给我正确的结果。

我担心的是我错过了一些微妙的东西。这个软件很老，很多人都在使用。因此，将此称为bug是一种感觉，就像在编译器上指责崩溃一样，几乎总是错误的。

但是，我无法推断出这种方法是正确的，特别是当多次调用时，库如何写入va_arg返回的内容。

非常感谢任何帮助。提前谢谢。

Answer 1

所以，这里的答案最终归结为libtiff依赖于UB。虽然它在技术上是UB，但我找不到va_arg的实现没有做到这样的事情：

( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )

因此，只要t小于原始参数大小（就像在这里一样），就可以安全地多次调用va_arg。

我最后只是将参数设置为导致我的数据的指针并且它可以工作。我不喜欢直接访问标题数据本身，但没有以显着的方式更改库，这是我唯一的选择。

添加自定义TAG时实现_TIFFVGetField的困惑

1 个答案: