元组的大小没有上限,但是一些Haskell实现可能会限制元组的大小,并限制与较大元组相关联的实例。但是,每个Haskell实现必须支持最大为15的元组,以及Eq,Ord,Bounded,Read和Show的实例。 (...)
然而,众所周知,GHC不支持大小超过62的元组。这是当我尝试在GHCi中创建大小为63的元组时发生的情况:
<interactive>:1:1: error:
A 63-tuple is too large for GHC
(max size is 62)
Workaround: use nested tuples or define a data type
我认识到这符合Haskell 98规范,并且大小超过62的元组可能是非常不必要的,但我不明白为什么这与GHC中的情况完全相同。 / p>
总结:
另外:
答案 0 :(得分:34)
我认为猜测重新:评论中这种变化的时机是错误的。首先,据我所知,自6.12.1之前的 LONG 以来,该限制已经存在。从Trac #98 from November 2002可以看出,在版本5.02.2中,限制是37(而不是62),并且尝试使用更大的元组生成了一个神秘的消息:
Switches_tupel.lhs:1:
Failed to find interface decl for
`PrelTup.(,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,)'
from module `PrelTup'
Simon Peyton-Jones修复了错误,让编译器在编译管道中检查大小,并生成更好的错误消息(在Git commit b44c6881中可见)。在提交此提交时,限制已经从37增加到62(Git commit 9af77fa4,它将模板Haskell工作集成到HEAD中),因此GHC 5.04发布时具有62元组限制和更好的错误消息。
我相信最初的Trac#98错误指向限制的原因。在ghc/compiler/prelude/TysWiredIn.hs
中,预先分配了一组元组类型和数据构造函数:
boxedTupleArr, unboxedTupleArr :: Array Int (TyCon,DataCon)
boxedTupleArr = listArray (0,mAX_TUPLE_SIZE) [mk_tuple Boxed i
| i <- [0..mAX_TUPLE_SIZE]]
unboxedTupleArr = listArray (0,mAX_TUPLE_SIZE) [mk_tuple Unboxed i
| i <- [0..mAX_TUPLE_SIZE]]
其中mAX_TUPLE_SIZE
是有问题的62元组限制。但是,实际使用这些预分配数组的函数很乐意按需生成更大的构造函数(“专门构建一个”):
tupleTyCon :: Boxity -> Arity -> TyCon
tupleTyCon sort i | i > mAX_TUPLE_SIZE
= fst (mk_tuple sort i) -- Build one specially
tupleTyCon Boxed i = fst (boxedTupleArr ! i)
tupleTyCon Unboxed i = fst (unboxedTupleArr ! i)
这是编译器在添加5.04的错误消息之前所做的事情 - 它专门构建了一个。
不幸的是,当编译器找不到ghc/libraries/ghc-prim/GHC/Tuple.hs
中给出的列表中太大的元组的接口定义时,这会在编译过程的后期导致错误(不是段错误,只是错误)。根据标题TysWiredIn.hs
下The tuple types
中的(稍微过时的)注释,Tuple.hs
中的声明用于构造元组构造函数的信息表和条目代码,即使理论上这些也是如此以编程方式为任意大的元组动态生成。
那么,这对现代GHC意味着什么呢?好吧,由于上述相同的技术原因,即使编译器准备生成任意大的元组,但由于它们需要.../GHC/Tuple.hs
中的匹配声明,因此存在限制。
我进行了一些实验,从源代码编译GHC并禁用元组长度检查。生成的编译器使用100元组成功编译并运行以下程序:
a = (False,...,False) -- imagine 100 Falses
main = let (x,_,...,_) = a
in print x
并打印“False”。当我修改它以获取同一元组的最后一个元素时,它工作正常:
a = (False,...,False) -- imagine 100 Falses
main = let (_,...,_,x) = a
in print x
然而,该计划:
a = (False,...,False) -- imagine 100 Falses
main = let (x,_,...,_,y) = a
in print (x,y)
因链接错误而失败:
[1 of 1] Compiling Main ( Tuple.hs, Tuple.o )
Linking Tuple ...
Tuple.o(.data+0x0): error: undefined reference to 'ghczmprim_GHCziTuple_Z100T_con_info'
collect2: error: ld returned 1 exit status
`gcc' failed in phase `Linker'. (Exit code: 1)
我怀疑对于前两个程序,编译器优化了对缺少的构造函数的引用,但最终的程序需要它。在Tuple.hs
中添加了一个100元组的声明并重建了编译器之后,所有三个程序都编译好了。
简而言之,在Tuple.hs
中编译手动构造的元组列表会生成所需的数据结构以支持最大为62的元组,并且没有人有足够的动力来重新实现此数据结构生成以独立于Tuple.hs
拐杖。如果他们这样做,GHC可能会支持任意大小的元组。
顺便说一下,Tuple.hs
中有关Manuel的段错误的说明(在对该问题的评论之一中引用)可以追溯到2001年7月,当时它被检入libraries/base/Data/Tuple.hs
,所以无论它是什么,它与GHC 6.12.1无关。这个问题可能是Simon将max设置为62的原因,但这个限制似乎不再适用于现代GHC。