解析torrent文件 - 哈希信息。 (二郎)

时间:2010-11-08 13:09:56

标签: erlang bittorrent info-hash

我正在尝试提供正确的url编码信息哈希,以便发送到跟踪器以获取对等列表。

为了测试,我尝试在this url中解析torrent。

打开文件后,手动剪切信息字典片段和SHA1-hash它的值我得到这个二进制值:

<< 84,124,15,255,155,171,156,168,91,46,204,24,249,116,110,   139,202,167,163,54>>

从后一个二进制值检索的ASCII字符串是788f590f28a799cc1009a9b780b649fd6f0a2e91,它与网站中提到的值相同。

所以,让我们假设现在一切都是正确的(不是吗?)。

使用下面的url-encoding函数对二进制值进行编码后得到 T%7c%0f%ff%9b%ab%9c%a8%5b。%cc%18​​%f9tn%8b%ca%a7%a36,甚至没有接近我应发送给跟踪器的正确urlencoded值。 (当我将此信息发送给跟踪器时,我收到一条未找到的错误消息,此外,它与我使用wireshark看到的值不匹配,即x%8fY%0f%28%a7%99%cc%10%09%a9 %b7%80%b6I%fdo%0a。%91)。

我正在使用的URL编码功能:

encode(<<Bin:20/binary-unit:8>>)->
    %io:format("~p~n", [binary_to_list(Bin)]),
    encode(binary_to_list(Bin));
encode(List) -> do_encode(List).

do_encode([])-> [];
do_encode([H|T]) when H>=$a, H=<$z ->
    [H| encode(T)];
do_encode([H|T]) when H>=$A, H=<$Z ->
    [H| encode(T)];
do_encode([H|T]) when H>=$0, H=<$9 ->
    [H| encode(T)];
do_encode([H|T]) when H==$- ->
    [H| encode(T)];
do_encode([H|T]) when H==$. ->
    [H|do_encode(T)];
do_encode([H|T]) when H==$* ->
    [H|do_encode(T)];
do_encode([H|T]) ->
     to_hex(H) ++ encode(T).

hex(N) when N < 10 ->
    $0+N;
hex(N) when N >= 10, N < 16 ->
    $a+(N-10).
to_hex(N) when N < 256 ->
    [$%, hex(N div 16), hex(N rem 16)].

上述功能是错误的吗?在原始数据处理方面,我是一个新手。所以非常感谢帮助/想法!谢谢!

2 个答案:

答案 0 :(得分:1)

请注意,erlang中已经提供了URL编码(虽然隐藏得很好)。

1> B = <<84,124,15,255,155,171,156,168,91,46,204,24,249,116,110, 139,202,167,163,54>>.
<<84,124,15,255,155,171,156,168,91,46,204,24,249,116,110,
2> L = erlang:binary_to_list(B).
[84,124,15,255,155,171,156,168,91,46,204,24,249,116,110,139,
 202,167,163,54]
3> edoc_lib:escape_uri(L).
"T%7c%f%c3%bf%c2%9b%c2%ab%c2%9c%c2%a8%5b.%c3%8c%18%c3%b9tn%c2%8b%c3%8a%c2%a7%c2%a36"

它产生与你相同的结果。

答案 1 :(得分:1)

您的编码器不是您的问题,而是您对数据的初步猜测。我们的字符串是“788f590f28a799cc1009a9b780b649fd6f0a2e91”,所以我们编写一些Erlang代码将其转换为二进制表示形式列表:

part([]) ->  [];
part([U,L | R]) ->
    [{list_to_integer([U], 16),
      list_to_integer([L], 16)} | part(R)].

现在,在提示中询问:

(etorrent@127.0.0.1)16> etorrent_utils:build_encoded_form_rfc1738([U*16+L || {U,L} <- foo:part("788f590f28a799cc1009a9b780b649fd6f0a2e91")]).
"x%8FY%0F%28%A7%99%CC%10%09%A9%B7%80%B6I%FDo%0A.%91"

匹配预期。您应该检查您的手动选择infohash及其SHA1计算是否按预期工作。因为你的SHA1二进制文件与它不匹配。