在不使用ad-hoc解析器实现的情况下反序列化许多网络消息

时间:2015-05-30 18:35:18

标签: haskell deserialization

我有一个关于反序列化的问题。我可以设想使用Data.Data,Data.Typeable或GHC.Generics的解决方案,但我很好奇它是否可以在没有泛型,SYB或元编程的情况下完成。

问题描述:

给定一个已知包含本地定义的代数数据类型字段的[String]列表,我想反序列化[String]以构造目标数据类型。我可以编写一个解析器来执行此操作,但我正在寻找一种通用解决方案,它将反序列化为程序中定义的任意数量的数据类型,而无需为每种类型编写解析器。通过知道代数类型的值构造函数的数量和类型,就像在每个字符串上执行读取以生成构建类型所需的适当值一样简单。但是,我不想使用泛型,反射,SYB或元编程(除非它不可能)。

假设我有大约50种与此类似的定义(所有简单的代数类型都由基本原语组成(没有嵌套或递归类型,只是基元的不同组合和排序):

data NetworkMsg = NetworkMsg { field1 :: Int, field2 :: Int, field3 :: Double}

data NetworkMsg2 = NetworkMsg2 { field1 :: Double, field2 :: Int, field3 :: Double }

我可以使用我在每个[String]之前解析的标记ID来确定与我通过网络收到的[String]相关联的数据类型。

可能的推测解决方案路径:

由于数据构造函数是Haskell中的第一类值,并且实际上有一个类型 - 可以将NetworkMsg构造函数视为一个函数,例如:

NetworkMsg :: Int -> Int -> Double -> NetworkMsg

我可以使用uncurryN将此函数转换为元组的函数,然后将[String]复制到函数现在采用的相同形状的元组中吗?

NetworkMsg' :: (Int, Int, Double) -> NetworkMsg

我认为这不会起作用,因为我需要知道值构造函数和类型信息,这需要Data.Typeable,反射或其他一些元编程技术。

基本上,我正在寻找多种类型的自动反序列化,而无需编写类型实例声明或在运行时分析类型的形状。如果不可行,我会采用另一种方式。

1 个答案:

答案 0 :(得分:1)

你是正确的,因为构造函数本质上只是函数,所以你可以通过编写函数的实例来为任意数量的类型编写泛型实例。您仍然需要编写单独的实例 但是,对于所有不同数量的论点。

{-# LANGUAGE FlexibleInstances #-}
{-# LANGUAGE MultiParamTypeClasses #-}

import Text.Read
import Control.Applicative

class FieldParser p r where
    parseFields :: p -> [String] -> Maybe r

instance Read a => FieldParser (a -> r) r where
    parseFields con [a] = con <$> readMaybe a
    parseFields _ _ = Nothing

instance (Read a, Read b) => FieldParser (a -> b -> r) r where
    parseFields con [a, b] = con <$> readMaybe a <*> readMaybe b
    parseFields _ _ = Nothing

instance (Read a, Read b, Read c) => FieldParser (a -> b -> c -> r) r where
    parseFields con [a, b, c] = con <$> readMaybe a <*> readMaybe b <*> readMaybe c
    parseFields _ _ = Nothing

{- etc. for as many arguments as you need -}

现在你可以使用这个类型类来解析基于构造函数的任何消息,只要类型检查器能够从上下文中找出结果消息类型(即它不能简单地从给定的构造函数推导出它)对于这些多参数类型的类实例)。

data Test1 = Test1 {fieldA :: Int} deriving Show
data Test2 = Test2 {fieldB ::Int, fieldC :: Float} deriving Show

test :: String -> [String] -> IO ()
test tag fields = case tag of
    "Test1" -> case parseFields Test1 fields of
        Just (a :: Test1) -> putStrLn $ "Succesfully parsed " ++ show a
        Nothing -> putStrLn "Parse error"
    "Test2" -> case parseFields Test2 fields of
        Just (a :: Test2) -> putStrLn $ "Succesfully parsed " ++ show a
        Nothing -> putStrLn "Parse error"

我想知道你在应用程序中如何使用消息类型,因为将每个消息作为其单独的类型使得很难拥有任何类型的通用消息处理程序。

您是否有一些理由不仅仅拥有单一的消息数据类型?如

data NetworkMsg
    = NetworkMsg1 {fieldA :: Int}
    | NetworkMsg2 {fieldB :: Int, fieldC :: Float}

现在,虽然实例的构建方式几乎相同,但您可以获得更好的类型推断,因为结果类型始终是已知的。

instance Read a => MessageParser (a -> NetworkMsg) where
    parseMsg con [a] = con <$> readMaybe a

instance (Read a, Read b) => MessageParser (a -> b -> NetworkMsg) where
    parseMsg con [a, b] = con <$> readMaybe a <*> readMaybe b

instance (Read a, Read b, Read c) => MessageParser (a -> b -> c -> NetworkMsg) where
    parseMsg con [a, b, c] = con <$> readMaybe a <*> readMaybe b <*> readMaybe c

parseMessage :: String -> [String] -> Maybe NetworkMsg
parseMessage tag fields = case tag of
    "NetworkMsg1" -> parseMsg NetworkMsg1 fields
    "NetworkMsg2" -> parseMsg NetworkMsg2 fields
    _ -> Nothing

我也不确定你为什么要特意进行类型泛型编程而不实际使用任何用于泛型的工具。 GHC.Generics,SYB或Template Haskell通常是解决此类问题的最佳解决方案。