优化可变数组状态重操作代码

时间:2016-02-14 14:02:55

标签: arrays algorithm haskell mutable

我一直在努力及时完成对{hackrank'的this锻炼。 但由于超时,我的以下Haskell解决方案因测试案例13到15而失败。 enter image description here

我的Haskell解决方案

import           Data.Vector(Vector(..),fromList,(!),(//),toList)
import           Data.Vector.Mutable
import qualified Data.Vector as V 
import           Data.ByteString.Lazy.Char8 (ByteString(..))
import qualified Data.ByteString.Lazy.Char8 as L
import Data.ByteString.Lazy.Builder
import Data.Maybe
import Control.Applicative
import Data.Monoid
import Prelude hiding (length)

readInt' = fst . fromJust . L.readInt 
toB []     = mempty
toB (x:xs) = string8 (show x) <> string8 " " <> toB xs

main = do 
  [firstLine, secondLine] <- L.lines <$> L.getContents
  let [n,k] = map readInt' $ L.words firstLine
  let xs = largestPermutation n k $ fromList $ map readInt' $ Prelude.take n $ L.words secondLine
  L.putStrLn $ toLazyByteString $ toB $ toList xs


largestPermutation n k v
  | i >= l || k == 0 = v 
  | n == x           = largestPermutation (n-1) k v
  | otherwise        = largestPermutation (n-1) (k-1) (replaceOne n x (i+1) (V.modify (\v' -> write v' i n) v))
        where l = V.length v 
              i = l - n
              x = v!i

replaceOne n x i v
  | n == h = V.modify (\v' -> write v' i x ) v
  | otherwise = replaceOne n x (i+1) v
    where h = v!i 

我发现的最佳解决方案不断更新2个阵列。一个数组是主要目标,另一个数组用于快速索引查找。

更好的Java解决方案

public static void main(String[] args) {
  Scanner input = new Scanner(System.in);
  int n = input.nextInt();
  int k = input.nextInt();
  int[] a = new int[n];
  int[] index = new int[n + 1];
  for (int i = 0; i < n; i++) {
      a[i] = input.nextInt();
      index[a[i]] = i;
  }
  for (int i = 0; i < n && k > 0; i++) {
      if (a[i] == n - i) {
          continue;
      }
      a[index[n - i]] = a[i];
      index[a[i]] = index[n - i];
      a[i] = n - i;
      index[n - i] = i;
      k--; 
  }
  for (int i = 0; i < n; i++) {
      System.out.print(a[i] + " ");
  }
}

我的问题是

  1. 这个算法在Haskell中的优雅和快速实现是什么?
  2. 有没有比Java解决方案更快的方法来解决这个问题?
  3. 我应该如何在Haskell中优雅而有效地处理繁重的数组更新?

2 个答案:

答案 0 :(得分:7)

您可以对可变数组进行的一项优化是根本不使用它们。特别是,您链接的问题有一个右折叠解决方案

这个想法是你折叠列表并贪婪地交换右边最大值的项目并保持已经在Data.Map中进行的掉期:

import qualified Data.Map as M
import Data.Map (empty, insert)

solve :: Int -> Int -> [Int] -> [Int]
solve n k xs = foldr go (\_ _ _ -> []) xs n empty k
    where
    go x run i m k
        -- out of budget to do a swap or no swap necessary
        | k == 0 || y == i = y : run (pred i) m k
        -- make a swap and record the swap made in the map
        | otherwise        = i : run (pred i) (insert i y m) (k - 1)
        where
        -- find the value current position is swapped with
        y = find x
        find k = case M.lookup k m of
            Just a  -> find a
            Nothing -> k

在上面,run是一个函数,它给出了反向索引 i,当前映射m和剩余交换预算k,从头开始解决剩下的问题。通过反向索引我的意思是反向列表的索引:n, n - 1, ..., 1

折叠函数go通过更新传递给下一个的runim的值,在每个步骤构建k函数步。最后,我们使用初始参数i = nm = empty和初始互换预算k来调用此函数。

find中的递归搜索可以通过维护反向映射来优化,但这已经比你发布的java代码快得多。

编辑:以上解决方案仍然支付树访问的对数成本。以下是使用可变STUArray和monadic fold foldM_的替代解决方案,实际上比上述速度更快:

import Control.Monad.ST (ST)
import Control.Monad (foldM_)
import Data.Array.Unboxed (UArray, elems, listArray, array)
import Data.Array.ST (STUArray, readArray, writeArray, runSTUArray, thaw)

-- first 3 args are the scope, which will be curried
swap :: STUArray s Int Int -> STUArray s Int Int -> Int
     -> Int -> Int -> ST s Int
swap   _   _ _ 0 _ = return 0  -- out of budget to make a swap
swap arr rev n k i = do
    xi <- readArray arr i
    if xi + i == n + 1
    then return k -- no swap necessary
    else do -- make a swap, and reduce budget
        j <- readArray rev (n + 1 - i)
        writeArray rev xi j
        writeArray arr j  xi
        writeArray arr i (n + 1 - i)
        return $ pred k

solve :: Int -> Int -> [Int] -> [Int]
solve n k xs = elems $ runSTUArray $ do
    arr <- thaw (listArray (1, n) xs :: UArray Int Int)
    rev <- thaw (array (1, n) (zip xs [1..]) :: UArray Int Int)
    foldM_ (swap arr rev n) k [1..n]
    return arr

答案 1 :(得分:1)

不完全是对#2的回答,但是有一个左折叠解决方案,一次只需要在内存中加载~K值。

因为问题涉及排列,我们知道1到N将出现在输出中。如果K> 0,至少前K个项将是N,N-1,... N-K,因为我们至少可以提供K个交换。此外,我们希望一些(K / N)数字处于最佳位置。

这表明了一种算法:

初始化地图/词典并将输入xs扫描为zip xs [n, n-1..]。对于每个(x, i),如果x \= i,我们'递减'K并更新字典s.t. dct[i] = x。当K == 0(交换掉)或输出用完(可以输出{N,N-1,... 1})时,此过程终止。

接下来,如果我们还有x <- xs,我们会查看每个x,如果x不在我们的字典中,则打印dct[x],否则为K

只有当我们的字典包含一个循环时,上述算法才能产生最佳排列。在这种情况下,我们使用|cycle|掉期移动了绝对值&gt; = K的元素。但这意味着我们将一个元素移动到其原始位置!因此,我们总是可以在每个周期保存交换(即增量cycles)。

最后,这给出了内存有效的算法。

步骤0:得到N,K

步骤1:读取输入置换并输出{N,N-1,... NKE},N < - N - K - E,K < - 0,如上所述更新dict,

其中E =元素X的数量等于N - (X的索引)

第2步:从dict中删除并计算周期;让cycles > 0 =周期数;如果K <- |cycles|,请from collections import deque n, t = map(int, raw_input().split()) xs = deque(map(int, raw_input().split())) dct = {} cycles = True while cycles: while t > 0 and xs: x = xs.popleft() if x != n: dct[n] = x t -= 1 print n, n -= 1 cycles = False for k, v in dct.items(): visited = set() cycle = False while v in dct: if v in visited: cycle = True break visited.add(v) v, buf = dct[v], v dct[buf] = v if cycle: cycles = True for i in visited: del dct[i] t += 1 else: dct[k] = v while xs: x = xs.popleft() print dct.get(x, x), ,转到第1步,

否则转到第3步。我们可以通过优化字典来提高此步骤的效率。

步骤3:按原样输出其余输入。

以下Python代码实现了这个想法,如果使用更好的循环检测,可以非常快速地实现。当然,数据最好以块的形式读取,与下面不同。

UserService