如何将分隔的单词分隔成一个数组,其中键是分隔符的左边部分,并且右边的部分值

时间:2015-05-07 12:55:15

标签: php database encoding

我有一个这样的字符串,其中每个单词都使用下划线标记为编码(FWPRP等):

Hi_FW !_.
My_PRP$ name_NN 's_POS Jim_NNP ._.
I_PRP 'm_VBP from_IN New_NNP Zealand_NNP ._.
This_DT is_VBZ my_PRP$ friend_NN ._.
His_PRP$ name_NN 's_POS Adam_NNP ._.
He_PRP 's_VBZ from_IN Australia_NNP ._.
This_DT is_VBZ my_PRP$ friend_NN too_RB ._.
Her_PRP$ name_NN 's_POS Paola_NNP ._.
She_PRP 's_VBZ from_IN Italy_NNP ._.

我需要将其分解为一个数组,其中一个键是一个单词,其值是相应的标记:

[
    "Hi" => "FW",
    "My" => "PRP$",
    "name" => "NN"
    ...
]

我假设我可以通过分隔符_以某种方式将此字符串拆分,但似乎找不到将其加入我需要的数组的好方法。

如何实现?

3 个答案:

答案 0 :(得分:1)

$arr = explode("\n", $string);
$newarr = array();
foreach($arr as $item)
{
    $explodeditem = explode(' ', $item);
    foreach($explodeditem as $string)
        array_push ($newarr, $string);
}
$result = array();
foreach($newarr as $item)
{
    $newArr = explode('_', $item);
    $result[$newArr[0]] = $newArr[1];
}

答案 1 :(得分:1)

假设我们正在读取文件(data.txt),然后使用fopen()读取文件的内容,如果您的需求是字符串,则可以省略。

以下是部分天真的实施解决方案旨在为您提供一个良好的开端。给出非常简单的分隔符的注释和使用多个preg_split()(两次):

<?php

$results = array();
$delimiter = '_';

$file_handle = fopen("data.txt", "r");
while (!feof($file_handle)) {

   // ie. My_PRP$ name_NN 's_POS Jim_NNP ._.
   $line = fgets($file_handle);

   // validations ommited 

   // split by delimiter '_'
   // [0] = My
   // [1] = PRP$
   $line_array = preg_split("/$delimiter/", $line);

   // ie. for cases Hi_FW !_.
   // from results above, split by space
   // [0] = FW
   // [1] = !
   $value = preg_split("/\s/", $line_array[1]);

   // sighh, adding delimiter back to key-value array
   $result[$line_array[0]] = $delimiter.$value[0];
}
fclose($file_handle);

print_r($result);

?>

<强> data.txt中

Hi_FW !_.
My_PRP$ name_NN 's_POS Jim_NNP ._.
I_PRP 'm_VBP from_IN New_NNP Zealand_NNP ._.
This_DT is_VBZ my_PRP$ friend_NN ._.
His_PRP$ name_NN 's_POS Adam_NNP ._.
He_PRP 's_VBZ from_IN Australia_NNP ._.
This_DT is_VBZ my_PRP$ friend_NN too_RB ._.
Her_PRP$ name_NN 's_POS Paola_NNP ._.
She_PRP 's_VBZ from_IN Italy_NNP ._.

希望这有帮助。

答案 2 :(得分:0)

我会在空格上而不是在_

上进行爆炸
<?php
$inputArray = explode(" ", $input);

$sentences = array();

foreach ($inputArray as $word){
    $wordArray = explode("_", $word);
    $sentences[$wordArray[0]] = $wordArray[1];
}