我有一个这样的字符串,其中每个单词都使用下划线标记为编码(FW
,PRP
等):
Hi_FW !_.
My_PRP$ name_NN 's_POS Jim_NNP ._.
I_PRP 'm_VBP from_IN New_NNP Zealand_NNP ._.
This_DT is_VBZ my_PRP$ friend_NN ._.
His_PRP$ name_NN 's_POS Adam_NNP ._.
He_PRP 's_VBZ from_IN Australia_NNP ._.
This_DT is_VBZ my_PRP$ friend_NN too_RB ._.
Her_PRP$ name_NN 's_POS Paola_NNP ._.
She_PRP 's_VBZ from_IN Italy_NNP ._.
我需要将其分解为一个数组,其中一个键是一个单词,其值是相应的标记:
[
"Hi" => "FW",
"My" => "PRP$",
"name" => "NN"
...
]
我假设我可以通过分隔符_
以某种方式将此字符串拆分,但似乎找不到将其加入我需要的数组的好方法。
如何实现?
答案 0 :(得分:1)
$arr = explode("\n", $string);
$newarr = array();
foreach($arr as $item)
{
$explodeditem = explode(' ', $item);
foreach($explodeditem as $string)
array_push ($newarr, $string);
}
$result = array();
foreach($newarr as $item)
{
$newArr = explode('_', $item);
$result[$newArr[0]] = $newArr[1];
}
答案 1 :(得分:1)
假设我们正在读取文件(data.txt),然后使用fopen()读取文件的内容,如果您的需求是字符串,则可以省略。
以下是部分天真的实施解决方案旨在为您提供一个良好的开端。给出非常简单的分隔符的注释和使用多个preg_split()(两次):
<?php
$results = array();
$delimiter = '_';
$file_handle = fopen("data.txt", "r");
while (!feof($file_handle)) {
// ie. My_PRP$ name_NN 's_POS Jim_NNP ._.
$line = fgets($file_handle);
// validations ommited
// split by delimiter '_'
// [0] = My
// [1] = PRP$
$line_array = preg_split("/$delimiter/", $line);
// ie. for cases Hi_FW !_.
// from results above, split by space
// [0] = FW
// [1] = !
$value = preg_split("/\s/", $line_array[1]);
// sighh, adding delimiter back to key-value array
$result[$line_array[0]] = $delimiter.$value[0];
}
fclose($file_handle);
print_r($result);
?>
<强> data.txt中强>
Hi_FW !_.
My_PRP$ name_NN 's_POS Jim_NNP ._.
I_PRP 'm_VBP from_IN New_NNP Zealand_NNP ._.
This_DT is_VBZ my_PRP$ friend_NN ._.
His_PRP$ name_NN 's_POS Adam_NNP ._.
He_PRP 's_VBZ from_IN Australia_NNP ._.
This_DT is_VBZ my_PRP$ friend_NN too_RB ._.
Her_PRP$ name_NN 's_POS Paola_NNP ._.
She_PRP 's_VBZ from_IN Italy_NNP ._.
希望这有帮助。
答案 2 :(得分:0)
我会在空格上而不是在_
<?php
$inputArray = explode(" ", $input);
$sentences = array();
foreach ($inputArray as $word){
$wordArray = explode("_", $word);
$sentences[$wordArray[0]] = $wordArray[1];
}