我有一个列出体育比分的网站。它目前的工作原理如下:
名字姓氏1-0名字姓氏
它基于空格爆炸,然后基于 - 爆炸第三个(包含分数)。
这个问题是它不支持超过2个单词的名称。如果我爆炸使用 - 首先,它不会支持名字 - 在那里。结果被添加到textarea中,因为我需要添加数千个,所以我不想让多个字段输入数据,因为我现在可以快速添加匹配,每行列出一个结果。有没有人建议如何使系统既多字,又特殊字符不敏感?有没有办法在遇到号码时拆分,然后选择第一个块作为名字,最后一个作为玩家得分,其余作为姓氏?
答案 0 :(得分:0)
我不知道是否有任何方法可以教一个简单的解析命令,甚至是正则表达式来做你想做的事情。有些案例总是含糊不清。例如,如果你有名字'Mary Ann Steiner"和#34; Constantin Van Dyke"模式完全相同,但需要拆分(2/1),另一个需要拆分(1/2)。
您可能会找到一个知道如何根据已知名称的庞大字典进行有根据的猜测的图书馆,但是没有...
我认为在这种情况下,您需要人脑输入数据来做出一些决定,并在数据输入过程中指出它们。根据我的经验,如果使用Tab键导航而不是鼠标移动,那么使用多个字段的速度并不慢。您也可以使用自己的分隔符输入数据,例如:
Mary Ann,Steiner,2-3
Constantin,Van Dyke,4-2
然后你会根据","运行爆炸那些线的东西。并将元素输入数据库。
如果您从外部网站复制/粘贴或抓取数据,则另一种选择是使用您当前使用的方法展开每一行。这应该适用于大多数记录,当它不起作用时,很明显 - 结果记录将包含太多元素。您可以让脚本标记这些记录以供人为干预。