我目前有一个Java程序,它以字符串格式向我返回一个Football Team名称列表。这些是使用jSoup抓取的。
我现在想访问该团队的页面" futbol24.com"并从那里刮取某些数据。不幸的是,我的团队列表与futbol24格式化团队名称的格式不同。
我想进行搜索,例如" https://www.google.co.uk/#q=manchester+utd+futbol24"并返回搜索结果中的第一个网址:" http://www.futbol24.com/team/England/Manchester-United/"
我试过在jSoup中这样做,但没有成功的结果。有没有人知道如何实现这个目标?
谢谢,
罗布
编辑:
我目前的团队列表格式如下:
AS Saint Etienne
Lens
Schalke 04
Borussia M'gladbach
Deportivo La Coruna
Eibar
Central Coast Mariners
我希望能够将每个人拉出来并对" [TEAM] futbol24"进行搜索。例如,然后获取第一个搜索结果的URL。