我有一个歌曲数据库,可以查看内容,看看它们是否适合广播播放。
是否可以使用网络抓取工具创建一个程序,以扫描歌词网站上的特定艺术家页面(例如,歌词点播)以获取特定关键字?
我可以搜索The Clash,该程序会给我一个Lyrics on Demand网站上所有Clash页面的列表,其中包含特定的“淫秽”字样。由于歌词网站倾向于以这样的方式组织,即URL包含实际的歌曲标题 (对于例如http://www.lyricsondemand.com/c/theclashlyrics/rockthecasbahlyrics.html),我将能够查看检索到的列表并确切知道哪些歌曲不适合播放。或者,更好的是,该程序只会搜索电台iTunes Music文件夹中包含的歌曲。
程序是否可以这样做?任何见解和/或建议将不胜感激。
答案 0 :(得分:0)
关于你的图书馆的一点似乎对我很重要: 曲目必须以干净的方式命名,例如" artist - title(remix)"。如果他们喜欢:ArtistXYTrackName,则必须先重命名。
我认为扫描库并列出它应该很容易。 然后我确定有一些提供界面的歌词页面。 然后,您只需搜索曲目列表中的每个曲目 - >扫描歌词页面的数据库 - >并再次扫描关键字。
我做了一些研究,发现了一个提供界面(API)的歌词数据库。我想,我可以为你写一个小工具来满足你的需求。