我目前正在研究Cortana,因为我有兴趣为它开发一些自定义技能。目前我正在使用Cortana来调用Windows语音识别,然后我可以使用WSR作为将文本口述到Word中的方法。我正在尝试将此作为一种可能性,用于记录和生成会议的实时成绩单。
现在我发现这很麻烦,我很想知道我是否可以做一些事情来将Cortana中的机器人集成到同一目的。我已经查阅了一些有关Azure Bot框架,认知服务,LUIS等的阅读材料。
是否有可能使用上述服务开发此类解决方案?
提前谢谢!
答案 0 :(得分:0)
是的,这是可能的。
您可以将流提供给Speech to Text API,然后根据每个短语的返回Offset
和Duration
对音频进行分块,然后将这些块发送到Speaker Recognition API通过名称识别发言人,这样你就可以为每个块添加一个名称,并将其转录为短语并创建一个对话框
由于您主要考虑将其用于会议,因此您提到的解决方案不久前已作为Microsoft Teams的一项功能宣布,它将在近期功能中公开发布,您还可以观看演示这是2018年Build here
提出的