一般的自动问答系统都是有一个问答库,然后用某种匹配的算法将用户的问题匹配到问答库里面的某个问题上,并推送答案。看到有一些论文提到有一些自动生成文本的自动问答系统,但是考虑到法律咨询中需要提供给用户“正确”的答案,不能像聊天那样闲扯淡,所以问答库还是更好的选择。
那么,顺其自然,问题就分成了两部分,一个是构建问答库,一个是搭建匹配算法。
问答库的构建纯粹是一个体力活了,需要法律专业人士搜集整理各领域的各种常见法律问题,但是需要注意的是另外还需要一个搜集用户习惯的途径,因为用户的提问方式和法律人所整理的问答方式极有可能是完全不同的,搜集有两种途径,一种是到各种法律咨询网站上爬取,一种是自己推一个初步的法律咨询系统,通过线上推广获取一定量的用户使用数据。
网上爬取的数据有一个问题,那就是用户在目前常见的法律咨询网站上提问是描述式的,一段话描述事情经过然后问该怎么办,根据我们的试投放数据看,用户在面对问答系统的时候表达方式是不一样的。
搭建匹配算法是自动法律咨询的核心的工作,可以说效果好坏就在这里了。而匹配算法总结成一句话就是如何判断两个句子是同一个意思,或者意思是相似的。
标签:
深圳法律咨询