解析意图搜索及其在安防领域的应用
一、意图搜索起源
意图搜索最早起源于互联网行业搜索引擎工具,随着互联网信息量的不断增加,能够快速、准确地查找信息越来越困难,主要原因是搜索引擎不能理解用户的真实查询意图,因而机器学习如遗传算法、BP神经网络法等在这方面的应用研究快速地被引起关注。LamWai就利用基于事例的机器学习和查询反馈技术实现了文本的自动分类并用于文本检索,实验证明了其优越性。MandalaRila采用加权方法从多类信息中实现查询扩展,以及Chakrabarti探讨的基于矩阵代数的主题提取算法、组合词汇和索引文本等特征提取都是这方面的努力。但目前最有前景的是DougLenat研制的搜索系统,通过建立常识库和推理机来与用户交谈,进而实现对用户真正意图的理解。知识工程之父Feigenbaum称赞他开创了查询的“语义时代”(TheAgeofSemantics)。但前提是要建立一个庞大的百科全书常识库,这是非常困难的,而且也不分析用户的潜在意图。构造庞大知识库的一种方法是从网络上自动构造,Craven和Lesser提出了信息获取的系统原理,知识库的结构和实现方法。Choi则实现了一种具体的自动构造系统,其可从网上发现文本并归入本地数据库供查询,它相当于智能代理。Alsaffa做了类似的探索,利用专家系统在用户喜欢的表达和系统要求的表达之间实现自动转换。意图搜索正在基于这些技术之上实现了智能化的自动搜索。虽然意图搜索起源于互联网行业,但是目前已经被广泛用于其它行业,例如在安防行业与物联网技术紧密结合。
二、意图搜索在互联网行业的发展
互联网行业最早由搜索引擎起步,目前数据也都是通过搜索引擎实现数据交换和传递过程。用户之所以会产生搜索行为,往往是在解决任务时遇到自己不熟悉的概念或者问题,由此产生了对特定信息的需求,之后用户会在头脑中逐步形成秒速需求的查询词,将查询提交给搜索引擎,然后对搜索结果进行浏览,如果发现搜索结果不能完全解决用户的信息需求,则会根据搜索结果的启发,改写查询,以便更精确地描述自己的信息需求,之后重新构造新的查询需求,提交搜索引擎,如此形成用户和搜素引擎交互的闭合回路,直到搜索结果已经解决了自己的需求或尝试几次无果而终。从上述过程可以看出,从用户产生信息需求到最终形成用户查询,中间有很大的不确定性,用户未必能够一开始就找到合适的查询词,即使是找到了,也可能存在查询词不能完全描述信息需求的情形,即在形成查询的过程中存在信息丢失的问题。所以后续循环中的查询改写就是用户逐步澄清搜索需求的一个过程。
用户发出的每个搜索请求背后都隐含着潜在的搜索意图,如果搜索引擎能够根据查询词汇自动找出背后的用户搜索意图,然后针对不同的意图,提供不同的检索方法,将更符合用户意图的搜索结果排在前列,无疑会增加搜索引擎用户的搜索体验。目前搜索引擎已经部分实现了这种搜索模式,比如用户搜索“北京天气”的时候会主动将当天的气温等情况列在搜索结果最前面。