ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

简单的聊天机器人(软件机器人) 拥有QA机器人,闲聊机器人,任务机器人,场景机器人等等一些。

2021-12-18 20:03:23  阅读:413  来源: 互联网

标签:-- 模型 机器人 生成 QA 聊天 闲聊


一、智能聊天机器人

1.智能聊天机器人

        用自然语言模拟人类的一种对话形式。人机对话的程序。

主要分为三个方面:

        --问题咨询:基于业务知识库进行业务问题回答。

        --数据检索:通过程序找到相对应的数据。

        --业务处理:对应相关业务系统转到指令。(例如:订个机票,订个酒店等等一些任务)

典型业务场景:

        业务咨询问答机器人,智能客服机器人,行政助理机器人,产品推荐机器人......

2.聊天机器人的本质:会话式UI

        会话式:就是相互对话闲聊,对话。根据你说的信息完成相应的任务。

        会话式UI的优势:1.可以任何聊天,没有任何成本

                                     2.信息密度得到控制,精度提升

                                     3.保留聊天内容,按时间顺序排序

3.基于检索VS基于生成模型

        

简单总结:

        基于检索和生成模型,目前来说基于检索更适合现在的选择。

        基于检索的特点:聊天的时候是先知道回复的内容,回复更准确。

        基于生成的特点:聊天的时候会生成新的回复内容,不重复性,方便。

        基于检索的优点:问题与答案都是经过人工总结的,保证了数据中的答案的正确性,易于理解。

        生成模型的优点:不需要预先存储好的数据,更加灵活多变。

        基于检索的缺点:用户每提出的问题都要从库里找答案,问题有限,需要不断更新数据

         生成模型的缺点:生成的答案存在语法或语义不相关,生成模型需要海量的数据,难以优化结果无法控制。

商业现状:适合特定领域内、问题集合有限。检索模型和生成模型两者结合,适合用于各个领域。

二、机器人的核心技术

1.聊天机器人最核心的部分是对话引擎,对话引擎包括以下几点:

        自动语音识别(ASR)、自然语言理解(NLU)、对话管理(DM)、自然语言生成(NLG)

和文本到语音的合成(TTS)

首先自动语音识别(ASR):就是用自己的话理解,听到用户输入的语音,转化为机器能听懂的语音。

自然语言理解(NLU):根据用户说的一句话可以理解你的需求。(将非结构化数据,半结构化数据转为结构化数据,主要做实体识别、关系抽取、知道意图)

对话管理(DM):对整个会话有一个生命周期,会实施查询你的状态,保留历史记录。(还有插槽信息,插槽下文会提到)

自然语言生成:根据用户说的话会自动生成一些话。(这里主要分为封闭式和开放式,简单介绍封闭式:用户提的问题 知道就回答,不知道的就不回答,开放式:可以不断学习进行生成)

文本到语音合成(TTS):最后会以语音的形式返回用户,用户说的是声音,听到的也是声音。

2.本质是自然语言处理技术

        简单流程: --自然语言--模型--数据处理(向量)

        --模型:对数据处理(结巴等一些处理工具)

        --向量:把数据处理成机器可以看懂的数据(例如:Id2char,char2id)

        --基于NLP,利用文本的相似度,提取关键信息,进行文本分类。

机器人的原理:

        

QA机器人:

        

假如用户输入问题为Q。(QA数据库中的QA对为(Q1,A1),(Q2,A2),......(QN,AN))

       QQ相似度计算:计算Q与每个QA对中问题的相似程度。

       QA匹配度计算:计算Q与每个QA对中答案的匹配程度。

综合相似度与匹配度,找到最合适的一组QA对(QI,AI)。

本质:基于检索的问答模型。

核心问题:文本语义相似度问题。

适合模型:bert(对文本向量化,对问题向量化,然后点乘找出最相似的) word2vec(向量化,主要基于词的向量化)

向量化的几种形式:

        Word2vec(词向量)

        doc2vec(句子向量化)

        Bert(句子向量化)

        Simbert(相似度匹配 相似度生成)

        Gensim(文本相似度分析,首先分词,然后建立字典进行相似度匹配)

闲聊机器人:

         

闲聊机器人可以根据生成式模型来做,没有限制。

闲聊机器人的原理

        

首先定义一个非常大的数据库,根据用户输入的内容进行文本匹配。

生成模型可以随便生成任意的文本,进行聊天。

闲聊机器人原理: 

        

根据用户说的一些话,会去激活任务机器人。

任务机器人原理:

        

        ​​​​​​​

任务机器人主要内容:

        1.意图识别:根据输入的一段话 提取到这句话意图。(要去做什么?)

        2.槽值提取:提取意图 提取实体。

        3.触发任务:根据插槽的提取 来做相应的任务 返回给终端答案。

        3.话题追踪:多轮对话上下文自动补全。

这里说一下插槽slot:

根据提取的特征返回输出的内容。

多轮会话(就是根据插槽slot实现的):经过多次对话,根据意图提取,实体提取。(举例简单说明:假如我要查询一下郑州今天的天气,这里面意图(Location)是查天气  实体(Time)是郑州 今天)。

 场景机器人原理:

        ​​​​​​​

业务流程:

        1.根据客户的信息,来驱动场景。

        2.这些场景都是事先设置好的

举例说:(就像我们10086客服一样,打电话的时候,一般都会说:普通话请按1,查话费请按2等等一些)这就是场景。

KG机器人的原理(这里是关于知识图谱,我的博客里面有知识图谱,不细说):

        

        ​​​​​​​

三、智能客服机器人

        ​​​​​​​

        

主要用于服务客服一线同事的,帮助人员减轻压力,提升效率。

财富智能助手机器人:

        

这里包括:投前、投中、投后、销售政策、产品介绍、销售技巧等等一些(简单了解)

保险智能机器人:

        ​​​​​​​

 AIOps运维机器人:

        ​​​​​​​

什么是运维:运维就是后台的一些东西,做完东西部署外网,档期,出现问题可以报警等等。 

标签:--,模型,机器人,生成,QA,聊天,闲聊
来源: https://blog.csdn.net/Cchaofan/article/details/122015786

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有