ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

ai智能写作:智媒ai伪原创写作自然语言的应用

2020-12-01 12:03:04  阅读:348  来源: 互联网

标签:字符识别 递归 ai 模型 神经网络 写作 使用 文本 智媒


  有好一段时间没来我的园子里看看了,今天闲来无事更新点随笔吧!打开了我的智媒ai伪原创工具发呆了好久,写点什么呢?那就借用智媒ai伪原创工具的创作模式功能写篇文章吧!——自然语言的应用

  由于人工神经网络可以为非线性过程建模,它们已经成为解决诸如分类、聚类、回归、模式识别、尺寸缩减、结构预测、机器翻译、异常检测和决策可视化等问题的有用工具,用于计算机视觉和许多其他问题。这种广泛的功能允许在许多领域使用人工神经网络。本文讨论了人工神经网络在自然语言处理任务中的应用。NLP 涉及多个任务,例如语法、语义、对话和说话。我们将描述一些神经网络已经做得很好的领域。

  1,信息提取

  信息提取的主要任务是从非结构化文档中自动获取结构化信息。该任务包括许多子任务,例如命名实体识别,一致性分析,关系提取,术语提取等。

  2,命名实体识别(NER)

  命名实体识别(NER)的主要任务是将诸如Guido van Rossum,Microsoft,London等命名实体分类为预定类别,例如人员,组织,位置,时间和日期。已经创建了许多NER系统,并且最好的系统使用神经网络。

  在“用于命名实体识别的神经体系结构”一文中,提出了两个用于NER的模型。这些模型使用监督语料库来学习字符表示,或者从未标记的语料库中学习非监督语汇[4]。使用不同的数据集(例如,英语,荷兰语,德语和西班牙语的CoNLL-2002和CoNLL-2003)进行了大量测试。该团队最终得出结论,在没有任何特定于语言的知识或资源(例如地理名称词典)的情况下,他们的模型在NER中取得了最佳结果。

  3,词性标注

  词性(POS)具有许多应用程序,包括文本解析,文本到语音转换,信息提取等。在“使用双向长短期记忆递归神经网络进行词性标记”的工作中,提出了使用RNN进行词性标注的系统[5]。的该模型使用“来自Penn Treebank III的《华尔街日报》数据”数据集进行了测试,并达到了97.40%的标记准确率。

  4,文字分类

  文本分类是许多应用程序的重要组成部分,例如Web搜索,信息过滤,语言识别,可读性评估和情感分析。神经网络主要用于这些任务。

  赖思玮,徐立恒,刘康和赵军在“递归卷积神经网络用于文本分类”一文中提出了一种递归卷积神经网络用于文本分类。该模型没有人为设计的功能。该团队在四个数据集上测试了模型的效果。这四个数据集包括:20Newsgroup(计算机,政治,娱乐和宗教四个类别),以及复旦大学集(中文文档分类集合,包括20个类别,例如Art,Education和Energy),ACL Anthology(支持五种语言:英语,日语,德语,中文和法语)和情感树库数据集(包含带有非常负面,负面,中立,正面和非常正面标签集的数据)。经过测试后,将模型与现有的文本分类方法进行比较,例如单词袋,Bigrams + LR,SVM,LDA,树核,递归NN和CNN。最后,发现在所有四个数据集中,神经网络方法均优于传统方法,其提出的模型优于CNN和递归神经网络。

  5.语义分析和问答

  问题回答系统可以自动回答以自然语言描述的不同类型的问题,包括定义问题,传记问题,多语言问题等。神经网络可以用于开发高性能的问题回答系统。

  在文章“通过分阶段查询图生成语义知识库的问题进行语义分析”中,叶文头,张明伟,何晓东和高建峰描述了基于知识库的问答语义分析系统的开发框架。作者说,他们的方法在早期使用知识库来缩小搜索空间,从而简化了语义匹配问题[6]。他们还应用了先进的实体链接系统和深度卷积神经网络模型来匹配问题和预测序列。该模型已在WebQuestions数据集上进行了测试,其性能优于以前的方法。

  6,解释测试

  复述检测确定两个句子是否具有相同的含义。此任务对于问答系统特别重要,因为可以用多种方式描述同一问题。

  “在在线用户论坛中检测语义对等问题”提出了一种使用卷积神经网络识别语义对等问题的方法。该实验使用Ask Ubuntu社区问答(Q&A)网站和Meta Stack Exchange数据进行网络培训。已经表明,所提出的CNN模型已经实现了高精度,尤其是在使用与领域相关的数据来预训练单词嵌入之后。作者将其模型的性能与传统方法(例如支持向量机和重复检测方法)进行了比较。他们表示,他们的CNN模型比传统基准要好得多[7]。

  “使用递归自动编码器进行短语检测”提出了一种新型的递归自动编码器体系结构,该体系结构使用递归自动编码器进行短语描述检测。它使用递归神经网络来学习短语表示。这些表示是n维语义空间中的向量,其中具有相似含义的短语彼此接近[8]。为了评估该系统,使用了Microsoft Research Paraphrase语料库和English Gigaword语料库。该模型优于三个基准。

  7,语言生成和多文档摘要

  自然语言生成有许多应用程序,例如自动书写报告,基于零售数据分析生成文本,汇总电子病历,根据天气数据生成文本天气预报,甚至产生笑话。

  在最近的论文“使用递归神经网络进行自然语言生成,用户评论的措辞和总结”中,研究人员描述了基于递归神经网络(RNN)模型生成新句子和文档摘要的能力。该文件以俄语描述并评估了一个包含820,000个消费者评论的数据库。网络的设计允许用户控制所生成句子的含义。通过选择句子级别的特征向量,您可以指示网络学习例如“用大约十个单词说出关于屏幕和声音质量的一件事” [9]。语言生成的能力可以生成高质量的摘要和多个用户评论。通常,摘要报告使用户可以快速获取大型文档集中的主要信息。

  8.机器翻译

  机器翻译软件在世界范围内使用,尽管有一些限制。在某些地区,翻译质量不佳。为了改善结果,研究人员尝试了不同的技术和模型,包括神经网络方法。 “医学文本域的基于神经的机器翻译”研究的目的是研究不同培训方法对使用医学数据的波兰英语机器翻译系统的影响。欧洲药品管理局的并行文本语料库用于训练神经网络和统计机器翻译系统。证明了神经网络需要较少的培训和维护资源。另外,神经网络通常用出现在相似上下文中的单词替换其他单词[10]。

  9,语音识别

  语音识别已用于许多领域,例如家庭自动化,移动电话,虚拟辅助,免提计算,视频游戏等。神经网络在该领域得到了广泛的使用。

  在“用于语音识别的卷积神经网络”中科学家以新颖的方式解释了如何将CNN应用于语音识别,从而使CNN的结构直接适应某些类型的语音变化,例如语音速度的变化[11]。用于TIMIT手机识别和大词汇量语音搜索任务。

  10,字符识别

  字符识别系统具有许多应用,例如收据字符识别,发票字符识别,支票字符识别,合法账单凭证字符识别等。文章“使用神经网络进行字符识别”提出了一种手写字符的方法,其准确度为85%[12 ]。

  11,拼写检查

  大多数文本编辑器允许用户检查其文本是否包含拼写错误。现在,神经网络也已合并到拼写检查工具中。

  在“使用神经网络进行个性化拼写检查”中,作者提出了一种用于检测拼写错误的单词的新系统。该系统通过打字员提供的特定校正数据进行模型训练[13]。它揭示了传统拼写检查方法的许多缺点。

 

标签:字符识别,递归,ai,模型,神经网络,写作,使用,文本,智媒
来源: https://www.cnblogs.com/xiatiandef/p/14067269.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有