ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

面向文本数据的金融数据挖掘--209

2022-01-09 21:00:13  阅读:169  来源: 互联网

标签:用例 -- 图谱 数据库 知识 信息 209 数据挖掘 金融


1、项目概述

在金融领域中,由于投资的高风险性,金融行业需要更为准确和可靠的实时数据。知识图谱作为数据驱动的人工智能,能够存储金融资讯、行情等海量数据中包含的实体、关系和属性。金融知识图谱可以实现金融资讯推荐,风险控制评估,依据生成资讯的多维智能标签,精准掌握复杂信息中的隐藏风险。通过获取开源信息,基于知识图谱中大量金融资讯的关联信息,识别命名实体并提取其之间的业务往来关系,结合相关财经新闻,预测金融行业的走势。未来,基于知识图谱的金融数据平台,在信息隐含关联挖掘方面有着不可替代的能力,促进金融升级转型。

2、项目需求

本项目中选取的目标领域为手机和化妆品市场,作为商品中受众广泛,使用者众多的商品,手机和化妆品市场受外部信息影响较大,因此与其市场相关的数据获取较为容易。对于手机而言,在这个智能化的时代,手机成为每个人生活中的“必需品”,具有庞大的市场消费。手机品牌较多,市场竞争激烈,消费者的选择较广,而且易受外部信息的影响,对于厂商而言,可以通过外部信息进行针对性的营销,提高品牌的口碑、销量与价值。对于化妆品而言,其受众大多为女性用户,在进行商品的选择时,对于品牌的依赖性较高。同时,我们还要注意到,近几年,小红书等平台逐渐走红,频繁推出所谓“爆款”商品,可见对于化妆品来说,评测对于顾客的选择有着很大的影响。而一些商家也看准商机,通过水军制造许多虚假评测信息,面对众多信息,消费者在选择时要学会区分。
本次共分为四个模块进行:数据爬取,关键信息提取,实体链接,构建知识图谱。
模块

3、用例

1、抽象用例:预测市场走势
2、高层用例:
系统:开始状态:使用爬虫获取数据。 结束状态:生成知识图谱
用户:开始状态:使用app了解信息。 结束状态:根据知识图谱做出决策。
3、扩展用例:大部分时间是系统内部自动更新知识图谱。

ActorSystem
1、信息存入数据库2、读取数据库并提取关键字
3、输入生成知识图谱命令4、将关键字链接起来并更新知识图谱
5、返回知识图谱
6、根据构建的知识图谱预测接下来的走势

4、用例图

系统先爬取网络上相关历史信息,这些信息经过关键信息提取,实体链接后生成知识图谱,同时系统还不断爬取实时信息以更新知识图谱。用户浏览当下的金融咨询,结合已生成的知识图谱,对未来的市场趋势进行预测。
在这里插入图片描述

5、数据库内容

由于我们需要不断将新的信息存储下来,因此我们需要一个数据库
其主要形式为:
商品数据库:

名称类型含义
commodity_idstring商品id
commodity_sumint商品销量
commodity_id_summentstring某一商品相关的评论
timestring时间

小红书的数据库

名称类型含义
art_idstring文章名称
starint收藏量
art_comstring文章的评论
art_brandstring文章所介绍品牌

6、软件架构

我们采用简单的MVC架构即可。
其中模型用来存储数据库和知识图谱
视图提供用户与系统的交互(如添加信息)
控制器直接由用户使用
请添加图片描述
作者:209

标签:用例,--,图谱,数据库,知识,信息,209,数据挖掘,金融
来源: https://blog.csdn.net/weixin_44565727/article/details/122166270

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有