ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

项目实训1

2021-07-04 13:00:46  阅读:138  来源: 互联网

标签:项目 画像 用户 采集 实训 模块 标签 数据


项目实训1

项目理解

项目名称

智能任务画像综合分析系统

项目基本信息

系统通过用户自行上传或埋点上报收集记录用户大量信息,将这些信息进行沉淀、加工和抽象,形成一个以用户标志为主key的标签树,用于全面刻画用户的属性和行为信息,构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。通过国内外指定网站数据获取,结合算法模型,综合分析用户行为画像,构建立体化的人物分析系统。

之后构建知识图谱,利用数据挖掘、关联分析等技术,提取评估人员的行为模式、精神状态、情绪状态等变化规律,建立用户行为画像模型,用户画像实际上是围绕画像服务的目标群体的关键特征的集合,根据现实反馈不断迭代。

项目需解决问题

一、信息采集:通过技术方法实现国内、国外指定网站进行数据获取。

二、构建人物画像,将收集到的用户基本属性、行为特征等收集到的数据通过行为建模,抽象出用户标签,实现数据采集、存储、在线浏览、多视图、多维度等基本功能。

三、构建知识图谱。通过知识抽取技术,可以从半结构化、非结构化的数据中提取出实体、关系、属性等知识要素,将其知识融合,可消除实体、关系、属性等指称项与事实对象之间的歧义,形成高质量的知识库,使用知识推理,在已有的知识库基础上进一步挖掘隐含的知识,从而丰富、扩展知识库。

系统功能

智能人物画像综合分析系统分为三大部分:智能数据融合模块、用户画像模块、数据可视化模块。智能数据融合模块主要是对自定义数据采集的网站进行数据抓取、数据存储、数据处理;用户画像模块是对采集的用户信息进行沉淀、加工和抽象,标注特征标识;数据可视化模块主要是从多个维度、多角度进行数据综合展示。

1、智能数据融合模块
该模块主要是通过系统设定的三个国内热门站点,如网易、新浪微博、雅虎,国外三个热门站点,如facebook、Twitter、YouTube,作为数据采集源,提取正文、关键词等信息,为后续的数据展示分析做好基础。采集的数据入库后,界面中可以导出成word格式文档,文档中的文本内容可以实现中文、英文智能化翻译。

2、用户画像模块
该模块主要根据采集到的数据信息,通过模型算法进行特征提取,将用户标签化,可以借助聚类和分类等技术进行用户画像的构建。根据特定人物的信息数据得到个人画像,并为其智能化打标签,得到用户数据的整体统一综合视图。

3、数据可视化模块
该模块主要是将影像数据有效的组织展示,进行用户的数据分布分析、用户行为分析、知识图谱构建及数据可视化等。

标签:项目,画像,用户,采集,实训,模块,标签,数据
来源: https://blog.csdn.net/weixin_43960843/article/details/118459797

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有