如果你有几年数据分析经验,或是掌握一定的统计算法/机器学习技能,为了个人能力更好的提升,建议你最好掌握“网络挖掘”。
但不少人对“网络挖掘”所知甚少,到底什么是网络挖掘呢?
网络型数据挖掘(简称网络挖掘)是一项主流的、重要的数据挖掘技术,常见的如社交网络、购物网络、金融网络等网络类型在生活中无处不在,做好网络挖掘可在用户画像、推荐系统、搜索引擎金融风险评估、知识图谱、城市交通优化方面产生极大作用。
不同于一般意义的数据挖掘通过算法模型(比如常用的回归、分类、聚类模型)进行描述/预测,网络挖掘则给出了新的解决方式:通过将数据 / 问题 抽象为网络模型,来帮助我们更好地进行数据分析 / 数据挖掘。
网络挖掘在基本的描述性统计方面又更进了一步,从某种程度上可以发现很多我们做一般的描述性分析所得不到的深刻洞见。
很多业务用一般的数据挖掘方法效果不佳的,加入网络模型之后,却能大幅提升。可以说网络挖掘的应用舞台无限宽广......
举例:
网页排序
比如 谷歌的 PageRank,本身也是在构建庞大的网页网络模型的基础上(网页为节点,超链为边),通过计算不同网页的中心度(权重),来对网页进行排序,从而实现更加精准的搜索和推荐。
推荐系统
传统的协同过滤算法的基本思想是,将与目标用户选择相似性度较高的用户喜欢的商品,推荐给目标用户。而网络模型的加入(比如好友网络、商品网络),很大程度上 解决多样性问题、冷启动问题、社会推荐问题,从而提升某些场景下的推荐精度。
社交网络分析
社交网络天然适合构建网络模型进行分析,比如 信息的传播预测、影响力分析、社交组群、好友推荐、用户画像等,单独拿出来看个体,和其他的个体拿出来看,发现一些不一样的东西。从某种程度说,社交网络分析是建立在网络模型分析的基础之上。
网络挖掘其实是强化了数据分析/挖掘的技能,以一种全新的视角,探索更为全面、宏观的网络知识,以及个体之间的关系。网络挖掘可以说非常硬核了,如果你熟悉掌握网络模型的构建,可以获得:
想知道学数据分析的伙伴多不多,考虑给大家出一期针对数据分析的视频教程!可以评论留言,回复: Python,可领取数据分析全套视频教程!多的话,考虑下期给大家出了!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。