小熊回收站|Embedding之LINE算法解读，Graph 需要论文的朋友可以后台私信我获取

前言上一篇文章给大家带来了GraphEmbedding技术中的代表算法Deepwalk ，今天给大家介绍graphembedding又一代表算法——LINE,LINE(large-scaleinformationNetwork ，大规模信息网络)致力于将大型的信息网络嵌入到低维的向量空间中，且该模型适用于任何类型(有向、无向亦或是有权重)的信息网络。并提出了一种解决经典随机梯度下降限制的边缘采样算法，提高了算法的有效性和效率,且在应用方面更广。总结下来LINE有以下几个特点或者优势：
（1）适用广，适合任意类型的网络，不论是有向图还是无向图还是带权图。
（2）信息全，目标函数（objectivefunction）同时考虑了网络局部特征和全局特征。
（3）效率高，提出一种边采样的算法，可以很好地解决SGD的效率问题。
（4）时间快，提出了十分高效网络表示方法，在小时范围内的单机节点上学习百万级顶点网络的表示。
下面一下来看看这篇文章吧。
重要定义了解LINE算法之前需要了解一下论文里面的几个重要概念。
信息网络
信息网络定义为G=(V,E)其中V是顶点集合，顶点表示数据对象， E是顶点之间的边缘的集合，每条边表示两个数据对象之间的关系。每条边e(E)表示为有序对e=(u,v) ，并且与权重Wuv>0相关联，权重表示关系的强度。如果G是无向的，我们有(u,v)!=(v,u)和Wuv=Wvu；如果G是有向的，我们有(u,v)!=(v,u)和Wuv!=Wvu,一般情况下我们认为权重非负。
一阶相似性
网络中的一阶相似性是两个顶点之间的局部点对的邻近度。对于有边(u,v)连接的每对顶点，该边的权重Wuv表示u和v之间的一阶相似性，如果在u和v之间没有观察到边，他们的一阶相似性为0 。
二阶相似性
二阶相似性指的是一对顶点之间的接近程度(u,v)在网络中是其邻域网络结构之间的相似性。数学上，让
大规模信息网络嵌入
给定大网络G=(V,E) ，大规模信息网络嵌入是将每个顶点v(V)表示为低维空间(d)中的向量，学习一个函数:
以上图为例：一阶相似性表示两个顶点直接相连，比如6和7两个顶点，它们就是相似的；二阶相似表示两个两个顶点有相同的连接顶点，比如5和6虽然不直接连接，但是同时和1,2,3,4相连，所以5和6是相似的，这和协同过滤是不是很像，说白了就是根据图结构来表达顶点间的相似度。
算法介绍一阶相似性
对每个无向边(i,j) ，定义顶点vi和vj的联合概率分布为：

小熊回收站|Embedding之LINE算法解读，Graph

推荐阅读

洋哥爱生活|遇到命中贵人，白首不分离，这3个星座即将迎来桃花期

生活里的创意|古力娜扎真智慧，毛衣叠穿在衬衫上面减龄又清新，气质好就这么穿

电热汇全国首条！世界最大！输煤管道带浆运行成功，意味着什么？

岩黄连■在路边，若是遇到1种“麦冬草”，请保护，比“岩黄连”珍贵！

星座小可爱|知足常乐不爱争，却最有贵气富得流油，这3个生肖

男子吵架后将女友推向公交车！随后回应更是让人气愤

酒中别有天－－读古今《人类与酒的那些事儿》

德媒：轮到美国荷兰“头疼”了，没想到光刻机技术根本离不开中国

#布丽吉特#马克龙真会照顾大25岁老婆！布丽吉特被人求合影，老公搂她走开

『盼盼喜欢』今年没空办婚礼，杨丞琳忙拍电影出辑

连续4个月同比、环比双增长吉利汽车11月份销量突破15万辆

康熙荣妃的子女?康熙之荣妃

「cnBeta」Bridge集线器将于4月30日失去联网增强功能，初代飞利浦Hue

『游戏日报』开局直接领先100万，你是王思聪吗？，COD“吃鸡”难逃外挂入侵

环球燃点@从“跪舔”到“开枪”！韩国180度大转变！74岁特朗普恐晚年不保

梦到自己驱赶猫梦见猫赶也赶不走

S10世界赛|S10世界赛开放现场观赛，三重关卡，严防黄牛！史上最严的一次入场审核

国际丨美国再现名校招生舞弊案！64名学生“走后门”进加州大学

如何养起魔爪十二卷魔爪蛙怎么驯服

贵茶的红茶和绿茶,贵茶绿宝石绿茶特级