选择和实现用于社会网络分析的参考模型的指南;多层网络中的零模型和社区检测;多层网络通过自适应层聚合举行谱聚类;使用超市零售记载预测季节性流感;马太福音、马可福音、路加福音、约翰福音和使徒行传中的圣经名字之间的关系;现代软件生态系统的细粒度网络分析;环中的混沌半快速公交;一种革新的谱聚类混淆成员社区检测方法;基于社交探索注意力的内容分发平台推荐;设置直接克制阴影记载;近似网络对称;对具有大量可再生能源的电力系统动力学和控制举行建模;先睹为快:PowerDynamics.jl-=一个开放源代码库,用于分析具有大量可再生能源的电网的动态稳定性;有效繁殖数 R_t 的倍增关系及其对意大利COVID-19数据的应用的简化预计;一致性:节点属性网络的路径感知同质性怀抱;提取本征麋集加权网络的带符号主干;选择和实现用于社会网络分析的参考模型的指南原文标题: A guide to choosing and implementing reference models for social network analysis地址: http://arxiv.org/abs/2012.04720作者: Elizabeth A. Hobson, Matthew J. Silk, Nina H. Fefferman, Daniel B. Larremore, Puck Rombach, Saray Shai, Noa Pinter-Wollman摘要: 分析社会网络具有挑战性。关系数据的关键特征要求使用非尺度的统计方法,例如开发特定于系统的null模型或参考模型,这些模型将视察数据的一个或多个组成部门随机化。在这里,我们回首了种种随机法式,这些法式生成了用于社会网络分析的参考模型。
参考模型为分析网络数据时举行假设磨练提供了期望。我们概述了生成有效参考模型的关键阶段,并详细先容了生成参考漫衍的四种方法:排列,重采样,从漫衍采样和生成模型。我们重点先容每种方法何时合适,并指出研究人员应制止的潜在陷阱。在整个历程中,我们以模拟的社会系统中的示例来说明我们的看法。
我们的目的是让社会网络研究人员对分析方法有更深入的明白,从而在为特定研究问题定制参考模型时增强他们的信心。多层网络中的零模型和社区检测原文标题: Null Models and Community Detection in Multi-Layer Networks地址: http://arxiv.org/abs/1608.00623作者: Subhadeep Paul, Yuguo Chen摘要: 多层网络是一组实体(节点)上的网络,它们之间具有多种类型的关系(边),其中每种类型的关系/交互都表现为网络层。与单层网络一样,社区检测是多层网络中的重要任务。
网络中大量盛行的社区检测方法都是基于优化称为模块化评分的质量函数,该评分是对网络中模块或社区存在的一种怀抱。因此,社区检测的第一步是界说适合于所讨论网络的适当模块化评分。在这里,我们凭据来自差别应用领域的网络中的履历视察效果,先容了在网络的差别空模型下的几种多层网络模块化怀抱。特别是,我们将多层设置模型,多层期望度模型及其种种修改形式界说为用于多层网络的空模型,以得出差别的模块性。
提议的模块分为两类。第一类基于水平校正的多层随机块模型,将多层期望水平模型作为其空模型。第二类基于Newman-Girvan模块化的多层扩展,将多层设置模型作为其空模型。然后优化这些措施以检测节点的最佳社区分配。
我们比力了模拟网络中社区检测中措施的有效性,然后将其应用于四个真实网络。多层网络通过自适应层聚合举行谱聚类原文标题: Spectral clustering via adaptive layer aggregation for multi-layer networks地址: http://arxiv.org/abs/2012.04646作者: Sihan Huang, Haolei Weng, Yang Feng摘要: 网络分析中的基本问题之一是检测多层网络中的社区结构,其中的每一层代表节点之间的一种边信息。
我们提出了基于有效凸层聚合的综合谱聚类方法。我们的聚合方法受到加权毗邻矩阵的谱嵌入和下游 k -means聚类的精致渐近分析的强烈推动,而这是一个充满挑战的方案,无法实现社区检测的一致性。实际上,已显示出这些方法可预计最佳凸聚合,这可以在某些特殊的多层网络模型下最大水平地淘汰误聚类误差。
我们的分析进一步讲明,使用高斯混淆模型举行聚类通常优于谱聚类中常用的 k -means。大量的数值研究讲明,与几种常用方法相比,我们的自适应聚合技术以及高斯混淆模型聚类使新的谱聚类具有显著的竞争力。
使用超市零售记载预测季节性流感原文标题: Predicting seasonal influenza using supermarket retail records地址: http://arxiv.org/abs/2012.04651作者: Ioanna Miliou, Xinyue Xiong, Salvatore Rinzivillo, Qian Zhang, Giulio Rossetti, Fosca Giannotti, Dino Pedreschi, Alessandro Vespignani摘要: 盛行病学数据的可用性增加,新颖的数字数据流以及功效强大的机械学习方法的兴起,引起了对实时盛行病预报系统的大量研究运动。在本文中,我们建议使用一种新颖的数据源,即零售市场数据来改善季节性流感的预测。
详细而言,我们通过识别前哨篮子(即由特定客户群一起购置的产物),将超市零售数据视为流感的主体信号。我们建设了一个邻近预报和预测框架,可以在未来4周内提供意大利流感发病率的预计值。我们使用支持向量回归(SVR)模型来预测季节性流感的发病率。
我们的预测优于基线自回归模型和基于产物购置的第二基线。效果定量显示了将零售市场数据纳入预测模型的价值,可作为可用于盛行病实时分析的主体。
马太福音、马可福音、路加福音、约翰福音和使徒行传中的圣经名字之间的关系原文标题: Biblical names’ relationships in the Gospel of Matthew, Mark, Luke, John and Acts of Apostles地址: http://arxiv.org/abs/2012.04753作者: Roberto Rondinelli, Stefano Marmani, Valerio Ficcadenti摘要: 在本文中,我们通过使用基于文本挖掘网络的方法来推断有关圣经的字符,位置及其相互关系的信息。我们研究了5本书的WEB版本的叙述结构:马修福音,马可福音,路加福音,约翰福音和使徒行传。
主要关注点是主角的名称相互关系接纳一种分析方式,纵然用种种基于网络的方法和形貌符。处置惩罚该语料库以建立网络:我们从Wikipedia的圣经名称列表中下载人和所在的名称,然后在每节经文中查找它们的共现词,而且在此历程竣事时,我们获得N并发词名称。两个名称之间链接的强度界说为它们在所有经文中一起泛起的时间之和,这样,我们就获得了N个N对名字对的5个毗邻矩阵(每本书一个)。
在此预处置惩罚阶段之后,对于五天职析的书中的每本书,我们都市盘算主要的网络集中度怀抱(经典度,加权度,中间度和精密度),网络懦弱性,并运行社区检测算法以强调弥赛亚在内部的作用整个网络及其团队(社区)。我们发现,提出的方法适合于突出显示名称共现的结构。找到的框架的结构对于从结构的角度解释角色的情节很有用。
现代软件生态系统的细粒度网络分析原文标题: Fine-Grained Network Analysis for Modern Software Ecosystems地址: http://arxiv.org/abs/2012.04760作者: Paolo Boldi, Georgios Gousios摘要: 现代软件开发越来越依赖于第三方供应商或开源供应商提供的组件,库和框架,这些组件,库和框架可通过多种平台(或伪造)获得。这种编写软件的方式强调重用和组合,使现代应用法式所需的服务商品化。
另一方面,生活在一个这样的生态系统中的单个库中的错误和毛病可能直接或通过可通报性影响大量其他库和应用法式。当前,仅使用有关库依赖项的产物级信息来包罗这种危险,可是这种知识通常讲明自身太不准确,以致于无法制定有效的(而且可能是自动化的)处置惩罚计谋。我们将讨论细粒度的功效级依赖关系如何极大地提高可靠性并淘汰毛病对整个软件生态系统的影响。
环中的混沌半快速公交原文标题: Chaotic semi-express buses in a loop地址: http://arxiv.org/abs/2012.04865作者: Vee-Liem Saw, Luca Vismara, Lock Yue Chew摘要: 都会交通涉及许多相互作用的部门:公共汽车,汽车,通勤者,行人,火车等,使之成为一个很是庞大的研究系统。甚至在循环服务中卖力将通勤者从始发地运送到目的地的公共汽车系统,也已经体现出很是庞大的动态。
在这里,我们研究了这种简化的总线回路系统的动态特性,该系统由两个为三个公共汽车站服务的公共汽车组成。详细来说,我们思量将一辆公交车设置为普通公交车的设置,该公交车从公交车站 A 和 B 接载搭客,然后将他们送至公交车站 C ,而第二辆公交车则作为快速公交,仅从巴士站 B 接载搭客,然后将他们送至巴士站 C。
这两辆公交车就像是差池称主体,耦合到公交车站 B 一样,它们通过从该公共公交车站接载搭客举行互动。有趣的是,与两个普通总线的设置或两个快速总线的设置相比,此 emph semi-express总线设置效率更高,而且平均总线等候时间更短。我们认为效率是由半快车系统中体现出的混沌动力学发生的,与两个正常公交车的通例集束行为或两个非正常公交车的独立周期性行为相反,其反聚集趋势大于聚集趋势。
-互动高速巴士。一种革新的谱聚类混淆成员社区检测方法原文标题: An improved spectral clustering method for mixed membership community detection地址: http://arxiv.org/abs/2012.04867作者: Huan Qing, Jingli Wang摘要: 近年来,对社区检测的研究很是深入,可是更现实的混淆成员社区检测案例仍然是一个挑战。在这里,我们开发了一种有效的谱算法,将基于K个以上特征向量的K个特征向量用于聚类,从而在度校正后的混淆成员资格(DCMM)模型下预计社区成员身份。
我们证明晰该算法是渐近一致的。在模拟网络和许多履历网络上的数值实验讲明,与许多混淆成员社区检测的基准方法相比,混淆ISC的性能良好。特别是,混淆ISC在弱信号网络上提供令人满足的性能。
基于社交探索注意力的内容分发平台推荐原文标题: Social Explorative Attention based Recommendation for Content Distribution Platforms地址: http://arxiv.org/abs/2012.04945作者: Wenyi Xiao, Huan Zhao, Haojie Pan, Yangqiu Song, Vincent W. Zheng, Qiang Yang摘要: 在现代社交媒体平台上,有效的内容推荐应该使创作者和消费者真正受益,从而使他们获得真正有趣的内容。为明白决现有社会推荐方法的局限性,我们提出了社会探索关注网络(SEAN),这是一种社会推荐框架,它使用个性化内容推荐模型来勉励小我私家兴趣驱动的推荐。SEAN有两个版本:(1)SEAN-END2END允许用户的注意力向量将他们的个性化兴趣点加入文档中。
(2)SEAN-KEYWORD从用户的历史阅读中提取关键字,以描画他们的恒久兴趣。它比第一个版本快得多,更适合实际使用,而SEAN-END2END则更有效。两种版本均允许个性化因素在社会网络上与用户的高阶朋侪互动,以提高推荐效果的准确性和多样性。从盛行的疏散式内容分发平台Steemit用两种语言(英语和西班牙语)构建两个数据集,我们将SEAN模型与最新的协作过滤(CF)和基于内容的推荐方法举行了比力。
实验效果证明晰SEAN在建议均等性的基尼系数和建议准确性的F1分数方面均有效。设置直接克制阴影记载原文标题: Setting the Record Straighter on Shadow Banning地址: http://arxiv.org/abs/2012.05101作者: Erwan Le Merrer, Benoit Morgan, Gilles Trédan摘要: 阴影克制功效是在线社会网络的一项功效,它限制了某些用户的可见度,而他们并未意识到这一点。
Twitter宣布它不使用这种做法,有时会争论是否泛起“错误”来证明对某些用户的限制。本文是第一个通过接纳统计和图拓扑方法来解决主要在线平台上阴影克制的合理性的问题。
我们首先举行了广泛的数据收集和分析运动,收集了用户设置文件中可见性限制的发生(我们抓取了凌驾250万个)。在这样的黑匣子视察设置中,我们突出显示了可以解释克制行为的显著用户设置文件功效(使用机械学习预测器)。
然后,我们对这种现象提出两个假设:i)限制是bug,正如Twitter所声称的那样; ii)阴影克制流传是用户互动自我图上的盛行病。我们讲明,就我们收集的数据而言,假设i)在统计上不太可能。然后,我们显示了与假设ii)的一些有趣的相关性,这讲明交互拓扑是该服务上影子克制用户组的良好指示。
近似网络对称原文标题: Approximate Network Symmetry地址: http://arxiv.org/abs/2012.05129作者: Yanchen Liu摘要: 我们界说了一种新的网络对称性怀抱,它可以描画网络的近似全局对称性。我们将此措施应用于从几个经典网络模型以及几个实际网络中采样的差别网络。我们发现在我们检查过的网络模型中,Erd “ os-R ‘enyi网络具有最小的对称性,而随机几何图可能具有较高的对称性。我们发现我们的网络对称性怀抱可以描画网络结构的特性,并资助我们深入明白实际网络的结构;此外,我们的网络对称性怀抱能够描画不完美的网络对称性,如果仅思量完美对称性,则无法检测到。
对具有大量可再生能源的电力系统动力学和控制举行建模原文标题: Modeling the dynamics and control of power systems with high share of renewable energies地址: http://arxiv.org/abs/2012.05164作者: Sabine Auer, Tim Kittel摘要: 可再生和混淆动力系统的挑战是可再生能源(RES)的动态稳定集成。本文专门研究了间歇性RES和电力电子资源的丈量延迟对频率稳定性的影响。此外,它还提供了一个开放源代码框架来举行动态RES建模。首先,对于有损配电网中的局部间歇性颠簸,我发现动态和拓扑属性之间存在显著且微妙但强大的相互作用,而无损网则基本上不存在这种相互作用。
其次,我展示了延迟如何引发共振灾难,以及关键延迟的存在如作甚丈量时间设置了上限。此外,我研究了针对差别电网拓扑的集中式发电与疏散式发电是否会改变这种行为。第三,用于发生上述效果的代码正在作为一种名为PowerDynamics.jl的开源软件框架公布,该框架以编程语言Julia举行开发。
它将涵盖由RES与微分代数(DAE),延迟微分(DDE)和随机微分代数方程(SDAE)的集成引起的富厚的新颖动力学。总之,本文研究了未来电网的稳定性,这些电网正在朝着整合可再生能源动力学的更多方面生长,并为RES整合研究提供了一个适当的建模框架。先睹为快:PowerDynamics.jl-=一个开放源代码库,用于分析具有大量可再生能源的电网的动态稳定性原文标题: Sneak Preview: PowerDynamics.jl -= An Open-Source library for analyzing dynamic stability in power grids with high shares of renewable energy地址: http://arxiv.org/abs/2012.05175作者: Tim Kittel, Sabine Auer, Christina Horn摘要: PowerDynamics.jl是一个动态库模型的开放源代码库,它使用最新的科学编程语言Julia构建。它提供了分析具有高份额可再生能源的电网动态稳定性所需的所有工具。
与传统工具相比,它充实使用了Julia与高度优化的即时编译代码相联合的简朴性和通用性。此外,其生态系统还提供了DifferentialEquations.jl,这是一个高性能库,用于使用内置求解器和与Sundials等工业级求解器的接口来求解微分方程。PowerDynamics.jl为差别的节点/总线类型提供了多种动态特性,例如旋转质量,逆变器中的下垂控制,而且能够显式建模逆变器的时间延迟。此外,它包罗可再生能源颠簸的现实模型。
在本文中,我们演示了如何将PowerDynamics.jl用于IEEE 14总线配电网格馈线。有效繁殖数 R_t 的倍增关系及其对意大利COVID-19数据的应用的简化预计原文标题: A simplified estimate of the Effective Reproduction Number $R_t$ using its relation with the doubling time and application to Italian COVID-19 data地址: http://arxiv.org/abs/2012.05194作者: Gianluca Bonifazi, Luca Lista, Dario Menasce, Mauro Mezzetto, Daniele Pedrini, Roberto Spighi, Antonio Zoccoli摘要: 提出了一种盘算 R_t (有效繁殖数)的简化方法。该方法将Rt的值与使用局部指数拟合执行的倍增时间的预计相关。
条件 R_t = 1 对应于即是0或等效的无限倍增时间的增长率。思量了关于生成时间的概率漫衍的差别假设。如果生成时间遵循伽马漫衍,则提供了一种简朴的分析解决方案。一致性:节点属性网络的路径感知同质性怀抱原文标题: Conformity: A Path-Aware Homophily Measure for Node-Attributed Networks地址: http://arxiv.org/abs/2012.05195作者: Giulio Rossetti, Salvatore Citraro, Letizia Milli摘要: 在社会网络分析中,揭破表征庞大网络布线模式的同质/异相行为是一项重要任务,通常是研究节点属性的分类混淆。
最近的事情强调,对节点同质性举行量化的全局怀抱一定提供了现实的部门,通常是欺骗性的图景。今后类文献出发,在这项事情中,我们提出了一种新的措施,即Conformity,旨在通过提供以节点为中心的种种混淆模式来克服这种限制。与迄今为止提出的措施差别,“一致性”被设计为具有路径意识,因此可以更详细地评估差别分开水平的节点对目的同质嵌入的影响。对合成数据和真实数据举行的实验分析使我们可以视察到,一致性可以展现节点属性图中的名贵看法。
提取本征麋集加权网络的带符号主干原文标题: Extracting the signed backbone of intrinsically dense weighted networks地址: http://arxiv.org/abs/2012.05216作者: Furkan Gursoy, Bertan Badur摘要: 网络为分析自然,社会和技术领域的种种庞大系统提供了有用的工具。越来越多的数据和种种数据(例如,更多的节点和链接以及相关的权重,偏向和标志)可以提供附件信息。另一方面,链路和权重富厚会导致网络更麋集,并带有嘈杂的,无关紧要的数据或其他冗余数据。
此外,典型的网络分析和可视化技术以稀疏为前提,不适用于麋集和加权网络。作为一种调停措施,网络主干提取方法旨在仅保留重要链接,同时保留原始网络的有用和说明性结构,以举行进一步分析。在这里,我们提供了从本质上麋集的未签名加权网络中提取符号网络主干的第一种方法。使用基于统计技术的零模型,所提出的有效渡过滤器和活力过滤器允许推断边符号。
对迁移,投票,时间相互作用和物种相似性网络的履历分析讲明,所提出的过滤器在保留网络的多尺度性质的同时,提取了有意义且稀疏的签名主干。生成的主干网通常具有与符号网络相关的特征,例如互惠性,结构平衡和社区结构。声明:Arxiv文章摘要版权归论文原作者所有,机械翻译后由本人举行校正整理,未经同意请勿随意转载。
本系列在民众号“网络科学研究速递”(netsci)和小我私家博客举行同步更新。
本文来源:华体会体育-www.chengjimuye.com