网络分析|GIS网络分析

网络分析(GIS网络分析)原创数据派THU2018-08-07 22:00:00
网络分析|GIS网络分析


作者:Srivatsa
翻译:和中华
校对:丁楠雅
本文约6300字 , 建议阅读20+分钟 。
本文从图的概念以及历史讲起 , 并介绍了一些必备的术语 , 随后引入了networkx库 , 并以一个航班信息数据集为例 , 带领读者完成了一些基本分析 。
简介
俗话说一图胜千言 。但是“图”(Graph)说的远不止于此 。以图形式呈现的数据可视化能帮助我们获得见解 , 并基于它们做出更好的数据驱动型决策 。
但要真正理解图是什么以及为什么使用它们 , 我们需要理解一个称为图论(Graph Theory)的概念 。理解它可以使我们成为更好的程序员 。
网络分析|GIS网络分析


如果你曾经尝试理解这个概念 , 应该会遇到大量的公式和干涩的理论 。这便是为什么我们要写这篇博文的原因 。我们先解释概念 , 然后提供实例 , 以便你可以跟随并弄明白它的执行方式 。这是一篇详细的文章 , 因为我们认为提供概念的正确解释要比简洁的定义更受欢迎 。
在本文中 , 我们将了解图是什么 , 它们的应用以及一些历史背景 。我们还将介绍一些图论概念 , 然后使用进行案例研究以巩固理解 。
准备好了吗?我们开始吧 。
目录
图及其应用
图论的历史、为何使用图论
必备术语
图论概念
熟悉Python中的图
数据分析案例
图及其应用
让我们看一个简单的图(Graph)来理解这个概念 。如下图所示:
网络分析|GIS网络分析


假设此图代表某个城市的热门景点位置 , 以及游客所遵循的路径 。我们把V视为景点位置 , 将E视为从一个地方到另一个地方的路径 。

V = {v1, v2, v3, v4, v5}
E = {(v1,v2), (v2,v5), (v5, v5), (v4,v5), (v4,v4)}
边(u , v)与边(v , u)相同 - 它们是无序对 。
具体而言 , 图(Graph)是用于研究对象和实体之间成对关系的数学结构 。它是离散数学的一个分支 , 在计算机科学 , 化学 , 语言学 , 运筹学 , 社会学等领域有多种应用 。
数据科学和分析领域也使用图来模拟各种结构和问题 。作为一名数据科学家 , 你应该能以有效的方式解决问题 , 如果数据是以特定方式排列的 , 则图可以提供一种解决问题的机制 。
形式上看 , 
图是一对集合 。G = (V, E) , V是顶点集合 , E是边集合 。E由V中的元素对组成(无序对)
有向图(DiGraph)也是一对集合 。D = (V, A) , V是顶点集合 , A是弧集合 。A由V中的元素对组成(有序对)
在有向图的情况下 , (u , v)和(v , u)之间存在区别 。通常在这种情况下 , 边被称为弧 , 以指示方向的概念 。
R和Python中都有使用图论概念分析数据的包 。在本文中 , 我们将简要介绍一些概念并使用Networkx Python包分析一个数据集 。
from IPython.display import Image
Image('images/network.PNG')
网络分析|GIS网络分析


Image('images/usecase.PNG')
网络分析|GIS网络分析


从上面的例子可以清楚地看出 , 图在数据分析中的应用是广泛的 。我们来看几个用例场景:
营销分析
图可用于找出社交网络中最有影响力的人 。广告商和营销人员可以通过社交网络中最有影响力的人员传达他们的信息 , 从而估算最大的营销价格 。
银行交易
图可用于查找有助于减少欺诈交易的异常模式 。有一些例子可以通过分析银行网络的资金流动来侦测恐怖主义活动 。
供应链
图有助于确定送货卡车的最佳路线以及识别仓库和交付中心的位置 。
制药公司
制药公司可以使用图论优化销售人员的路线 。这有助于降低成本并缩短销售人员的行程时间 。
电信行业
电信公司通常使用图(Voronoi图)来了解基站的数量和位置 , 以确保最大的覆盖范围 。
图的历史以及为何使用图