首页>>新闻资讯>>云计算

大数据离线计算(网站流量分析)

2024-08-20 00:09:39 3

现如今,互联网在人们生活中扮演了越来越重要的角色,各种购物网站,如淘宝、京东为人们线上购物提供了很大的方便。随着大数据的发展,各种推荐系统也应用而生,其目的也是为了了解用户的使用 偏好,使得一个系统更加智能化。

如何分析用户偏好?数据从何而来?各大互联网公司相继开发出了一些网站日志流的分析项目。其大致原理是:将用户的访问网站时的所访问网站的访问信息、浏览、点击行为的数据(点击的链接、使用的搜索项、在每个网页的停留时间长短、总体的浏览时间)保存在网站的日志当中。通过对日志进行采集,过滤,产生有用的数据,再对过滤所得的有用的信息进行一系列的处理。得到不同用户的不同的偏好。

那么,很多小伙伴们可能好奇日志是如何进行采集的,现在,笔者就日志的产生进行简单的介绍:

1)网站的日志是网站的web服务器所记录的访问日志:

2)这些访问日志是在web网站设计初期。在页面嵌入自定义的js代码,来获取用户的访问行为的。(这些行为包括:鼠标悬停的位置,点击的页面组件等)然后同过ajax请求到后台记录日志,这种方式所能采集的日志是最全面的。

日志的详细内容都有哪些呢?

在实际操作中,有以下几个方面的内容会被记录到日志中去:

1)访客的系统属性特性,比如使用的操作呢系统,浏览器,域名和访问速度等。

2)访问特征。包括停留时间、点击的url等。

3)来源特征。包括网络内容信息分类、和来访url等

4 )产品特征:包括访问的产品编号、产品类别、产品颜色、产品价格、产品利润、产品数量和价值等级等。

以电商京东为例,其点击日志的格式如下:

GET /log.gif?t=item.010001&m=UA-J2011-1&pin=-&uid=1679790178&sid=1679790178|12&v=je=1$sc=24-bit$sr=1600x900$ul=zh-cn$cs=GBK$dt=【云南白药套装】云南白药 牙膏 180g×3 (留兰香型)【行情 报价 价格 评测】-京东$hn=http://item.jd.com$fl=16.0 r0$os=win$br=chrome$bv=39.0.2171.95$wb=1437269412$xb=1449548587$yb=1456186252$zb=12$cb=4$usc=direct$ucp=-$umd=none$uct=-$ct=1456186505411$lt=0$tad=-$sku=1326523$cid1=1316$cid2=1384$cid3=1405$brand=20583$pinid=-&ref=&rm=1456186505411 HTTP/1.1

其实说到这里,是有必要介绍一下点击流的概念的

点击流这个概念是更加注重用户浏览整个网站的过程,网站日志中记录的用户点击就像是图上的点,而点击流更加像是点形成的线,我们可以吧点比作是网站的page,而线是访问网站的session。所以点击流是由网站中的日志收集整理得到的。它可以比网站数据含有更加多的信息,从而使得点击流数据得到的统计更加丰富和可靠。

网站点击流

点击流模型的生成:

点击流日志在具体的操作上是由散点状的点击日志梳理而来,从而点击数据在数据建模时应该存在两张表:pageviews和visits。如下所示:

session是可以设置过期时间的

这就是点击流模型。当web日志转换为点击流日志的时候,很多网站的分析度量就变的简单了。基于点击流数据,我们可以统计出很多常见的网站分析度量。

分析这些数据有啥意义呢?

网站流量统计分析可以帮助网站管理员,运营人员,推广人员,等实时获取网站流量信息,并且从网站流量来源、网站内容、网站访客等多方面提供网站分析的数据,从而可以提高网站流量,提升网站的用户体验,让访客更多的沉淀下来变成会员或者客户,通过更少的投入获得最大化 的投入。

具体来说网站点击流分析的意义可以分为两大方面:

1.技术上:

可以合理的修改网站结构以及适度分配资源,构建后台分析群组,比如:

辅助改进网站的拓补设计,提高性能

在有高度相关性的节点之间安排快速有效的访问路径。

帮助企业更好的设计网站主页和安排网站内容

2、业务上

1) 帮助企业改善市场营销决策,如把广告放在适当的Web页面上。

2) 优化页面及业务流程设计,提高流量转化率。

3) 帮助企业更好地根据客户的兴趣来安排内容。

4) 帮助企业对客户群进行细分,针对不同客户制定个性化的促销策略等。

相关标签:

发表评论:

评论记录:

未查询到任何数据!