基于网页浏览行为的人类动力学研究

VIP免费
3.0 牛悦 2024-11-19 4 4 1.11MB 43 页 15积分
侵权投诉
摘 要
人每天要参与很多不同类的活动,包括打电话,发电子邮件,处理销售订单,
上网,娱乐等。人类的这些行为是高度复杂的,所以如果想用一个过程或者一个
模型来描述人类的行为规律是不可能的。最近,Barabasi 等人[1]通过提取历史记录
定量研究人类行为,得到人类行为的统计规律,找到可能的突破口, 开创了“人
类动力学”这个新的研究领域。
本学位论文首先介绍了人类动力学研究中的基本概念和数学模型,然后以
高校访问互联网的真实记录为研究对象,统计群体用户访问所有网站和单个网站
的时间间隔分布,并选择典型网站和典型用户,从群体和个体两个层面上比较用
户访问兴趣驱动和任务驱动的不同网站的行为规律特征;将事件间隔引入到研究
中,对比时间间隔和事件间隔的分布规律。由此推断人类行为内在的一些普适特
征,并得到以下结论:
从群体和个体两个层面分析了用户访问群体网站和单个网站的时间间隔,发
现人们的网页浏览行为都是服从幂律分布的,并且幂指数和网站类型、访问频率
有着密切的关系;群体层面和个体层面均表现出访问感兴趣的网站的时间间隔分
布的幂指数要大于访问一般网站的时间间隔分布的幂指数,并且访问兴趣驱动的
网站的时间间隔的幂指数大于访问任务驱动的网站的时间间隔幂指数;大体上来
说,平均幂指数越大平均时间间隔就越短。
群体用户访问网页的时间间隔和事件间隔都服从幂律分布,所有单个用户的
活跃性也是服从幂律分布的,而且不论是群体用户行为还是单个用户行为,时间
间隔的幂指数大于事件间隔的幂指数;时间间隔的幂指数与活跃性服从幂律分布,
而事件间隔的幂指数与活跃性服从高斯分布;单个用户时间间隔和事件间隔的幂
指数都是服从高斯分布的。
本文的研究对于了解用户的检索偏好,设计精确的个性化推荐算法具有一定
的借鉴意义
关键词:人类动力学 网页浏览 时间间隔 事件间隔 幂指数
ABSTRACT
Humans participate on a daily basis in a big number of distinct activities, ranging
from making telephone calls to sending e-mails, initiating dealings, or browsing the
Internet and engaging in entertainment. These human behaviors are highly complex, so
it seems impossible to use a process or a model to describe the regularities of human
behaviors. Recently, Barabasi quantitatively analysed of human behaviors through
detailed records, got the statistical regularities of human behaviors, found a possible
breakthrough and created the new research direction “Human Dynamics”.
Firstly, the paper introduces the basic concepts and mathematical models in the
study of human dynamics. Secondly, through studying the database of access history to
the internet, the character of web-browsing has been deeply mined. The time intervals
distributions of web-browsing behavior of collective people to both all and single
website are obtained, and typical websites as well as typical users are selected as objects,
then the web-browsing behaviors based on interest and task have been compared from
both collective and individual aspects. Thirdly, event interval has been introduced to the
study and then the distributions of time intervals and event intervals have been
compared. At last, some universality features of human behaviors have been inferred.
Main results are as following:
All the time interval distributions of collective websites and single websites
follow
( ) ~p k k
with the exponents being different between access to different kinds of
websites in both collective and individual aspects. The exponents of time interval
distributions of web-browsing behaviors based on interest are greater than task in both
collective and individual aspects. Generally speaking, the greater average exponents, the
shorter average time interval.
The distributions of time interval and event interval for collective users follow a
power law and the distribution of activities for all individual users also follows a power
law. The power-law exponents of time interval distribution are greater than event
interval distribution in both collective and individual aspects. The relation between
power-law exponent of time interval distribution and activity follows a power law , and
that of event interval distribution and activity follows a Gaussian distribution. The time
interval distribution is a power law with exponent following a Gaussian distribution, so
as the event interval distribution.
The paper makes a prospect on the further study of the users’ search preference and
accurate recommendation algorithm.
Key Word: human dynamics web-browsing, time interval, event
interval, power-law exponent
目 录
摘 要
ABSTRACT
第一章 绪 论 ......................................................... 1
§1.1 研究背景及意义 ............................................... 1
§1.2 本文主要工作 ................................................. 2
第二章 人类动力学研究中现状及应用 .................................... 4
§2.1 人类动力学研究中涉及到的基本概念 ............................. 4
§2.1.1 泊松分布 ................................................. 4
§2.1.2 幂律分布 ................................................. 4
§2.2 人类行为动力学的发展与应用 ................................... 7
§2.2.1 优先权决策的排队模型 ..................................... 7
§2.2.2 受记忆影响的人类动力学模型 ............................... 8
§2.2.3 基于自适应兴趣的人类动力学模型 .......................... 10
§2.2.4 人类动力学新模型 ........................................ 12
§2.3 其它人类行为动力学实证结论 .................................. 14
§2.3.1 信件通信 ................................................ 14
§2.3.2 短消息通信 .............................................. 15
§2.3.3 电影点播 ................................................ 15
§2.3.4 金融活动 ................................................ 16
第三章 基于网页浏览的兴趣行为分析 ................................... 18
§3.1 数据来源与统计方法 .......................................... 18
§3.2 网页浏览的兴趣行为分析 ...................................... 19
§3.2.1 群体用户访问特定网站的时间间隔 .......................... 20
§3.2.2 个体用户访问特定网站的时间间隔 .......................... 23
§3.3 本章小结 .................................................... 24
第四章 基于网页浏览的人类行为标度律分析 ............................. 25
§4.1 数据说明 .................................................... 25
§4.2 网页浏览的行为分析 .......................................... 25
§4.2.1 群体用户访问网页的时间间隔分布和事件间隔分布 ............. 25
§4.2.2 用户的活跃性分布 ........................................ 26
§4.2.3 幂指数与活跃性的关系 .................................... 27
§4.3 单个用户幂指数分布 .......................................... 28
§4.4 本章小结 .................................................... 29
第五章 结论与展望 ................................................... 30
附录 ................................................................ 32
参考文献 ............................................................ 35
在读期间公开发表的论文和承担科研项目及取得成果 ...................... 39
致谢 ................................................................ 40
摘要:

摘要人每天要参与很多不同类的活动,包括打电话,发电子邮件,处理销售订单,上网,娱乐等。人类的这些行为是高度复杂的,所以如果想用一个过程或者一个模型来描述人类的行为规律是不可能的。最近,Barabasi等人[1]通过提取历史记录定量研究人类行为,得到人类行为的统计规律,找到可能的突破口,开创了“人类动力学”这个新的研究领域。本学位论文首先介绍了人类动力学研究中的基本概念和数学模型,然后以某高校访问互联网的真实记录为研究对象,统计群体用户访问所有网站和单个网站的时间间隔分布,并选择典型网站和典型用户,从群体和个体两个层面上比较用户访问兴趣驱动和任务驱动的不同网站的行为规律特征;将事件间隔引入到研究...

展开>> 收起<<
基于网页浏览行为的人类动力学研究.pdf

共43页,预览5页

还剩页未读, 继续阅读

作者:牛悦 分类:高等教育资料 价格:15积分 属性:43 页 大小:1.11MB 格式:PDF 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 43
客服
关注