<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>格物致知 &#187; R</title>
	<atom:link href="http://leeing.org/tag/r/feed/" rel="self" type="application/rss+xml" />
	<link>http://leeing.org</link>
	<description>keep Thinking</description>
	<lastBuildDate>Fri, 04 Nov 2011 16:20:46 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.4</generator>
		<item>
		<title>用户访问行为，齐普夫分布及其 Java 实现</title>
		<link>http://leeing.org/2010/05/18/user-behavior-zipf-distribution-and-java-implementation/#utm_source=feed&#038;utm_medium=feed&#038;utm_campaign=feed</link>
		<comments>http://leeing.org/2010/05/18/user-behavior-zipf-distribution-and-java-implementation/#comments</comments>
		<pubDate>Tue, 18 May 2010 08:47:02 +0000</pubDate>
		<dc:creator>leeing</dc:creator>
				<category><![CDATA[CDN]]></category>
		<category><![CDATA[Java]]></category>
		<category><![CDATA[R]]></category>
		<category><![CDATA[Zipf distribution]]></category>

		<guid isPermaLink="false">http://leeing.org/?p=541</guid>
		<description><![CDATA[Zipf定律是文献计量学的重要定律之一，它和罗特卡定律、布拉德福定律一起被并称为文献计量学的三大定律。 对于CDN的内容管理，也近似符合Zipf 定律，就是大家常说对于内容的访问遵循80/20原则，也就是20%的内容，会占有80%的访问量。 这里 r 表示一个单词的出现频率的排名，P(r)表示排名为r的单词的出现频率. (单词频率分布中 C约等于0.1, a约等于1) 后人将这个分布称为zipf distribution，中文名称为齐普夫分布或Zeta 分布。这是一个离散事件分布，广泛应用于语言学，保险学，网络模拟，以及对稀疏事件的建模中。 它表明在英语单词中,只有极少数的词被经常使用,而绝大多数词很少被使用。实际上,包括汉语在内的许多国家的语言都有这种特点。这个定律后来在很多领域得到了同样的验证，包括网站的访问者数量、城镇的大小和每个国家公司的数量。。这个定理也在很多分布里面得到了验证，比如人们的收入，互联网的网站数量和访问比例，互联网内容和访问比例(其他分布两个常数有所不同,a越大，分布越密集,对于VOD来说某些时候符合双zipf分布)。 比起枯燥的公式，图表更具有说服力，下面是用三百个严格符合zipf 分布的数据点描绘成的图，其中横轴表示排名，纵轴表示访问的频率，分别使用线性坐标和对数坐标表示： 可以看到对数坐标下是一条完美的直线。 在很多网页的用户访问行为中，都是近似于zipf 分布的，例如下表是www.sun.com 在1996 年7月的页面访问情况： zipf 定律也可以用于其它领域，例如下面的表格的横轴表示城市的人口排名的对数值，而纵轴则是人口数量的对数值。 编程实现：Mathematica，R，还有Java都有相应的API，在这里，主要讨论Java。 在模拟用户的访问请求时，可以近似地使用zipf 定律， Apache Foundation 的commons-math 项目提供了一个Java实现： 在org.apache.commons.math.distribution 包中的类： ZipfDistributionImpl(int numberOfElements, double exponent) Create a new Zipf distribution with the given number of elements and exponent. 它提供的方法主要有： double cumulativeProbability(int x) 概率密度函数：P(X &#60;= x) 的值。 [...]


Related posts:<ol><li><a href='http://leeing.org/2010/01/17/java-%e7%9a%84%e5%bc%95%e7%94%a8%e4%bc%a0%e9%80%92/' rel='bookmark' title='Permanent Link: Java 的引用传递'>Java 的引用传递</a></li>
<li><a href='http://leeing.org/2010/01/17/java-constructor/' rel='bookmark' title='Permanent Link: Java 的构造方法'>Java 的构造方法</a></li>
<li><a href='http://leeing.org/2011/01/18/java-io-%e7%ae%80%e4%bb%8b/' rel='bookmark' title='Permanent Link: Java IO 简介'>Java IO 简介</a></li>
<li><a href='http://leeing.org/2011/02/24/java-%e5%a4%9a%e7%ba%bf%e7%a8%8b%ef%bc%9a%e6%8d%95%e6%8d%89%e7%ba%bf%e7%a8%8b%e4%b8%ad%e9%80%83%e9%80%b8%e7%9a%84%e5%bc%82%e5%b8%b8/' rel='bookmark' title='Permanent Link: Java 多线程：捕捉线程中逃逸的异常'>Java 多线程：捕捉线程中逃逸的异常</a></li>
</ol>]]></description>
		<wfw:commentRss>http://leeing.org/2010/05/18/user-behavior-zipf-distribution-and-java-implementation/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Ubuntu 9.10 安装 R</title>
		<link>http://leeing.org/2010/04/13/install-r-in-ubuntu-karmic/#utm_source=feed&#038;utm_medium=feed&#038;utm_campaign=feed</link>
		<comments>http://leeing.org/2010/04/13/install-r-in-ubuntu-karmic/#comments</comments>
		<pubDate>Tue, 13 Apr 2010 07:08:01 +0000</pubDate>
		<dc:creator>leeing</dc:creator>
				<category><![CDATA[Linux]]></category>
		<category><![CDATA[R]]></category>
		<category><![CDATA[Ubuntu]]></category>

		<guid isPermaLink="false">http://leeing.org/?p=457</guid>
		<description><![CDATA[1. 将源加入列表： $ sudo echo "deb http://cran.csdb.cn/bin/linux/ubuntu karmic/" >> /etc/apt/sources.list 2. 验证： $ sudo gpg --keyserver subkeys.pgp.net --recv-key E2A11821 $ sudo gpg -a --export E2A11821 &#124; sudo apt-key add - $ sudo apt-get update 3. 安装： $ sudo apt-get install r-base 4. 运行： $ R 即可进入 R 的交互式环境。 Related posts:Ubuntu 安装 iBus Chromium : Google [...]


Related posts:<ol><li><a href='http://leeing.org/2010/04/07/install-ibus-in-ubuntu-9-10/' rel='bookmark' title='Permanent Link: Ubuntu 安装 iBus'>Ubuntu 安装 iBus</a></li>
<li><a href='http://leeing.org/2010/04/17/chromium-google-chrome-for-linux/' rel='bookmark' title='Permanent Link: Chromium : Google chrome for linux'>Chromium : Google chrome for linux</a></li>
<li><a href='http://leeing.org/2010/04/10/ubuntu-proxy-support-for-apt-get-package-management/' rel='bookmark' title='Permanent Link: Ubuntu apt-get 代理服务器设置'>Ubuntu apt-get 代理服务器设置</a></li>
<li><a href='http://leeing.org/2010/04/09/install-svn-apache-in-ubuntu-9-10/' rel='bookmark' title='Permanent Link: Ubuntu 配置 SVN 服务器'>Ubuntu 配置 SVN 服务器</a></li>
<li><a href='http://leeing.org/2010/04/12/windows-hardisk-install-ubuntu-mint-8/' rel='bookmark' title='Permanent Link: Windows XP 硬盘安装 Ubuntu (Mint 8)'>Windows XP 硬盘安装 Ubuntu (Mint 8)</a></li>
</ol>]]></description>
		<wfw:commentRss>http://leeing.org/2010/04/13/install-r-in-ubuntu-karmic/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

