(三)论文作者分布规律

关于科技信息作者分布规律的描述方式是很多的。它们的主要目的是考察科技人员的著述能力与信息量之间的关系。其中最著名的是洛特卡定律。 1926 年末,美国一家人寿保险公司的统计员 A.J.洛特卡,以《化学文

摘》和《物理学史一览表》为来源资料,考察了 1907~1916 年 10 年间的累积索引。他得出撰写 X 篇论文的作者相对频率 y(x)的公式:

y(x)= C

x n

当年洛特卡说:“这两个例子表明的指数近似等于 2.0”。于是,式(10)在 12 年之后,被 G.K.齐普夫称为“倒平方定律”。但是后人的继续研究表明,指数 2 仅是一个持例。1974 年,J.维拉奇(Vilady)发现,对不同的学科而言,n 可以从 1.2 浮动到 3.5 以上。

式(10)中的 C=1/( ∑1 / xn ) ,而∑ 1 = S( n)

x−1 x n

亦即 C=1/S(n)。S(n)被认为是黎曼ζ函数,当 n>l 时收敛,当 n≤1 时发散。若 n 为偶数时,C=6/ π2 =0.6079。然而当 n 为任意数时,C 值不能按上式计算。有人提出近似计算公式为:

C=1/ ∑1 / Xn x=1

其中

∞ p−1

∑1 / Xn = [∑1 / Xn + 1(n − 1) • P( n−1) + 1 / 2P n + n / 24 • (P − 1) n+1

x=1 x=1

普赖斯对文献作者分布规律有过许多论断(其实只能算假设),其中最著名的是“平方根定律”——“撰写全部论文半数的高产作家的数量,等于全体论文作者的平方根”。

∑ n( x) =

m+ 1

式中, n(x)为写 X 篇著作的科技论文作者人数, I=,即在一次取样中科技人员撰写最多的论文数量,N 为撰写论文作者的总人数。m 可按下列条件确定:

∑X

2