第409章 本福特定律
也稱為本福特法則,說明一堆從實際生活得出的數據中,以1為首位數字的數的出現概率約為總數的三成,接近直覺得出之期望值1/9的3倍。推廣來說,越大的數,以它為首幾位的數出現的概率就越低。它可用於檢查各種數據是否有造假。
推而廣之,它能用於在會計、金融甚至選舉中出現的數據。該定律被華盛頓郵報上的一篇文章引用,該文章以此為基礎聲稱2009年伊朗總統大選中有造假。
若所用的數據有指定數值範圍;或不是以概率分布出現的數據,如正態分布的數據;這個定律則不準確。
1881年,天文學家西蒙·紐康發現對數表包含以1起首的數那首幾頁較其他頁破爛。可是,亦可以以任何書起首數頁也會較破爛這個觀點解釋。這個故事可能是虛構的。
1938年,物理學家法蘭克·本福特重新發現這個現象,還通過了檢查許多數據來證實這點。
2009年,西班牙數學家在素數中發現了一種新模式,並且驚訝於為何現在(2009年)才為人發現。雖然素數一般被認為是隨機分布的,但西班牙數學家發現素數數列中每個素數的首位數字有明顯的分布規律,它可以被描述了素數的本福特定律。這項新發現除了提供對素數屬性的新洞見之外,還能應用於欺騙檢測和股票市場分析等領域。