Benford Yasası Nasıl Ortaya Çıktı?
1881 yılında fenomeni ilk fark eden kişi, bir matematikçi ve astronomi olan Simon Newcomb’du. Bir gün, Newcomb bazı programlamalar için bir logaritma kullanırdu. Ancak kitabın ilk sayfalarının daha fazla yıpranmış olduğunu gözlemledi. Ön yaklaşmakça sayfalarının sayfalarının daha yırtık olduğunu fark etti. Bazı türlerden, insanlar sürekli olarak küçük tipler daha sık bekleyenler. Sonucunda bilim insanı gibi o da onun merakını araştırdı.
Muhtemelen New boyutu az önce biraz önce gibib söylemek istemişti. Doğum gününden bir seçime ulaşır. N rakamları ile ücretin kullanımının log (N+1) – log (N) kadar ilerlediğini ileri sürdü. Ancak Newcomb için herhangi bir açıklama yoktur. Bunun için bu tesisten çıktıktan sonra gitti.
Yaklaşık 50 yıl bule ilgili pek bir çalışma yapılmadı. Daha sonra 1939 yılında General Electric’de bir mühendis olan Frank Benford , ilginç bir gözlem yaptı. Şehirlerin içeriğine sahip olmayan, bilgin çok daha fazla bilgiyle fark etti. Bu tür modellenen Benford, uygun durumda büyütülen buna ne kadar uygun yola çıktı. Hisse senetlerine, nehirlerine göre, sporne ve bir çok sayıdaki koleksiyona baktığında aynı şaşırtıcı sonuçla karşılaşmazlar.

Benford Yasasını Açıklama Çabaları
Sonucunda ilk rakamların belirli bir değer alman 1’a göre doğru rakamla çizilmiştir. Benford formüle Anormal Sayılar Kanunu adını verdi. Ancak bugünlerde adı Benford yasa olarak biliniyor. Analizi, yasafordunun onaylayamadı.
Bu ilgiye yönelik ilk adım, 1961′ New Jersey’li olan Roger Pinkham’dan geldi. Bu yasanın evrensel öğrencilerden oluşan bir grup kümeleri ile çalışmalar yaptı. Sonucunda nehirlerden uzaklardan, galaksilerin kadar çok sayıda veri kümelerinin seçilmiştir.
Fenomen 1995 yılında, Theodore P. Hill tarafından tekrar incelendi. Benford örneğini izleyen veri serilerindekin aslında “ikinci nesil” gösterimler olduğu, yani başvuruların başvurularının göründüğü konuldu. Benford’u onaylamak ilginç ve şaşırtıcı bir sonuçtur, bu konuda ne kadar çok şey var? Mali veri de Benford yasana uyduğuna anladığımız zaman çok güzel. Sonucunda dolandırıcılığı tespit etmek için bu yasa son derece önemlidir.
Sayılar Yardımı İle Dolandırıcılık Tespiti
Muhasebe eğitimine yönelik olan Mark Nigrini, ilköğretimden tahmin edilebilinir. Bir öğrenci, bir nalbur dükkan işleten hesaplarına kayınbiraderinin hesaplarına karar verdi. bir şekilde, Sayı Benford’a hiç benzemiyordu. Tutarsızlık ki, bir o kadar büyük olması gerekirdi ki. Bu öğrenci aklından aslında minik bir sahtekarlığı beklemekten çıkarmıştı.
Bir vergi hesaplarını tahrif etmeye başlayacaksa, o zaman eski hale getirmek ve yenilerini oluşturmak mümkün olacaktır. Bu yasanın gösterimi gösterimde kullanılanlarda geçerli olduğunu hatırlatalım. Bu düz bir düzenin aynı doğallıkta sayı eklemesi mümkün olamaz.
Bu küçük küçüklerden itibaren, Benford gerçekte, muhasebecinin dolandırıcılığı tespit etmek için kullandığı resmi araçlardan biri geldi. Örnek yasa, 2001 yılında Yunanistan’ın ekonomik kullanımı için. Avrupa Birliği’ne ait parça için manipüle anlaşıldı. günümüzde bu yasa sahte haber ve tespit etmek için de kullanılmaktadır. Dijital fotoğraflardan oluşanlardan oluşur. Bu gösterge kurcalarsan bu sayi Benford yasanalarsan anlarsin.

Benford Yasası Nasıl Çalışıyor?
Benford yasasını kanıtlamak zor. Bu temel bilgilerine bulamaya girmeyeceğiz. Merak ettikleri kaynaklar kısmından bu ispata erişebilir. Ancak bunun nedeni doğru anlamanın bir yolu vardır. Biz de bunu işletmeye çalışalım.
Bir yatırımdan rastgele bir sayı çekeceğiniz bir kampanyadan hayallerinizi edin. Elinizde sadece 1, 2, 3, 4 sayfalık dört çekiliş programı olsun. Kazanan numaranın 1 ile başı ayrıdır? Tabii ki 4′ 1 veya yüzde 25. 5, 6, 7 gibi daha fazla çekiliş biletini gelecekte gibi. 9 bilet için onun olma olasılığı 9’da 1 % 11’edir. Ancak, 10 kişilik katılarak işler karışıyor. On biletten artık ikisi 1 (yani 1 ve 10) ile başlıyor. Bu artan biletin ilk sayının 1 ile başlangıç olasılığı yüzde 20 çıktı.
11, 12,… 19’a kadar 13 ulaşkça artmaya devam edecek ve 20 bilette oran 11 ⁄ 19 veya 58’e kalacak. Ancak 20’ler, 30’lar ve üzerini ekledikçe, ilk sayının 1 olması olay nedeniyle düştü. Aslında 1’den 99’a kadar sayılarda ilk sayının bir olma olasılığı 11 ⁄ 99 yani yaklaşık yüzde 11 kadardır. Peki ya 100’den fazla sayı koyarsanız? Şansınız bir kez daha artar. 199. çekiliş biletine ulaştığınızda, kazananın ilk basamağının 1 olma 111 ⁄ 199. Yani bir kez daha yüzde 50’nin üzerindedir.
Benford Yasasına Göre Sayıların Görülme Sıklıkları

Nasıl bir şekilde, satılan günlük sayı yüzde 58 ile yüzde 11 arasında zikzaklar çizer. sonunda kaç tane satılmayacağınızı bilemezsiniz. Ancak Benford yasanının öngördüğü gibi, “ortada dolaşırken bir yerde görebilirsiniz. Bir sayının Benford kuralı tarafından öngörüldüğü gibi N rakamıyla başlangıçtan başta da dediğimiz gibi log (N + 1) – log (N) kadardır. N = 1 için bu, log (2) – log (1) veya yüzde 30,1 olan 0.301’e denk gelir.
günümüzden 150 yıl önce bir dünya çapında bir kitap kütüphanesi gibi bir şey bir gözlemle günümüzdeki evrenimize uygulanmış durumda. Yaşamdaki, benzer tiplerde ve benzer türde tam olaraklarımız ilgi çekici bir düzen var gibi.
kaynak :https://www.matematiksel.org/teoriden-uygulamaya-benford-yasasi/

kaynak: https://www.guroldemir.net/Programlar/23/Tetkik/Benford
Benford Analizi
Analitik inceleme prosedürleri arasında sayılan “Benford Analizi” duruma göre denetim ve vergi incelemelerinde de kullanılmaktadır.
Benford Kanununa göre rakamların kullanım sıklıklarının doğal bir dağılımı vardır. Bu analiz, verilerdeki rakam dağılımlarının Benford Kanununa uygun olup olmadığını bir başka ifade ile sayıların manipüle edilip edilmediğine bakmak için yapılır. Bu analizin temel noktası insanların rastgele davranamayacağına dayanmaktadır. İnsanlar bir hileye olanak vermek amacıyla sayı türettiklerinde alışkanlıklarının neticesi olarak belirli birkaç numarayı tekrar ederler, bir başka ifade ile sayı doğal dağılıma uygun üretilmemiş olur.
Kısa tarihçe
Benford Kanunu hakkında bilinen ilk makale Simon Newcomb tarafından (astronom ve matematikçi) 1881 yılında American Journal of Mathematics’de yayımlanmıştır. Newcomb hesap makinelerinin olmadığı dönemlerde, logaritmik cetvellerde ilk sayfaların diğer sayfalara göre daha fazla yıprandığını fark etmiştir ve araştırmalarını buna göre şekillendirmiştir. Araştırmaları neticesinde, küçük rakamların büyük rakamlara göre daha sık kullanıldığı sonucuna varmıştır. Bunun neticesinde 1 rakamı 2 rakamına göre daha çok, 2 rakamı ise 3 rakamına göre daha çok kullanılmaktadır. Newcomb bu araştırmasını formülize etmiştir: Olasılık=Log10((rakam+1) / rakam)
Mark J. Nigrini’nin, 200 bin civarında mükellefin vergi beyanlarına ilişkin verileri kullanarak hazırladığı “Vergi Kayıp ve Kaçaklarının Benford Yasası ile Analizi” başlıklı doktora tezi, kamu gelir-harcama profili analizinde Benford Yasasının kullanılmasında temel çalışma olmuştur.
Bu sihirbaz ile Benford Kuralı hakkında teorik bilgiler edinebilirsiniz. İsterseniz programa tanıtacağınız veri setleri üzerinde aşağıdaki Benford analizi uygulamalarını yapabilirsiniz:
Testler
a) Birinci basamak testi: Benford’un sayısal analiz testlerinden en genel ve en temel testtir. Bir ön test niteliğinde olup bu testten elde edilen sonuçlar, verilerin Benford Kanunu’na uygun dağılıp dağılmadığını tespit etmede kullanılmaktadır. Alt ve üst sınırlar belirlenerek, bu sınırların dışında kalan verilerin Benford Kanunu’na uygun bir dağılım göstermediği söylenebilir. Veriler arasında ilk basamaktaki rakamların tekrarlanma sıklıklarını göstermektedir.
b) İkinci basamak testi: İkinci basamak testi de birinci basamak testinin olduğu gibi genel ve temel bir testtir. Bu test kullanılarak yapılacak olan işlem de, alt ve üst sınırlar dahilinde verilerin Benford Kanunu’na uygun dağılıp dağılmadığını tespit etmektir. Veriler arasında ikinci basamaktaki rakamların tekrarlanma sıklıklarını göstermektedir.
c) İlk iki basamak testi: İlk iki basamak testi, birinci ve ikinci basamak testinin devamı niteliğindedir. Ancak önceki testlere göre daha özel ve veriler üzerinde daha ayrıntılı durmaktadır. Bu test sayıların ilk iki basamağındaki rakamların tekrarlanma sıklıklarını tespit etmektedir. Böylece ilk basamakta ve ikinci basamakta varolabilecek sapmalar birinci ve ikinci basamak testinde görülemeyecek olsa bile bu iki sapma ilk iki basamak testinde görülebilecektir.
d) İlk üç basamak testi: İlk üç basamak testi, ilk iki basamak testine göre daha özel ve kapsamlı bir testtir. Bu test veri kümelerindeki sayıların ilk üç basamağındaki rakamların sıklıklarını göstermektedir. Diğer testlerde olduğu gibi bu testte de beklenen değerler ile gözlemlenen değerler arasındaki fark hesaplanır. Ancak bu testin kullanılabilmesi için veri sayısının 10.000’in üzerinde olması gerekmektedir. Bu testin esas özelliği, analiz sonuçlarına göre ortaya çıkan anormallikler üzerine yoğunlaşmasıdır.
e) İlk dört basamak testi,
f) Mükerrer sayılar testi: Bu test frekansı yüksek olan, başka bir deyişle en fazla tekrarlanan sayıları tespit etmede kullanılır. Bu testin amacı; kuşkulu olabilecek sayıların yerini belirlemektir. Aşırı sayı tekrarı durumunda, tekrarlanan sayılar ilk iki ve ilk üç basamak testlerinin sonuçları ile karşılaştırılarak sapma veren sayılar bulunabilecek ve denetim hedefi belirlenmiş olacaktır. Bu sebeple mükerrer sayılar testi ile ilk iki ve ilk üç basamak testlerinin birlikte değerlendirilmesi gerekmektedir.
Test için Rakam Frekans Faktörü (NFF) kullanılır. NFF sıfır veya sıfıra yakın olması verilerde çift kayıt sorunu olduğunu gösterirken; 1’e yaklaşması veri setinde çift kayıt probleminin bulunmadığını gösterir.
Ek olarak “aynı, aynı, farklı” ve “aynı, aynı, aynı” testlerinde kullanılan ödemelerin anormalliklerinin tanımlanmasına yardımcı olur.
g) Yuvarlama testi: Bu test satıcıların tanımlanmasında, tahmini gereksiz miktarlardaki faturalar ve ödemelerde kullanılır. Yuvarlanan rakamlar testi; 5, 10, 25, 50, 100 ve 1000`in katları olan sayıların hesaplanmasında kullanılır. Yuvarlama ve son iki basamak testleri, hile veya hatalı sayılardan daha ziyade, tahmin edilmiş ya da türetilmiş sayıların ortaya çıkarılmasında kullanılmaktadır.
Yuvarlama Hatası Kontrolü, Nispi Büyüklük Faktörü Testi (RSFT) ile yapılmaktadır. Veri setindeki yuvarlama hatalarını bulmaya yönelik bu testte veri setindeki en büyük rakam ikinci büyük rakama oranlanarak normal aralıklara uymayan rakamlar tespit edilmeye çalışılmaktadır. RSFT fazla sıfır veya haneleri yanlış ayrılmış rakamların tespitinde önemli rol oynamaktadır. Ondalık küsür hanesi iki rakamlı olarak kayıt yapılıyorsa RSFT>100 oranı ondalık ayıracının yanlış olduğunu test etmekte kullanılır.
h) Son iki basamak testi: Son iki rakamın dağılımının incelenmesi rakam yuvarlamalarının incelenmesine ek bir prosedür olarak düşünülebilir. Teorik olarak bütün son iki rakam sayıları, 0,01’lik bir beklenen değere sahiptir. Benford Kanunu’na göre rakamların rastlanma olasılıkları sayıların son hanelerine gittikçe birbirine yaklaştığından her bir 00-99 arası her bir rakam ikilisinin olasılığı 0,01 olarak alınabilir.
Son iki basamak testinin amacı, aslında küsuratlı olan ancak yuvarlanmış ve oynanmış sayıları tespit etmektir. 10.000 adetin altında olan veri setlerinde kullanıldığında daha etkin sonuçlar vermektedir.
Benford Kanununun faydalı olmadığı durumlar
Kuralın, suni olarak oluşturulmuş (tahsis edilmiş) çek ya da fatura numaralarında veya tamamen rastlantısal meydana gelmiş loto sonuçlarında uygulamasında mümkün değildir.
Veri seti maksimum ve minimum değerlerden oluşmamalıdır. Örneğin, bir günün 24 saat olması nedeniyle günlük çalışma saatleri 0 ile 24 arasında sınırlı bir değer alacağı için uygun değildir.
Veri seti belirlenmiş sayılardan oluşmamalıdır. Örneğin, sosyal güvenlik numaraları, Banka hesap numaraları, T.C Kimlik numaraları, vergi kimlik numaraları bunlardan bazılarıdır. Bu numaralar birbirini takip eden numaralardır ve bu numaraların ilk rakamları ve son rakamları bir şeyi ifade etmez.
Bir ürünün satış fiyatının insanları psikolojik olarak etkilemek amacıyla 100 yerine 99,99 lira gibi küsuratlı belirlenmesi de kuralın faydalı olmasını engeller.
Çıktılar
Gerek teorik bilgiler ve gerekse veri setiniz üzerinde yaptığınız çalışmalar sırasında üretilen; a) Izgara (data grid) verileri üzerine sağ tıklayarak Excel`e ihraç edebilir, b) Grafikler üzerine sağ tıklayarak bu grafikleri kopyalayabilir veya farklı resim formatlarında kaydedebilirsiniz.
Mini programın kullanımına ilişkin bir video https://www.youtube.com/watch?v=y0WNLGCDg1E adresinde paylaşılmaktadır.
Bu uygulama, masaüstü programı olup sadece Windows (Windows 10, Windows 7 vb.) işletim sisteminde çalışır, cep telefonlarında çalışmaz. Bu ve benzeri bir çok mini uygulama Merhaba (Denetim Araçları) isimli tek bir program içinde sunulmaktadır. Merhaba programını indirmek için Merhaba İndir, tetkik etmek için Merhaba Tetkik bağlantısına tıklayınız.
Bu uygulama aşağıda listelenen benzerleri gibi, mini program olarak da dağıtılmaktadır. Mini programlar tanıtım amaçlı olup sizi “Merhaba” programını kullanmaya yönlendirebilirler. Mini program olarak indirmek ve kullanmak isterseniz Benford Analizi İndir bağlantısına tıklayınız.
Bir ansiklopedi, kitap veya gazeteden rastgele seçilen herhangi bir sayının “1” ile başlama olasılığı nedir? Peki ya 3 numara? Ve “9” sayısından? Olasılık teorisi hakkında hiçbir fikriniz olmasa bile, tamamen sezgisel olarak, şansın her sayı için aynı olduğu ve 100:9=11,(11)%’e eşit olduğu görülüyor.
Ama hayır, değil. Hayatta meydana gelen ve buldozerden icat edilmeyen gerçek sayılara bakarsanız, dokuz ile başlayan sayılar %11’den çok daha azdır (aslında yaklaşık %4) ve sayı vakaların neredeyse üçte birinde bir ile başlayacaktır ( yaklaşık %30).
Başka bir deyişle, gazete okursanız, en sık “1” ile başlayan, biraz daha az “2” ile, biraz daha az “3” vb. ile başlayan ve en az rastlanan sayılarla karşılaşırsınız. “9” ile başlayan sayılar . Formüller ve açıklamalar yoksa, bu Benford yasasıdır.
Kaynak: habr.com/ru/post/240853/
Görünen imkansızlık, olasılık teorisinin tutarsızlığı, sağduyu ve imkansızlığa rağmen, doğal kısıtlamaları yoksa (bir kişinin boyu veya IQ’su gibi) tüm gerçek sayılar üzerinde çalışır.
Bu yasa, hisse senedi fiyatları, nehir uzunlukları, ülkelerin nüfusları, alanlar, gazetelerdeki, kitaplardaki ve referans kitaplarındaki sayılar, yemek tarifleri, beyzbol maç istatistikleri ile çalışır. Ve periyodik tablodaki elementlerin atom ağırlığı bile bu yasaya uyar.
Ansiklopedilerdeki sayıların ilk haneleri.
Genel olarak, Benford Yasasına Newcomb Yasası demek daha mantıklı olacaktır. 1881 civarında kütüphaneden logaritmik tabloların olduğu bir defter alarak bu garip kalıba dikkat çeken Simon Newcomb oldu.

Benford Yasası: Sayılar İle Uğraşırken Karşımıza Çıkan İlginç Bir Örüntü