// codeart.ru / Офтопик / Закон Бенфорда для проверки правильности бизнес данных Форум

Закон Бенфорда для проверки правильности бизнес данных rss подписка

Автор: Evgeniy Sergeev

Разрабатываем систему, которая собирает данные о качестве предоставления некоторых платежных сервисов. Сама технология сбора довольно примитивная и заключается в том, что данные формируются и складываются в обычный XML файл, а далее передаются на центральный сервер для обработки.

Естественно, региональное руководство не очень заинтересовано в передаче плохих данных, поэтому существует риск, что получаемые данные будут слегка подкорректированы в лучшую сторону. Поэтому я озадачился элементарной системой проверки, которая поможет определить подлог с помощью закона Бенфорда.

Закон Бенфорда, или закон первой цифры, описывает вероятность появления определённой первой значащей цифры в распределениях величин, взятых из реальной жизни. Закон верен для многих таких распределений, но не для всех. Также делает ряд предсказаний частоты встречаемости второй и третьей цифры.

Благодаря тому, что вероятность появления значащих цифр разная, можно анализировать данные и находит те цифры, которые сильно отличаются от предполагаемого распределения.

Проблема в том, что я не уверен, что наши показатели подходят под закон Бенфорда, так как они ограничены довольно узкими диапазонами. Поэтому начал собирать данные, которые заведомо достоверные, затем проверю какие варианты распределения на них будут получены.

Если получится, то буду использовать закон Бенфорда для проверки данных.

Leave a Reply

« »