Andrei A. (filin) wrote,
Andrei A.
filin

  • Mood:

статистическое

Юзер kireev провел большую работу, сведя в общий график результаты московских выборов:
http://kireev.livejournal.com/481926.html


Факт массового вброса (и/или управляемого голосования) в пользу ЕР вполне очевиден уже из верхнего графика, (который от uborshizzza: http://uborshizzza.livejournal.com/674242.html ) Но из него непонятно, как же проголосовали те, кто действительно голосовали, и какая явка была на самом деле. Если бы были районы с честным голосованием, то они бы образовали компактное горизонтальное пятно в левой части графика, и по ним можно было бы судить - но таковых не наблюдается:

raiony

Зато по графику самого kireev, с разбивкой уже по участкам, об этом можно судить:

uchastki

График этот очевидно нелинеен, поэтому считать корреляцию не совсем правильно. Вместо этого честно выведем формулу смещения точек по этому графику в результате вброса.

Итак, пусть при Amax избирателях реально пришло голосовать A0, а за ЕР проголосовало A. От этого на графике появилась бы точка с координатами x0 = A/A0 (процент за ЕР) и y0 = A0/Amax (явка).

Теперь пусть в пользу ЕР вбросили долю d от общего числа избирателей, то есть d*Amax штук бюллетеней. Теперь якобы пришло голосовать ( A0 + d*Amax ) человек, из них за ЕР якобы ( A + d*Amax ). Поэтому у точки будут координаты x = ( A + d*Amax ) / ( A0 + d*Amax ) и y = ( A0 + d*Amax ) / Amax

Поделив на Amax и немного пригладив, получаем y = y0 + d (что очевидно) и x = ( x0*y0 + d )/( y0 + d ). При нулевом вбросе d=0 получаем честную точку x0, y0, как и должно быть.

Теперь исключим d и получим простенькую формулу для кривой: y = y0 * ( 1 - x0 ) / ( 1 - x ). У кривой два параметра: y0 - фактическая явка и x0 - фактический процент голосов за ЕР.

И наконец, подгоним эту кривую к графику обычным методом наименьших квадратов (участки со стопроцентным голосованием не считаем) :

krivaya

Видно, что кривая очень неплохо проходит через максимальное сгущение точек (бывает и лучше, но редко). Мало того, она проходит и через официальные результаты x=0.66, y=0.35.

Полученные параметры кривой обозначены жирной красной точкой (барабанная дробь):
фактическая явка - 20%, фактический процент голосов за ЕР - 42%. Вероятная ошибка - процента два-три.
Примечание: см. update.

Средний вброс соответственно 15% от числа избирателей, а максимальный - больше 30%.

Update: protopopov-m совершенно правильно указал, что по итоговой формуле можно определить только произведение y0 * ( 1 - x0 ) , но не y0 и x0 по отдельности. Дело в том, что после исключения d потерялось условие d>0 (то есть вброс может быть только положительным :-) ). То есть итоговая кривая начинается с точки x0, y0, а слева от нее вообще не существует, как мной и нарисовано. То есть корректная подгонка должна минимизировать отклонение точек "облака" именно от этой обрезанной слева кривой. Есть над чем работать :-)
Subscribe
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 70 comments
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →