Andrei A. (filin) wrote,
Andrei A.
filin

  • Mood:

статистическое

Юзер kireev провел большую работу, сведя в общий график результаты московских выборов:
http://kireev.livejournal.com/481926.html


Факт массового вброса (и/или управляемого голосования) в пользу ЕР вполне очевиден уже из верхнего графика, (который от uborshizzza: http://uborshizzza.livejournal.com/674242.html ) Но из него непонятно, как же проголосовали те, кто действительно голосовали, и какая явка была на самом деле. Если бы были районы с честным голосованием, то они бы образовали компактное горизонтальное пятно в левой части графика, и по ним можно было бы судить - но таковых не наблюдается:

raiony

Зато по графику самого kireev, с разбивкой уже по участкам, об этом можно судить:

uchastki

График этот очевидно нелинеен, поэтому считать корреляцию не совсем правильно. Вместо этого честно выведем формулу смещения точек по этому графику в результате вброса.

Итак, пусть при Amax избирателях реально пришло голосовать A0, а за ЕР проголосовало A. От этого на графике появилась бы точка с координатами x0 = A/A0 (процент за ЕР) и y0 = A0/Amax (явка).

Теперь пусть в пользу ЕР вбросили долю d от общего числа избирателей, то есть d*Amax штук бюллетеней. Теперь якобы пришло голосовать ( A0 + d*Amax ) человек, из них за ЕР якобы ( A + d*Amax ). Поэтому у точки будут координаты x = ( A + d*Amax ) / ( A0 + d*Amax ) и y = ( A0 + d*Amax ) / Amax

Поделив на Amax и немного пригладив, получаем y = y0 + d (что очевидно) и x = ( x0*y0 + d )/( y0 + d ). При нулевом вбросе d=0 получаем честную точку x0, y0, как и должно быть.

Теперь исключим d и получим простенькую формулу для кривой: y = y0 * ( 1 - x0 ) / ( 1 - x ). У кривой два параметра: y0 - фактическая явка и x0 - фактический процент голосов за ЕР.

И наконец, подгоним эту кривую к графику обычным методом наименьших квадратов (участки со стопроцентным голосованием не считаем) :

krivaya

Видно, что кривая очень неплохо проходит через максимальное сгущение точек (бывает и лучше, но редко). Мало того, она проходит и через официальные результаты x=0.66, y=0.35.

Полученные параметры кривой обозначены жирной красной точкой (барабанная дробь):
фактическая явка - 20%, фактический процент голосов за ЕР - 42%. Вероятная ошибка - процента два-три.
Примечание: см. update.

Средний вброс соответственно 15% от числа избирателей, а максимальный - больше 30%.

Update: protopopov-m совершенно правильно указал, что по итоговой формуле можно определить только произведение y0 * ( 1 - x0 ) , но не y0 и x0 по отдельности. Дело в том, что после исключения d потерялось условие d>0 (то есть вброс может быть только положительным :-) ). То есть итоговая кривая начинается с точки x0, y0, а слева от нее вообще не существует, как мной и нарисовано. То есть корректная подгонка должна минимизировать отклонение точек "облака" именно от этой обрезанной слева кривой. Есть над чем работать :-)
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

  • 70 comments