Andrei A. ([info]filin) wrote,
  • Mood: tired

статистическое

Юзер kireev провел большую работу, сведя в общий график результаты московских выборов:
http://kireev.livejournal.com/481926.html


Факт массового вброса (и/или управляемого голосования) в пользу ЕР вполне очевиден уже из верхнего графика, (который от uborshizzza: http://uborshizzza.livejournal.com/674242.html ) Но из него непонятно, как же проголосовали те, кто действительно голосовали, и какая явка была на самом деле. Если бы были районы с честным голосованием, то они бы образовали компактное горизонтальное пятно в левой части графика, и по ним можно было бы судить - но таковых не наблюдается:

raiony

Зато по графику самого kireev, с разбивкой уже по участкам, об этом можно судить:

uchastki

График этот очевидно нелинеен, поэтому считать корреляцию не совсем правильно. Вместо этого честно выведем формулу смещения точек по этому графику в результате вброса.

Итак, пусть при Amax избирателях реально пришло голосовать A0, а за ЕР проголосовало A. От этого на графике появилась бы точка с координатами x0 = A/A0 (процент за ЕР) и y0 = A0/Amax (явка).

Теперь пусть в пользу ЕР вбросили долю d от общего числа избирателей, то есть d*Amax штук бюллетеней. Теперь якобы пришло голосовать ( A0 + d*Amax ) человек, из них за ЕР якобы ( A + d*Amax ). Поэтому у точки будут координаты x = ( A + d*Amax ) / ( A0 + d*Amax ) и y = ( A0 + d*Amax ) / Amax

Поделив на Amax и немного пригладив, получаем y = y0 + d (что очевидно) и x = ( x0*y0 + d )/( y0 + d ). При нулевом вбросе d=0 получаем честную точку x0, y0, как и должно быть.

Теперь исключим d и получим простенькую формулу для кривой: y = y0 * ( 1 - x0 ) / ( 1 - x ). У кривой два параметра: y0 - фактическая явка и x0 - фактический процент голосов за ЕР.

И наконец, подгоним эту кривую к графику обычным методом наименьших квадратов (участки со стопроцентным голосованием не считаем) :

krivaya

Видно, что кривая очень неплохо проходит через максимальное сгущение точек (бывает и лучше, но редко). Мало того, она проходит и через официальные результаты x=0.66, y=0.35.

Полученные параметры кривой обозначены жирной красной точкой (барабанная дробь):
фактическая явка - 20%, фактический процент голосов за ЕР - 42%. Вероятная ошибка - процента два-три.
Примечание: см. update.

Средний вброс соответственно 15% от числа избирателей, а максимальный - больше 30%.

Update: protopopov-m совершенно правильно указал, что по итоговой формуле можно определить только произведение y0 * ( 1 - x0 ) , но не y0 и x0 по отдельности. Дело в том, что после исключения d потерялось условие d>0 (то есть вброс может быть только положительным :-) ). То есть итоговая кривая начинается с точки x0, y0, а слева от нее вообще не существует, как мной и нарисовано. То есть корректная подгонка должна минимизировать отклонение точек "облака" именно от этой обрезанной слева кривой. Есть над чем работать :-)

  • Post a new comment

    Error

    Your reply will be screened

    Your IP address will be recorded 

  • 70 comments

[info]a11

October 13 2009, 09:49:41 UTC 2 years ago

браво!

[info]filin

October 13 2009, 14:35:17 UTC 2 years ago

:-)

[info]begimot

October 13 2009, 10:30:09 UTC 2 years ago

Я так и не понимаю, какие допущения были сделаны при подсчете модели. Дело в том, что в наглую вбросить биллютени очень и очень трудно - все такие случаи отслеживаются без труда по спискам голосовавших. Врядл ли функционеры ЕР получили такое указание. А вот корреляцию между явкой и % голосов достаточно просто обьяснить. ЕР в течении последних месяцев вела агит компанию в направлении определенных слоев общества. В тех районах где много пенсионеров и просто бедных людей - многие пришли на участки в надежде на дешевую еду или хотя бы мед. пункт. А если честно - мы просто варимся в своей прослойке. Выборы показали, что болшей части москвичей на судьбы Москвы просто наплевать.

[info]filin

October 13 2009, 14:25:06 UTC 2 years ago

Вот говорят, что на этот раз именно вбрасывали внаглую.

[info]malkolms

2 years ago

[info]gluk1543

2 years ago

[info]begimot

2 years ago

[info]mi_b

October 13 2009, 11:06:22 UTC 2 years ago

хороший анализ. проблема в том, что, вроде, те же формулы описывают альтернативную модель, типа такой: на каждом участке есть экзогенная доля "лоялистов": это люди, которые ходят на выборы и голосуют там за начальство.

чтобы различить эти два объяснения, нужны дополнительные переменные, например, на более высокой частоте. например, результаты явки на 16 и 18:00, которые тоже доступны. если доля "лоялистов" (ака вброса) окажется коррелирована с разницей между финальной явкой и явкой на 18:00, то будет очень убедительно. (думаю, так и окажется)

[info]filin

October 13 2009, 12:20:24 UTC 2 years ago

Получается довольно сверхъестественный мир, где участки не отличаются друг от друга ничем, кроме количества лоялистов, ничем кроме голосования себя не проявляющих ;-)

[info]mi_b

2 years ago

[info]filin

2 years ago

[info]gomberg

2 years ago

[info]malkolms

2 years ago

[info]malkolms

2 years ago

[info]mi_b

2 years ago

[info]malkolms

2 years ago

[info]mi_b

2 years ago

[info]malkolms

2 years ago

[info]mi_b

2 years ago

[info]malkolms

2 years ago

[info]malkolms

2 years ago

[info]mi_b

2 years ago

[info]malkolms

2 years ago

[info]av_klement

October 13 2009, 12:08:09 UTC 2 years ago

хм...математика сильная штука, и убедителен параметр 20/42...
но дело в том, что вброс применяется редко - штука рискованая, применяется чаще вписывание "неходящих" списки заранее выдаются...
главное - господа математики, основные исправления просто рисуются в приемной у главы администрации - когда он принимает или не принимает результаты...это ж невозможно мат. методами просчитать...
почитайте для полноты картины http://av-klement.livejournal.com/1123.html

[info]malkolms

October 13 2009, 15:24:11 UTC 2 years ago

Вброс штука рискованная :)? Ха-ха, им уже на это начхать. Смотрите:
http://avmalgin.livejournal.com/1688135.html

[info]av_klement

2 years ago

[info]malkolms

October 13 2009, 15:22:56 UTC 2 years ago

Отлично! Это надо побликовать в соавторстве с Киреевым и не только в интернете!

[info]protopopov_m

October 14 2009, 09:01:27 UTC 2 years ago

Одна ошибка. У Вас в модели фактически один параметр y0 * ( 1 - x0 ). Любые значения y0 и x0, у которых y0 * ( 1 - x0 ) = const, будут приводить к одинаковым кривым. Меняться будет только "честная точка". Т.ч. определить ее в рамках Вашей модели невозможно.

Если у Вас есть сводные данные по выборам по участкам, не могли бы Вы их выслать мне (ProtopopovM(at)gmail.com). Я бы постарался, что-нибудь сделать для развития Вашей модели.

[info]filin

October 14 2009, 09:46:05 UTC 2 years ago

Слона-то я и не приметил :-) Вы абсолютно правы, если смотреть итоговую формулу с исключенным d.

Однако поскольку она выводилась через вброс d, а он отрицательным быть не может, на этой универсальной кривой нужно остановиться в самой левой из разумных точек, на левом краю основного сгущения.

Исправленный вывод: модель вброса наблюдаемую статистику описывает вполне прилично, но начальную точку придется определять на глаз.

Вот ведь как автоматический фитинг может подвести :-)

Все данные - у kireev, я обрабатывал его график.

[info]filin

2 years ago

[info]gamak57

October 14 2009, 18:11:23 UTC 2 years ago

А что это за участок такой: 100% явка, 100% ЕР?

[info]filin

October 14 2009, 19:33:29 UTC 2 years ago

Это как раз не страшно - всякие спецучастки типа больниц, воинских частей, тюрем, общежитий и т.п. Где все люди налицо и отправить их поголовно голосовать нетрудно. Их и самих мало, и народу там обычно много меньше, чем на обычном участке, так что вклад невелик.

[info]psilogic

October 14 2009, 18:37:58 UTC 2 years ago

Спасибо, порадовали! :)

Есть вы стремитесь к совершенству, то можно еще учесть количество избирателей на участках. На больших участках статистическая погрешность должна быть меньше и "вес" таких точек при аппроксимации может быть больше.

Хотя, если участки примерно равны, то это ничего не даст.

Интересно, что есть некие "выбросы" далеко за пределы центральной "кучки". Видимо, это означает, что тех участках применялись какие-то иные технологии вместо вброса бюллетеней.

[info]akurg

October 14 2009, 19:00:46 UTC 2 years ago

"Теперь исключим d и получим простенькую формулу для кривой: y = y0 * ( 1 - x0 ) / ( 1 - x ). У кривой два параметра: y0 - фактическая явка и x0 - фактический процент голосов за ЕР."

Можно еще и так переписать эту формулу:
y * ( 1 - x ) = y0 * ( 1 - x0 ) = const
Произведение y * ( 1 - x ) - это явка, помноженная на долю тех, кто проголосовал не за ЕР. Формула утверждает, что это произведение постоянно вне зависимости от величины d.

Может что-то тут не так?

[info]filin

October 14 2009, 19:22:11 UTC 2 years ago

Так все правильно - это произведение и есть количество тех, кто проголосовал не за ЕР (точнее, их доля от числа избирателей). От вброса оно, естественно, не зависит, поскольку по предположению весь вброс - за ЕР.
:-)

[info]akurg

2 years ago

[info]filin

2 years ago

[info]akurg

2 years ago

[info]yurayu

October 15 2009, 06:16:08 UTC 2 years ago

Как такое может быть?

Если бы были районы с честным голосованием, то они бы образовали компактное горизонтальное пятно в левой части графика, и по ним можно было бы судить - но таковых не наблюдается
Значит, на всех участках должны быть нарушения? Значит, должна быть куча жалоб? Почему же этой кучи жалоб нет?

[info]andrey4

October 15 2009, 10:52:13 UTC 2 years ago

Re: Как такое может быть?

извините но не удержусь...
да все так и есть. на подавляющем большинстве участков грубейшие нарушения. жалобы есть и всегда были. а что толку??.. у нас что, независимые суды есть? несколько знакомых поработавших в комиссиях (сначала они кстати верили в честные выборы:)) рассказывали потом КАК это делается и что это за "выборы".. все делается практически в открытую.. просто у нас такая страна..

[info]yurayu

2 years ago

[info]reportperm

October 15 2009, 13:38:37 UTC 2 years ago

О-бал-деть! Аплодирую! В суд с этим пойти, что ли? )

Anonymous

October 15 2009, 14:07:55 UTC 2 years ago

такие графики рисовали для всех выборов в России

Получается что ваш "метод" указывает на маштабные фальсификации ВСЕГДА. Всегда за какую-то партию (обычно за самую большую) явка связанна с голосом. В чем же ценность такого метода? Уверен, что если сделать подобные графики для сходных выборов в Западной Европе, то получим весьма похожие графики. Ссылки на таинственные выборы в Литве просто смешны. Поскольку это общеизвестный факт, что явка и голос за некоторые партии сильно связанны во многих странах. Например, в США демократы обычно выигрывают от явки. Поэтому партии и борются за то, чтобы увеличить явку. Единая Россия потратила столько сил на агитацию за явку именно потому что среди пришедших на выборы будет относительно больше их стороников.

[info]erendir

October 15 2009, 19:35:53 UTC 2 years ago

Re: такие графики рисовали для всех выборов в России

>Уверен, что если сделать подобные графики для сходных выборов в Западной Европе, то получим весьма похожие графики.
>Ссылки на таинственные выборы в Литве просто смешны.

плохо работаете, товарищ майор!
взаимоисключающие утверждения.

[info]filin

2 years ago

Anonymous

2 years ago

[info]dbazhenov

October 15 2009, 16:28:27 UTC 2 years ago

Ну вот и появился формализованный способ оценки честности выборов. Даешь способ в закон о выборах!!!

[info]vveshka

October 15 2009, 21:36:15 UTC 2 years ago

Браво!

Чтобы дело усугУбить,
Стоит нАчать и углУбить!

[info]went

October 15 2009, 23:08:04 UTC 2 years ago

Используйте в первом соотношении (Процент явки * Процент партий)

а) НЕ проценты, а реальные цифры проголосовавших и "пришедших"
б) посчитайте дисперсию на участках от 0 до 10 персентиля, от 10 до 20 и так далее
получите "облако" в начале.
Это реально проголосовавшие. Далее - точки все же подчиняются линейной регрессии с изрядным доверием.

Главное в математическом обосновании сей поебени - доказать "смену формулы" (доказательство наличие некоего независимого признака) в точке, указанной у Вас.

Anonymous

October 16 2009, 09:48:29 UTC 2 years ago

любителям математики

любители математики могут посмотреть подобный анализ для Украины здесь http://www.philsci.univ.kiev.ua/biblio/Dobr-Finkel/socchas.htm

[info]alexlotov

October 18 2009, 18:16:24 UTC 2 years ago

Гебельс позавидует пропагандистам Единой России

leteha: В ситуации с Митрохиным я думаю, все довольно банально. Митрохин банально не проголосовал за свою партию, чтобы подставить избирком.

Anonymous

2 years ago

[info]alexlotov

2 years ago

[info]vlad_rutenburg

October 22 2009, 12:00:05 UTC 2 years ago

Каке последние выводы?

Андрей,

Какие последние выводы? Учитывая ошибку, указанную М. Протопоповым, смогли ли Вы пересчитать и найти матожидание и дисперсии следующих величин:

1. фактическая явки
2. фактический процент голосов за ЕР
3. количества вброшенных бюллетенй
4. фактический процент голосов за Яблоко и остальных партий

Заранее спасибо,

Влад

[info]filin

October 22 2009, 14:57:39 UTC 2 years ago

Re: Каке последние выводы?

После того, как в постах появился тот же график, но в правильных координатах (как на первом графике, который от uborshizzza, но с детализацией по участкам) - всякое уточнение модели потеряло смысл, там все гораздо очевиднее; и небольшое облачко "честных" участков, и огромное облако вброса с аккуратным линейным наклоном. Ссылку только не скажу, потому что сейчас не дома; но она должна быть где-то на виду, и там же было подробное обсуждение.

Выводы, насколько помню, примерно те же: явка чуть больше 20% (и точно меньше 25%), все что сверх того - вброс в пользу ЕР. Украли ли голоса у "Яблока" и иже, статистически узнать скорее всего не получится, поскольку этих голосов мало :-(

[info]filin

2 years ago

[info]filin

2 years ago

[info]andirect

October 25 2009, 03:17:44 UTC 2 years ago

Вообще говоря, ваша красная кривая, подогнанная мо МНК, должна бы пролегать несколько выше, особенно в левой её части.
Жирную точку тоже малёк недотянули влево, я бы её поставил в точку 31%,20%. (барабанная дробь :-) )

Всё это сильно притянуто за уши.

Anonymous

October 25 2009, 22:55:23 UTC 2 years ago

Вот-вот, мне тоже кажется, что это все ОЧЕНЬ натянуто!

Вообще, по-моему, изгиб кривой можно объяснить следующим образом. Если предположить, что в нашей стране очень много народа, голосующих либо за ЕР, либо ни за кого (т.е. другие партии им нравятся еще меньше), то понятно, что в районах с малой посещаемостью Единой Россией довольны мало людей, а следовательно естесственно ожидать, что и найдется больше народа, которые будут голосовать за другие партии, т.е. и будет получаться такая вот изогнутая кривая.

По крайней мере, даже если предположить, что были "вбросы", то все равно честный график не был бы прямой!

[info]igor_melnik

October 26 2009, 04:37:23 UTC 2 years ago

Выборы в МГД 2009

А вот и 3D видеофильм (по всем УИКам - более 3 тыс. штук)!
Вид тот же, что и в первоисточнике http://uborshizzza.livejournal.com/674242.html?page=4#comments, но по третьей оси (z) отложено количество избирателей на УИК.

Видео состоит из четырех фрагментов:

1) вначале без ЕдРа - "бутерброд из красной икры" из трех реперных партий:
КПРФ - красный цвет,
ЛДПР - желтый цвет и
СпрРосс - зелёный цвет;

2) потом на этот бутерброд добавлено ЕдРо - белый цвет;
3) далее, для контраста опять "бутерброд" без ЕдРа;
4) и потом то же, но с сильным увеличеннием разрешения слоев "бутерброда" по вертикали (шапка Мономаха):

http://igor-melnik.livejournal.com/889.html

[info]avplat

October 28 2009, 16:53:13 UTC 2 years ago

Тут есть следующая проблема. Все эти рассуждения про явку, голоса за ЕР и вбросы верны при обсуждении всех результатов выборов. Но переход от всех выборов к результатам на отдельных участках - ошибка. Ведь параметры, которые обозначены константами - на самом деле отнюдь не константы в случае рассмотрения голосования на участках. Из вашей модели получается, что на всех участках голосуют одинаково, а все голоса сверх этого "правильного" результата - вброс. Такая модель очевидно не соответствует реальности.

Мне кажется вполне разумным предположить, что голоса за партию и явка должны быть распределены нормально. Именно отклонение от нормальности и нужно исследовать, если хочется найти нарушения. Я попытался это проделать (правда, не везде достаточно строго), и получается, что явка завышена примерно на 2%, при этом процент голосов за ЕР завышен тоже примерно на 2% (т.к. не все голоса вброшены за ЕР):

http://avplat.livejournal.com/894.html

[info]filin

October 28 2009, 18:53:27 UTC 2 years ago

Распределения подробно рассмотрены здесь:
http://trv.nauchnik.ru/40N.pdf

По-моему, убедительно.

[info]avplat

2 years ago

[info]avplat

2 years ago

[info]filin

2 years ago

Create an Account
Forgot your login or password?
Facebook Twitter More login options
English • Español • Deutsch • Русский…