Гауссиана как закон природы
Dec. 11th, 2011 01:07 pmСтатистика посещения на русской википедии статей "Логнормальное распределение":

"Нормальное распределение":

и "Гаусс":

Тут в российском интернете по итогам выборов наблюдается тенденция возвести гауссоиду в ранг законов природы. Так как не все знают что такое "гауссоида", и когда правильно искать нормального, а когда логнормального распределения, то натурально наблюдается всплеск интереса к предмету. Что мы и видим на википедии. Ожидаемо, посещаемость "нормального распределения" больше, чем "логнормального" - второе слово хоть и намного более релевантно, но зато длиннее, да и симметричный колокол красивее асимметричного. А грамотных людей меньше чем неграмотных.
Да, но назад к законам природы. Люди склонны скакать через ступеньку в логических построениях. А статистический аргумент он вообще довольно неинтуитивен и нетривиален, что к слову сказать ведёт обыденное сознание к разным расизмам-сексизмам.
Что можно сказать, гляда на графики вроде этого или лучше даже вроде этих (тут хоть выборы и прошлые, зато исследование более подробное)?
Только то, что мы наблюдаем аномалии. Ожидалось бы (лог)нормальное распределение, а получается вот такое. Статистика сама по себе не даёт никаких объяснений аномалиям. А сам по себе факт наличия аномалий не даёт оснований утверждать, что они имеют искусственное происхождение.
Дальнейшая линия рассуждений уже не опирается на статистику, а идёт примерно так:
- аномалии распределения голосов по участкам требуют объяснения;
- теория фальсификации итогов выборов в пользу ЕР объясняет все наблюдаемые аномалии;
- теории, объясняющей все аномалии естественными причинами пока не предложено.
Ergo: теория фальсификации лучшая из теорий, имеющихся в нашем распоряжении. Этого вполне достаточно любому практическому уму, но конечно мало для того, чтобы опротестовывать выборы в судебном порядке.
"Нормальное распределение":
и "Гаусс":
Тут в российском интернете по итогам выборов наблюдается тенденция возвести гауссоиду в ранг законов природы. Так как не все знают что такое "гауссоида", и когда правильно искать нормального, а когда логнормального распределения, то натурально наблюдается всплеск интереса к предмету. Что мы и видим на википедии. Ожидаемо, посещаемость "нормального распределения" больше, чем "логнормального" - второе слово хоть и намного более релевантно, но зато длиннее, да и симметричный колокол красивее асимметричного. А грамотных людей меньше чем неграмотных.
Да, но назад к законам природы. Люди склонны скакать через ступеньку в логических построениях. А статистический аргумент он вообще довольно неинтуитивен и нетривиален, что к слову сказать ведёт обыденное сознание к разным расизмам-сексизмам.
Что можно сказать, гляда на графики вроде этого или лучше даже вроде этих (тут хоть выборы и прошлые, зато исследование более подробное)?
Только то, что мы наблюдаем аномалии. Ожидалось бы (лог)нормальное распределение, а получается вот такое. Статистика сама по себе не даёт никаких объяснений аномалиям. А сам по себе факт наличия аномалий не даёт оснований утверждать, что они имеют искусственное происхождение.
Дальнейшая линия рассуждений уже не опирается на статистику, а идёт примерно так:
- аномалии распределения голосов по участкам требуют объяснения;
- теория фальсификации итогов выборов в пользу ЕР объясняет все наблюдаемые аномалии;
- теории, объясняющей все аномалии естественными причинами пока не предложено.
Ergo: теория фальсификации лучшая из теорий, имеющихся в нашем распоряжении. Этого вполне достаточно любому практическому уму, но конечно мало для того, чтобы опротестовывать выборы в судебном порядке.
no subject
Date: 2011-12-11 09:09 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From: (Anonymous) - Date: 2011-12-13 08:44 pm (UTC) - Expandno subject
Date: 2011-12-12 03:14 am (UTC)no subject
Date: 2011-12-11 06:18 pm (UTC)Таганрог - 30
Ростов - 42
Аксай - 30 или 33
Батайска - внезапно 65
притом что Аксай и Батайск по сути районы Ростова уже давно... и еще в Советском районе Ростова, который почему-то относится к Таганрогской избирательной комиссии тоже около 30.
В свете того что о нарушения на выборах известно в некоторых случаях достоверно, то да, теория фальсификации выглядит наиболее близкой к истине.
no subject
Date: 2011-12-11 06:19 pm (UTC)no subject
Date: 2011-12-11 09:17 pm (UTC)no subject
Date: 2011-12-11 06:24 pm (UTC)no subject
Date: 2011-12-11 07:56 pm (UTC)там много ссылок, например http://jemmybutton.livejournal.com/1359.html и http://www.wiz-aut.narod.ru/L042_falsifikacii_3_statistika.htm
а в последней есть даже такая: http://www.cikrf.ru/banners/illuziya/itogi_160908.html
no subject
Date: 2011-12-11 07:56 pm (UTC)Любая неслучайная исчислимая величина, имеющая в совокупности ограниченную дисперсию, при достаточно большом количестве попарно независимых измерений подчиняется закону больших чисел Чебышева.
Это написано, например, в классическом учебнике Чистякова по терверу.
1) Неслучайная = обусловленная некоторыми законами, в том числе, неустановленными.
2) Исчислимая = её можно выразить числовым значением.
3) Ограниченая дисперсия - число может быть из ограниченного (пункт номер 1...7) диапазона, но не (0...бесконечность).
Всё, что Вы в постинге сказали, равносильно такому утверждению: "я не знаю законов из пункта (1), потому Чебышев неправ".
Чебышев прав вне зависимости от того, известны ли законы, по которым изменяется величина.
Сама по себе гауссиана, бесспорно, не является юридическим аргументом.
Однако её отсутствие позволяет предположить, что распределение ненормально.
Это как если бы Вы шли по городу, где обычно живут люди ростом 160-180см (хотя бывают и 130 и 210), и вдруг внезапно стали встречать людей пятиметрового роста. При этом средний рост населения в городе не превысил бы, скажем, 200см. В общем, нормальная величина.
Статистика, действительно, не даёт ответа о том, каковы законы, определяющие величину. Она может лишь сказать, одинаковы ли эти законы, или разные.
У всех остальных графиков почти всё нормально, а у одного - "аномалии". Следует предположить, что этим графиком управляют другие законы. Какие - статистика не говорит. Но - другие.
P.S. "Гауссоида" - неправильное слово.
P.P.S. Логнормальное распределение симметрично на логарифмической шкале. Целесообразность применения лог шкалы в данном случае довольно спорно.
no subject
Date: 2011-12-11 09:22 pm (UTC)Перечитал ещё раз свой постинг. Не могу понять откуда выводится его равносильность этому утверждению. Не поясните?
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From: (Anonymous) - Date: 2011-12-14 02:10 pm (UTC) - Expand(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2011-12-11 08:09 pm (UTC)Если условия центральной предельной теоремы соблюдаются, а нам предъявляют не Гауссово распределение, то нас обманывают.
Конечно, можно сказать, что это гигантская флуктуация. Но чтобы на нескольких выборах подряд, и в пользу одной и той же партии, то я не знаю кем надо быть чтобы поверить в такую флуктуацию.
no subject
Date: 2011-12-11 09:16 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2011-12-11 09:43 pm (UTC)no subject
Date: 2011-12-11 10:31 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2011-12-11 11:00 pm (UTC)Денег что ли пожалели?
Или решили, что и так сойдет - их ведь не первый раз ловят за руку, но до сих пор сходило
no subject
Date: 2011-12-11 11:44 pm (UTC)Есть мнение (мнение), что большая часть этих подтасовок суть "инициативы снизу". Т.е. самодеятельность местной администрации.
Ведь, если разобраться, единственный практический выхлоп всей этой выборной канители - численно выраженные показатели лояльности местного населения к центральной власти. Там, где эти цифры предельно низки, очевидно, что местная администрация (ассоциированная с центральной властью естественным образом) не делает ничего для поддержания лояльности населения. Что, в свою очередь оборачивается оргвыводами по итогам голосования. Отсюда и творческая самодеятельность на местах — попытка местных властей хоть как-то натянуть сову на глобус — чтобы не оказаться в роли той самой совы малое время спустя.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2011-12-12 04:54 am (UTC)У нормального - хвосты в две стороны (ниже 0 и выше 100%), у логнормального - хвост только выше 100%, но еще больше.
Может быть начать с поисков подходящего распределения? Ну там модели сферического в вакууме избирателя....
no subject
Date: 2011-12-12 07:32 am (UTC)Для этого в MATLAB есть специальный toоl, чтобы самому не программировать, в котором заложены ну не меньше пары десятков всяких рапределений, и который позволяет определить какое из них лучше всего фитит распределение ваших данных.
С этого следовало бы и начать всем кто проверяет данные избиркома "на статистику". Может они это и сделали, но не приводят в своих статьях, поскольку, как я думаю, не хотят загружать техническими деталями, чтобы было понятно и неспециалистам.
"Выступая на сессии отделения АН, надо говорить так чтобы поняли не только академики, но и их жены" (В. Гинзбург)
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2011-12-12 05:42 am (UTC)no subject
Date: 2011-12-14 01:22 pm (UTC)no subject
Date: 2011-12-12 06:00 am (UTC)http://www.gazeta.ru/science/2011/12/10_a_3922390.shtml
no subject
Date: 2011-12-12 06:20 am (UTC)(определение ЦПТ http://ru.wikipedia.org/wiki/%D0%A6%D0%B5%D0%BD%D1%82%D1%80%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D1%82%D0%B5%D0%BE%D1%80%D0%B5%D0%BC%D0%B0)
Условия ЦПТ означают, что у партии должна быть примерно одинаковая поддержка по ВСЕЙ стране, по всем ее регионам. Но очевидно, что это не так . Есть регионы(густонаселенные) где поддержка ЕР существенно выше чем средняя по стране(в районе 40%). "Мю" существенно отличается в некоторых регионах, в большую сторону. Причем есть вполне очевидные объяснения почему она там у них выше безо всяких фальсификаций.
no subject
Date: 2011-12-12 07:31 am (UTC)Но Вы правы в том, что разрез "по участкам" не учитывает специвику структуры населения.
Т.е. (условно, только для пояснения) если за какого-то кандидата очень активно и охотно голосуют военные, а другие слои практически не голосуют , то его голоса по участкам будут распределяться совершенно диким образом.
В большой стране, с учетом всех слоёв населения, это, видимо,"смажется". (Но осадок останется).
(no subject)
From:(no subject)
From:no subject
Date: 2011-12-12 08:55 am (UTC)Допустим, что те, кому все по... и они не ходят на выборы, если их всё-таки на выборы загнать, голосуют в основном за ЕР.
Просто потому что им по..., и они ничего не хотят менять.
В этом случае ЕР, задействовав административный ресурс для того, чтобы обеспечить явку, одновременно получает бонус к своим голосам.
По-моему, эта теория также объясняет все факты - и, кстати, может быть подвержена фальсификации (проверке). Достаточно опросить большое количество народу, приписанное к разным участками - ходили ли они на выборы или нет. Можно даже не спрашивать, за кого голосовали. И сравнить статистику с явкой по участкам.
При этом, если выяснится, что голосовать ходило куда меньше народу, чем отмечено на участке - это, наоборот, аргумент в сторону приписок.
no subject
Date: 2011-12-12 09:10 am (UTC)Хочется раскрыть механизьм такого загоняния. Желательно чтоб это был рассказ от первого лица, а не ОБС.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From: (Anonymous) - Date: 2011-12-16 12:23 am (UTC) - Expandno subject
Date: 2011-12-12 01:01 pm (UTC)Фальсификации, разумеется, доказываются в юридическом смысле этого слова не статистиками, а прокурорами. Берется председатель УИК с подозрительными результатами, сажается на 10 суток в СИЗО по подозрению в нарушении избирательных прав граждан. А вот на предмет выявления подозрительных участков статистика очень даже может помочь:)
Логнормальное распределение ИМХО не при чем.
no subject
Date: 2011-12-12 01:46 pm (UTC)(no subject)
From:(no subject)
From:no subject
Date: 2011-12-12 10:36 pm (UTC)no subject
Date: 2011-12-13 01:12 am (UTC)Математика интересна только чтобы получить некоторые оценки.
no subject
Date: 2011-12-13 06:47 am (UTC)расхождений протоколов -- пока 66 случаев на всю страну.
правда, сутки назад было 50, т.е. они ещё растут.
но пока количество не очень впечатляет.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2011-12-13 01:14 am (UTC)"Почему у вас все опечатки против советской власти? Была ли у вас когда-либо опечатка за советскую власть?"
no subject
Date: 2011-12-13 07:57 am (UTC)Емнип : в теоретической статистике постуллируется происхождение любого
конкретного распределения от семейства элементарных распределений.
Аномальность распределения трактуется либо как функция от распределения
либо как смесь распределений разного типа. В прикладной же распределение
есть модель, т.е. что угодно. Так что суждение зависит от подхода в рамках
которого живет.
no subject
Date: 2011-12-14 02:53 pm (UTC)Есть масса т.н. "аномалий", которые нельзя объяснить с т.з. "теории фальсификации". Например, наличие участков со 100%-й явкой в Москве. Теория фальсификации намекает, что на некоторых участках, при средней явке 50% нагло дописали 50% неявившихся - и наверняка в пользу ЕР. Но если полазить по Сводному отчету ЦИК, и найти такие участки - то обнаруживаешь, что во-первых, на таких участках списочный состав на порядок ниже среднего (200-300 чел.), а результат ЕР часто хуже среднего. Что ж за фальсификация такая? В чем ее смысл? Вбрасывать 100 бюллетеней, которые в рамках ТИК НИКАКОГО влияния не окажут? Да еще и против ЕР?
Зато естественными причинами это объясняется легко. Все такие участки - особенные, скорее всего - учреждения здравоохранения, может, еще какие закрытые учреждения. И то, что в больнице явка близка к 100% - понятно и естественно. Во-первых, там скучно, а выборы - какая-никакая развлекуха. А во-вторых, когда тебя лично главврач приглашает - надо иметь очень ВЕСКИЕ причины, что бы не сходить.
Что-то подобное на заграничных участках. Как правило, там если уж ты зарегистрировался - то и на выборы пойдешь, иначе на фига было мучиться? Ну и например УИК 5498: явка 100%, Коммунисты 40%, ЕР - 25%; УИК 5499: явка 100%, Яблоко 42%, ЕР 18% - это ФАЛЬСИФИКАЦИЯ? Со стороны правящей партии? Или все-таки объясняется естественными причинами?
Или например, у Шпилькина на рис. 13 - на 80% пик и для ЕР, и для ВСЕХ остальных партий, как вместе, так и по отдельности. Ну и что это за пропорциональный вброс в рамках "теории фальсификации"? Зато естественными причинами это объясняется опять легко. Так же как и наличие пиков на распределении участков по явке. Просто существуют РАЗНЫЕ типы участков, с РАЗНЫМ характерным поведением электората. И для КАЖДОГО ТИПА, если сделать выборку - наверняка получилось бы нормальное распределение явки. Например, в Чечне и на зарубежных участках была бы нормальная "гауссоида" между 99 и 100%, в других нацреспубликах - с пиком на 90%, в больницах - 95%, в сельской местности - 80%. При сложении и получается "аномальная" кривая. С пиками в соответствующих местах. При этом на "специфических" участках списочный состав, как правило, значительно меньше, так что на общий результат это влияет мало.
А фальсификации безусловно были. Это даже не фальсификации, а такая организация процесса, при котором формирование органов власти происходит не на выборах, а перед ними, а выборы лишь завершают процедуру, оформляют результат. И для доказательства этого не надо никаких высосанных из пальца "графиков", надо немножко пожить в этой стране. У каждого практически близкие или дальние знакомые работали в избирательных комиссиях, наблюдателями, депутатами, и эту кухню просто ВСЕ ЗНАЮТ.
Аскер
Любопытная точка зрения:
Date: 2011-12-15 12:19 pm (UTC)"Попробую забить последний гвоздь в гроб так называемой "гребёнки Чурова", она же "лестница Чурова" (...)
Подытожим. Мы не обнаружили ни одного факта, говорящего в пользу гипотезы.
Против гипотезы говорит тот факт, что "всплески" являются исключительно узкими, это значит что результаты "подгоняются" абсолютно точно к "заданной" цифре.
Против гипотезы говорит тот факт, что каждый всплеск сопровождается впадинами такой глубины, что высота всплеска примерно равна сумме глубин окружающих его впадин. Именно поэтому при построении графика с более высоким порогом квантования мы не наблюдаем вообще никаких аномалий в районе "круглых" цифр.
Я не знаю, почему такие очевидные выводы не были сделаны исходными авторами "сенсаций". Возможно, их ввело в заблуждение отсутствие существенных впадин на их графиках в районе выбросов (что меня несколько удивило). Скорее всего, это баг в тех программах, которые они использовали для построения графиков, либо банальные ошибки в вычислениях. Во всяком случае, все вычисления у меня абсолютно элементарны и прозрачны, можете сами скачать данные и проверить".
no subject
Date: 2012-02-16 10:28 pm (UTC)http://pivopotam.livejournal.com/45842.html
не иначе как в старой доброй англии заносят бюллетени ящиками
читать до полного просветления