воскресенье, 18 декабря 2011 г.

Про выборы и гауссовы распределения

В заметке приводятся критерии при которых, распределение количество голосов за ту или иную партию в зависимости от участка будет удовлетворять нормальному закону, а при каких не будет. Сразу оговорюсь, что поскольку заметка не является рецензируемой в ней не будет приводится списка ссылок (их можно найти самостоятельно) исключительно по субъективным причинам – я ненавижу писать литературные обзоры и ссылаться на кого-то. Когда это от меня требует, я это делаю, но здесь приводить конкретные ссылки не собираюсь- my chair- my rules, однако кратко ситуацию опишу. Большая часть существующих на данный момент моделей рассматривает страну, как некоторую однородную систему, в которой агитация распространяется бесконечно быстро и во всех точках примерно одинакова. В данной заметке была предложена модель (безусловно, слишком грубая, чтобы претендовать на какие-то предсказания) формирования симпатии населения к той или иной партии в распределенной среде, где агитация за каждую партию ведется точечно, а скорость распространения информации ограничена. Итак, рассматриваемая модель. Динамической переменной модели (точнее полем динамических переменных) является с(x,y,t) – распределение вероятности проголосовать за каждую партию (в модели число партий было принято равным 4 для простоты). По построению сумма всех компонент вектора c равна 1. Изменение c(x,y,t) происходит по закону нелинейной диффузии, самый общий вид которого представлен ниже.
или в более привычном виде
Отсюда видно, что данное уравнение является уравнением Фоккера-Планка и позволяет оценить стационарное распределение c(x,y,t) (если кому захочется это сделать). В уравнении a(x,y,t) -- процесс агитации, Phi(c,c) - некоторый потенциал, определяющий насколько участки стоящие рядом влияют друг на друга, Xi(x,y) -- поле определяющее коэффициент диффузии С (или скорость распространения информации в точке c координатами (x,y), в модели было принято пропорциональным коэффициенту плотности населения в данной точке. Для простоты агитация задавалась случайным процессом без обратной связи.
где s – сила агитации, (Cx,Cy) – центр агитации, r — радиус агитации, (t1,t2) -временные границы агитации, дзета - случайный процесс с независимыми приращениями. Потенциал Phi(c_1,c_2)должен быть тем меньше, чем дальше c_1 от с_2. В модели он для простоты принят равным Phi(c_1,c_2) = exp(-a*|c_1-c_2|); Моделирование проводилось для двух режимов в трех разных коэффициентах диффузии. В одном случае параметры партий были примерно равны, в другом случае, для трех партий параметры были примерно равны, а для одной были в полтора раза больше. Начальные условия -- равномерное распределение симпатий к партиям. Результатами модели были гистограммы распределения участков в завимисимости от числа голосов, которое было подано за партию, а также иллюстративная карта местности каждый пиксель которой формировался по формуле. где col(i) — цвет характерный для i-той партии (Зеленый – гипотетическое яблоко, серый – гипотетические СР, красный — гипотетические КПРФ, фиолетовый – гипотетическое Едро). Количество агитационных центров действующих одновременно не должно было превышать 10. В диаграммах столбец B - "яблоко", C - "СР", D - коммунисты, E - "ЕР". Итак иллюстрации для трех различных режимов. Коэффициент диффузии всюду равен 1. Условия различны. Карта в последний день перед выборами.
Гистограмма распределения.
Польша. Условия различны. Карта в день перед выборами.
Гистограмма распределения.
Россия условия примерно одинаковы Карта в день перед выборами.
Гистограмма распределения.
Россия условия существенно различны Карта в день перед выборами.
Гистограмма распределения.
Выводы (точнее, один). 1. В случае постоянного коэффициента диффузии и в случае равных условий агитации гистограммы будут одномодальными (или "гауссовыми", но специальными тестами я не проверял). В случае одной превалирующей партии и в сильно распределенной среде гауссовость рушиться за счет, того, что гистограмма отражает вклад многих несвязанных друг с другом географически и не стационарных группировок, что полностью исключает использование (центральной предельной теоремы) ЦПТ. Замечания. 1. Весь код модели и карты диффузии доступны по адресу github.com/sdeniskos/ElectionsModel . Можете скачивать играться и изменять как вам вздумается. Код писался довольно быстро, но разобраться можно поскольку он маленький. Для компиляции используется библиотека OpenCv. Все вопросы можно задать мне здесь. Компилялось все 2010 студией. 2. Пока игрался с моделью заметил две интересные особенности. Во-первых, в случае случайной среды, где нет одного настроения радиус агитации играет существенно более важную роль чем сила агитации. Объясняется довольно просто -- даже при слабой агитации на большом радиусе образуется довольно большое количество одинаково мыслящих клеток, которые затем склоняют к своей точке зрения остальную "серую массу" (серую в смысле все партии имеют примерно равные симпатии). На европейской территории России любые политические агитации проводить бесполезно - все очень быстро размоется и забудется. 3. Что до моей политической позиции, я склоняюсь к тому, что выборы были сфальсифицрованы (но не сильно, процентов 10% голосов), но и от того, что Чуров не знает ЦПТ. Он все-таки физик (причем, ходит байка, что что-то делал в области элементарных частиц, где статистика это единственный аргумент) и знает математику лучше чем 146% гумманитариев, которые про ЦПТ прочитали в Википедии и верят теперь исключительно Гауссу. Верьте Эйлеру, он лучше. 4. Если будете использовать в полит.срачах где-то помимо рсдн обязательна ссылка и коммент, где участвуете. У меня есть некоторое свободное, но не непрерывное время, может, тоже захочется принять участие.

4 комментария:

  1. Насколько я понял, плотность населения предполагается однородной по территории? Если так, то модель абсолютно нереалистична.

    ОтветитьУдалить
  2. Нет плотность населенности бралась с реальной карты плотности населенности (лежит на гитхабе russia.bmp). Однородный случай -- пример идеальной среды, где должен быть идеальный гаусс.

    ОтветитьУдалить
  3. Хорошо. А что насчёт распределения центров агитации? Я думаю, оно должно соответствовать распределению плотности населения, или по крайней мере зависеть от него.

    Количество центров агитации = 10 - не обосновано. Вы пробовали другие значения?

    ОтветитьУдалить
  4. 1. Распределение центров агитации -- вообще говоря задача агитаторов. Сейчас делается случайно. Игры с распределением центров позволили понять одну забавную вещь. Агитировать, лучше в компактных областях, у которых либо нет соседей, либо граница достаточно узкая (Кавказ, Камчатка). В областях с высокой плотностью населения агитировать большого смысла нет - все равно забудут очень быстро (за счет высокого коэффициента диффузии агитация перемешается). Что будет, если дать возможность агитаторам играть по-умному, т.е. полностью видеть современную ситуацию и с помощью каких-то эвристик располагать центр и определять сколько ресурсов затратить на агитацию -- задача довольно интересная, но я ей не занимался.
    2. Число одновременных центров агитации равное 10 -- просто из соображений, чтобы не тормозило. Цифра сама не сильно влияет на ситуацию, влияет покрытие территории агитационными областями. Ситуация кардинально меняется, если агитацией накрыто примерно 75% процентов территории. Точный процент территории, когда наступает срыв не определял, но при 75% наступал более менее стабильно.

    ОтветитьУдалить