dobrokhotov ([personal profile] dobrokhotov) wrote2010-09-02 01:24 am

Разгадка

Пришло время раскрыть карты. Наверное, все кто уже хотел посмотреть правильный ответ этой задачки, уже сделали это. Но суть в том, что, как показывает практика, чтение правильного ответа не всегда помогает понять суть этого парадокса. Я попытаюсь объяснить это как можно проще.

Правильная стратегия - менять выбор, потому что тогда вероятность попасть на машину 2 из 3, а не 1 из 3, как если настаивать на своем выборе. Почему? Да очень просто.

Многие думают, что когда ведущий открывает дверь с козой, то вероятность надо пересчитывать, исходя из того, что закрытых двери осталось две. Но так было бы только в том случае, если бы после первого выбора двери "перетасовывались". Интуиция не видит этого различия, поэтому-то и нам так сложно это понять.

Чтобы направить интуицию в правильное русло, представьте что дверей 10 тысяч - огромный небоскрёб с дверьми. И вот вы наугад называете номер комнаты. Вы даже и не надеетесь угадать, потому что это будет чудо из чудес. И тогда ведущий, согласно правилам, открывает все остальные двери кроме одной, той, за которой желанный приз. То есть, конечно, есть минимальная вероятность, что вы сразу угадали, и за оставшейся дверью коза, но во всех остальных случаях, там приз (а этих остальных случаев 9999). То же самое с тремя дверьми. Конечно, может быть вы сразу угадали, но во всех остальных случаях, приз за оставшейся дверью. Этих остальных случаев 2, поэтому вероятность выигрыша при смене выбора 2/3.

Судя по комментариям, некоторые все-таки смогли додуматься сами до правильного ответа, поняв из текста поста что тут есть подвох. Многие, правда давали экстравагантные ответы - мол, если настаивать на своём - вероятность 1 из 3, а если выбрать оставшуюся дверь - 1 из 2. Кто-то даже предположил, что если настаивать на своем, то вероятность даже больше (видимо, очень настойчивые по натуре люди).

Не знаю, станет ли кто-то после такого теста умнее, но уж точно это хороший психологический тренинг для излишне самоуверенных людей. Как никак, наука начинается с сомнения.

[identity profile] dobrokhotov.livejournal.com 2010-09-02 07:38 am (UTC)(link)
Понять почему в первом варианте 1 к 3 я ещё могу, а причем тут день недели уже не въезжаю.

[identity profile] ghee.livejournal.com 2010-09-02 07:54 pm (UTC)(link)
День недели, в который рождается ребёнок, не зависит от его пола. Кроме того, сообщение указывает на день рождения любого из двух детей. Значит два события, которые мы интуитивно считаем разными, "старший родился во вторник" и "младщий родился во вторник", составляют лишь один вариант в пространстве возможностей. Асимметрия возникает именно за счёт этого обобщения двух вариантов.

http://www.stat.columbia.edu/~cook/movabletype/archives/2010/05/hype_about_cond.html#comment-954933

[identity profile] dobrokhotov.livejournal.com 2010-09-02 10:54 pm (UTC)(link)
По ссылке слишком многбукв. почему обобщение двух вариантов рождает асимметрию?

Если это рождает ассиметрию, то хотел бы я знать - факт рождения одного из сыновей во вторник, повышает или понижает вероятность того, что второй ребёнок - девочка?

[identity profile] ghee.livejournal.com 2010-09-03 08:09 am (UTC)(link)
Я дал неправильное объяснение. Пары событий Мвторник-Мпонедельник и Мпонедельник-Мвторник разные, ведь мы подсчитываем варианты, упорядочивая детей по возрасту. Лишь событие Мвторник-Мвторник не имеет зеркальной неодинаковой пары, так как не зависит от порядка рождения.

Всех вариантов 27: 6 Мвторник-Мневторник, 6 Мневторник-Мвторник, 1 Мвторник-Мвторник, 7 Мвторник-Длюбой, 7 Длюбой-Мвторник. Из них вариантов, подходящих к требованию, что другой ребёнок должен быть мальчиком, -- 13.

Вариантов, когда другой ребёнок был девочкой -- 14, т.е. чуть больше, чем вариантов с другим ребёнком-мальчиком. Эти цифры не могут применяться к ожиданию рождения в будущем, так как условие подразумевает, что даты рождения обоих детей уже известны.


[identity profile] ghee.livejournal.com 2010-09-02 08:05 pm (UTC)(link)
Условие первой задачи передано неточно. Вероятность "1/3" того, что другой ребёнок -- мальчик, верна для сообщения "один из двух детей -- мальчик", а не для сообщения "первый из двух детей -- мальчик".

Первое сообщение подразумевает пространство событий { ММ, МД, ДМ }. Последнее сообщение подразумевает другое пространство, { ММ, МД }.

[identity profile] ghee.livejournal.com 2010-09-02 08:18 pm (UTC)(link)
(В своих обозначениях пространства событий я указываю возможные пары детей, в которых первое место занимает старший ребёнок).

(В случае со вторничным мальчиком вероятность приблизилась к 1/2 из-за расширенного набора вариантов. Я приписываю способ подсчёта событий отличию вероятности от 1/2, а не отличию от 1/3).

[identity profile] ghee.livejournal.com 2010-09-02 08:24 pm (UTC)(link)
Следуя одному из комментариев по ссылке, которую я привёл, нахожу, что сообщение, "один из них -- мальчик в красных носках" уже приближает вероятность того, что другой -- мальчик, к 1/2. Это потому, что пространство цветов всех выпускаемых в мире носков достаточно большое.

[identity profile] synergik.livejournal.com 2010-09-07 12:10 pm (UTC)(link)
Извиняюсь что так долго не писал, проблемы с интернетом сейчас...

Я всё ещё убежден, что просто добавляя ненужную информацию, типа ребёнок робился 5 октября или родился во вторник ничего не может изменятся. Мне кажется это можно проверить простым мысленным экспериментом.

Человек идёт по улице и спрашивает прохожих. Сначала спрашивает есть ли у них ровно 2 ребёнка из которых хотя бы один мальчик. Считает количество этих людей - n. Потом спрашивают мальчик ли другой, считает количество этих людей - m. Если всё работает действительно случайно то m/n= 1/3. А теперь можете себе представить, что при встречи с теми же самыми людми вопрос затрагивал ещё и день недели рождения этого мальчика. Как вы думаете m/n от этого бы изменилось?

[identity profile] ghee.livejournal.com 2010-09-07 06:16 pm (UTC)(link)
Чтобы предвосхитить эксперимент, будем полагать, что ожидание любого из набора непересекающихся вариантов есть сумма ожиданий каждого варианта и что ожидание равновероятного из набора варианта есть единица, делённая на число эти вариантов.

Результат эксперимента зависит от того, равновероятен ли ответ "другой ребёнок -- мальчик, родился во вторник" с остальными ответами о поле и дне рождения другого ребёнка от людей, у которых один из детей -- мальчик, родившийся во вторник. Я теперь склоняюсь к вашему сомнению, потому что мне кажется, что такой ответ в два раза более вероятен, чем другие. Наверное, нужно передать это сомнение в комментариях к сообщению по ссылке.

Тогда вероятность другого ребёнка-мальчика при условии одного мальчика в красных носках тоже 1/3.

Спасибо за сомнение.

[identity profile] synergik.livejournal.com 2010-09-07 07:11 pm (UTC)(link)
Рад стараться :)

[identity profile] ghee.livejournal.com 2010-09-07 08:25 pm (UTC)(link)
Хмм, эксперимент не подтвердил наше с вами сомнение...

$ cat two-children.py 
#! /usr/bin/python
import sys, random

random.seed()

samples = 0
matches = 0
subMatches = 0

while True:
    twoChildrenAnswers = tuple( ( int( random.random() * 2 ), int( random.random() * 7 ) ) for i in range( 2 ) )
    sampleRepr = -1
    for i, answer in enumerate( twoChildrenAnswers ):
        g, dow = answer
        if ( ( g == 1 ) and ( dow == 2 ) ):
            sampleRepr = i
            break

    if sampleRepr >= 0:
        samples += 1
        for j, answer in enumerate( twoChildrenAnswers ):
            if j != sampleRepr:
                g2, dow2 = answer
                if g2 == 1:
                    matches += 1
                    sys.stdout.write( "%7d: .%06d\n" % ( samples, ( matches * 1000000 ) / samples, ) )
                    sys.stdout.flush()
                    if dow2 == 2:
                        subMatches += 1
                        sys.stdout.write( "%s %7d: .%06d\n" % ( "***", matches, ( subMatches * 1000000 ) / matches, ) )
                        sys.stdout.flush()

$ python two-children.py
[..]
***  221320: .077539
[..]
 459779: .481479
 459783: .481477


Похоже, что частота другого вторничного мальчика примерно в два раза меньше ожидания в нашем сомнении.

[identity profile] ghee.livejournal.com 2010-09-07 09:35 pm (UTC)(link)
Интуитивное объяснение: равновероятных вариантов "Мвторник, Мвторник" -- 1 из 13, а не 2 из 14 потому, что ищется хотя бы один мальчик. С такой процедурой отбора любой из вариантов "старший мальчик родился во вторник, младший мальчик родился в день недели X" равновероятен зеркальному варианту, за исключением, когда "X" -- вторник. Ситуация напоминает задачу Монти-Холла: как и выбор козы ведущим, выбор мальчика, родившегося во вторник, снижает ожидание состояшегося рождения другого мальчика во вторник.

В случае поиска среди пар детей, старший из которых -- мальчик, родившийся во вторник, равновероятных вариантов "Мвторник, Мвторник" было бы 1 из 7.

[identity profile] dobrokhotov.livejournal.com 2010-09-07 10:28 pm (UTC)(link)
какое-то запутанное объяснение. А если бы детей было 10 и 9 из них родились во вторник, то какова вероятность была бы, что и десятый родился во вторник?

[identity profile] ghee.livejournal.com 2010-09-08 04:01 pm (UTC)(link)
Если процедура отбора допустимых вариантов -- "найти семьи из n детей, где хотя бы n-1 мальчиков" и если считать упорядоченные под-варианты за разные для точности, вариантов для всех дней недели дня рождения оставшейся девочки -- ( n * 7 ), оставшегося мальчика -- ( n * 7 - 1 ). Ожидание мальчика -- ( n * 7 - 1 ) / ( 2 * n * 7 - 1 ) = 69/139, т.е. ещё ближе к 1/2, чем в семьях с 2 детьми.

[identity profile] ghee.livejournal.com 2010-09-09 05:13 pm (UTC)(link)
Менее запутанное объяснение -- в комментарии от 2 августа к статье по ссылке. Ожидание вторничного мальчика в семьях МД -- 1/7, в семьях ДМ -- 1/7, а в семьях ММ -- почти в два раза больше, 13/49.

[identity profile] synergik.livejournal.com 2010-09-29 10:47 pm (UTC)(link)
Да мне кажется я ошибся и должен согласиться с этим ужасным абсолютно конринтуитивным решением. Я повторяю ваше решение своими словами.

Всё дело в том, что представить надо себя на месте родителя двух мальчиков. Если вы идёте по улице и вас спрашивают те вопросы о которых я говорил, в особенности последний, о том родился ли ваш сын во вторник. Люди с двумя сыновьями обладают вероятностью 13/49, сказать да один из моих сыновей родился во вторник. А те у кого мальчик с девочкой 14/49 то-есть 2/7.

Так же как и в задаче с козами, исходя из позиции спрашивающего день рождения одного ребёнка не играет роли, ведь в какой-то день он родился. С козами похоже, ведь всегда можно одну дверь без козы открыть. Но если смотреть на задачу со стороны козы (или со стороны родителя с двумя мальчиками) то всё выглядит немного подругому. И всё же это очень противоречит здравому смыслу.

[identity profile] dobrokhotov.livejournal.com 2010-09-02 10:45 pm (UTC)(link)
да, я вот тоже хотел уточнить насчет слова "первый". Если оно подразумевает хронологию появления на свет, то вероятность уже будет 50%. А если "первый" - это просто первый из перечисляемых, то тогда уже 1 из 3.

[identity profile] danmer.livejournal.com 2010-09-07 08:00 pm (UTC)(link)
никак не пойму почему МД != ДМ. с точки зрения вопроса - либо два мальчика либо нет. т.е. не важно первая девочка или вторая. в любом случае ответ "нет".
более того - заранее известно, что один из детей мальчик, соответственно второй - либо мальчик, либо девочка. т.е. опять таки 1/2...