| RathaR |
1.08.2009 13:30
Сообщение
#1
|
![]() Знаток ![]() ![]() ![]() ![]() Группа: Пользователи Сообщений: 346 Пол: Мужской Реальное имя: Иван Репутация: 7 |
Вот, меня весьма заинтересовала идея Lappa , о написании кокой нибуть вариации монополии, с самообучающимся ИИ. Погуглил я на эту тему, но единственное что нашёл, это описание принципа роботы с крестиками-ноликами и много бредней про то что машины зохавают мир
Поэтому и решил создать тему здесь, об самообучении ИИ в общем, и об монополии в частности. Так вот, как я это представляю: допустим в игре участтвуэт самообучающийся ИИ, и человек/жёстко заданый ИИ. Весь процес самообучения происходит следующим образом (поправте или скоординируйте меня если неправ): Человек/жёстко заданый ИИ делает ход, попадая на определённый участок(правила монополии я думаю всем известны Вот так и будет продолжаться игра, кроме того, самообучающийся ИИ будет записывать каждый раз когда его опонент заложит какой либо участок, или возьмёт зсуду в банке, и в случае возникновения похожей ситуации, будет поступать также, брать похожую зсуду, закладывать примерно равноценный участок. Ставить дома и отели на своих участках он тоже будет только после того как "научиться " этого у опонента. Хух, теперь о следуюющем После всего этого у меня возник ряд вопросов: 1) Всётаки монополия - это не крестики нолики, и каждая игра займёт время, такчто обучаться он будет медленно, в связи с этим появляеться необходимость сделать "автоматический режим " в игре, когда она будет играть сама з собой опр кол-во партий, чтобы достигнуть того или иного уровня знаний? 2) А вообще реально ли это зделать?, я имею в виду, не будет ли это всё занимать огромные обьёмы памяти, и не будет ли ИИ думать по 10 мин? ( прошу дать хоть приблизительную оценку, по даному алгоритму, потомучто мне самому очень тяжело об этом судить) 3) Правильно я уразумел алгоритм хотябы в общих чертах? Очень прошу поправить меня там где неправ И с удовольствием выслушаю другие идеи по поводу этой же темы, или алгоритма. И вообще мне кажеться что всё это не очень сложно в реализации, сложности могут возникнуть лишь с интерфейсом, графикой, а в общих чертах алгоритм сравнительно прост, или я не прав? З.Ы. Lappу +1 за идею (уж очень она мне понравилась Сообщение отредактировано: RathaR - 1.08.2009 17:15 -------------------- Считающий себя единственым здравомыслящим человеком сумасшедший? Если да, возможно я псих...
Пусть умолкнет всякий критик! Я - системный аналитик! |
![]() ![]() |
| RathaR |
9.08.2009 12:17
Сообщение
#2
|
![]() Знаток ![]() ![]() ![]() ![]() Группа: Пользователи Сообщений: 346 Пол: Мужской Реальное имя: Иван Репутация: 7 |
Цитата Что ж, это можно условно принять за исходную идею. Но заметь, что ты тут производишь НЕСКОЛЬКО сравнений. И тебе нужно ввести некоторое соотношение порядка в МНОГОМЕРНОМ пространстве. Иначе говоря, если сравнить две точки (x,y) на плоскости, то что больше: точка (3,7) или точка (2,9)? Если сравнивать только по расстоянию до точки (0,0), то будет ли это соответствовать цели? Я так понял что речь идёт о приоритетах при сравнении... По этому поводу меня сразу возникла асоциация с тем как я решал подобную проблему когда писал покер на костях, тогда я определял так называемую "силу" комбинации, или её приоритетт, незнаю как сказать точнее, (например стрит - 4 ед, каре - 5 ед, пара - 2, тройка - 3 и тд. ) а затем к выпавшей комбинации прибавлял само значение костей * 0,1 для того чтобы определить победителя при равных комбинациях(например 3,3,3=3+3*0,1=3,3 и это меньше чем скажем 4,4,4=3+0,4*0,1=3,4). В монополии я росчитывал поступать по аналогии, высший приоритет имеет например кол-во денег, а затем уже кол-во участков. Если чесно то сейчас у меня только очень туманные соображения по этому поводу, но почемуто во мне живёт уверенность в том что можно както реализовать ИИ способного учиться на своих ошибках, или хотябы так сказать "интересного, незаурядного" противника и в монополии Но апетит приходит во время еды -------------------- Считающий себя единственым здравомыслящим человеком сумасшедший? Если да, возможно я псих...
Пусть умолкнет всякий критик! Я - системный аналитик! |
RathaR Теория самообучающейся программы 1.08.2009 13:30
Lapp +1 за идею (уж очень она мне понравилась :) )bltzИ... 2.08.2009 9:02
RathaR
эм...я,не сильно розбираюсь в теории графов, скаж... 2.08.2009 13:29
Lapp эм...я,не сильно розбираюсь в теории графов, ... 8.08.2009 1:28
RathaR
Я обещал "покумекать и написать" - вот,... 8.08.2009 23:19
Гость > признателен что эта тема не канула в небытие ... 9.08.2009 3:16
Lapp Предыдущий пост мой. Странно, вроде я входил... 9.08.2009 3:24
andriano 1. Под обучением обычно понимается совсем не тот п... 14.09.2009 12:26
Lapp 1. Под обучением обычно понимается совсем не тот п... 15.09.2009 0:52
andriano ...ходы ... победителя считаются хорошими, и их ве... 15.09.2009 17:36
Lapp Ну, в частном случае может быть и так.Я и не говор... 16.09.2009 1:44
RathaR
[b]RathaR, ты следишь за темой? И как дела с тво... 16.09.2009 19:03
andriano Я не спец в этой терминологии, но трудно согласить... 17.09.2009 17:30
Shuruper Я представляю решение этой задачи путем анализа ош... 20.09.2009 19:35
Lapp (гипотеза!)Гипотезы - это хорошо, но ты не ука... 21.09.2009 10:10
Shuruper
- вот с этого места, пожалуйста, поподробнее.. И... 21.09.2009 14:51

Lapp файл может содержать все что угодно, начиная прост... 22.09.2009 0:54
andriano
Гипотезы - это хорошо, но ты не указал ни механиз... 21.09.2009 22:15
RathaR По поводу самого алгоритма "300 коробков... 30.10.2009 15:34
Lapp может существуют другие самообучающиеся алгоритмы,... 31.10.2009 1:13
andriano Самообучение подразумевает обязательное наличие об... 31.10.2009 10:03
Lapp пришло в голову любопытное соображение: в технике ... 3.11.2009 8:42![]() ![]() |
|
Текстовая версия | 5.11.2025 5:39 |