Mais uma fronteira da computação vencida: agora é provável jogar porquê os mestres de Go!

Please enable / Bitte aktiviere JavaScript!
Veuillez activer / Por favor activa el Javascript![ ? ]

Receba os artigos diretamente no seu email


Mais uma fronteira da computação vencida: agora é provável jogar porquê os mestres de Go! 1
FOTO: Luis de Bethencourt

Por Alfredo Goldman*

Que a computação tem vencido barreiras, todos sabemos, mas uma medida interessante desse progresso é ver porquê sistemas de computação podem vencer grandes campeões em alguns jogos de tabuleiro. Há muito tempo os computadores são capazes de competir em jogos mais simples, desde o infame jogo da velha, passando pelo tradicional jogo de damas e chegando até a jogos porquê o xadrez. Porquê isso é feito em jogos mais simples? É relativamente fácil: por serem extremamente rápidos, os computadores conseguem explorar o universo de possibilidades futuras da partida em cada jogada, procurando escolher aquela que aumente suas chances de vencer. É porquê se o computador, ao invés de fazer o conta exclusivamente da próxima jogada, “imaginasse” toda a progressão de todas as jogadas possíveis até todos os finais possíveis do jogo para escolher a melhor opção.

Porquê na maioria dos jogos o número de possibilidades é muito grande, foi criada uma técnica para diminuir o volume de casos a considerar: a técnica MiniMax. A cada vez, o computador considera somente a melhor jogada provável e simula também exclusivamente as melhores jogadas possíveis do contendor. Esse tipo de técnica foi bastante eficiente até meados da dez de 90, mas ainda havia um duelo a ser vencido: o jogo de Xadrez. Finalmente, em 1996, um sistema da IBM foi quase capaz de lucrar do rabi mundial Garry Kasparov e, em 1997, uma versão melhorada o venceu. Com a evolução dos computadores, um programa para jogar xadrez devotado foi capaz de lucrar do vencedor mundial em 2006,...

rodando em um PC com processador dual-core.

No entanto, embora o Xadrez seja considerado um jogo sofisticado e dependente da “lucidez” dos jogadores, o sucesso dos computadores no xadrez não encerrou o peça; restava ainda o jogo de Go. Graças à enorme quantidade de possibilidades de colocação de peças, esse jogo tem um universo enorme de variações possíveis, o que não permite uma boa exploração e previsão das jogadas futuras. Assim, apesar das regras extremamente simples (porquê diria um camarada meu, basta saber descrever até 1), Go continuava sendo um duelo para os computadores e mesmo jogadores medianos eram capazes de derrotar os melhores sistemas.

Pois é, isso mudou nesta semana. Um sistema desenvolvido pela Google, o AlphaGo, foi capaz de derrotar o vencedor europeu de Go, em condições de campeonato, por cinco vezes seguidas! O duelo com o vencedor mundial está marcado para março.

E qual a relação disso com o Software Livre? No início deste ano, comentamos sobre a liberação do código da Google ligado a Deep Learning. Embora o AlphaGo tenha sido desenvolvido especificamente para o jogo, a abordagem básica não é específica, mas sim se utiliza dos mesmos princípios e partes do código do TensorFlow, gerando um progressão que nem mesmo os pesquisadores envolvidos pensavam que aconteceria tão rapidamente. A técnica usada, tal qual a MiniMax, também é relativamente simples: primeiro o AlphaGo foi treinado usando jogadas de experts de Go (murado de 30 milhões). Dessa forma o sistema deveria ser capaz de jogar no mesmo nível de um expert humano. Para superá-lo, o sistema continuou jogando contra si mesmo. Nesses “jogos virtuais”, o AlphaGo realizava experiências com pequenas variações nas jogadas, aprendendo sutilezas do jogo para além daquelas com as quais foi treinado. Esse mecanismo pode ser ajustado para um sem-número de outras aplicações e, graças às ferramentas abertas existentes, o progressão oferecido pela técnica está alcançável a todos os especialistas em lucidez sintético.

* Alfredo Goldman é Professor de Ciência da Computação no IME/USP e diretor do CCSL-IME/USP

Com informações de (Manancial):Código Aberto