Metapesquisadores criam IA que domina a Diplomacia, enganando jogadores humanos

Prolongar / Uma captura de tela de um jogo online de Diplomaciaincluindo um diálogo de bate-papo em execução, fornecido por um pesquisador do Cicero.

Na terça-feira, Meta AI anunciado o desenvolvimento de Cicero, que afirma ser a primeira IA a atingir desempenho de nível humano no jogo de tabuleiro estratégico Diplomacia. É uma conquista notável porque o jogo requer profundas habilidades de negociação interpessoal, o que implica que Cícero obteve um certo domínio da linguagem necessário para vencer o jogo.

Mesmo antes do Deep Blue vencer Garry Kasparov no xadrez em 1997, os jogos de tabuleiro eram uma medida útil de realização da IA. Em 2015, outra barreira caiu quando a AlphaGo derrotado Vá mestre Lee Sedol. Ambos os jogos seguem um conjunto relativamente claro de regras analíticas (embora as regras de Go sejam normalmente simplificadas para IA de computador).

Mas com Diplomacia, uma grande parte da jogabilidade envolve habilidades sociais. Os jogadores devem mostrar empatia, usar linguagem natural e construir relacionamentos para vencer – uma tarefa difícil para um jogador de computador. Com isso em mente, Meta perguntou: “Podemos construir agentes mais eficazes e flexíveis que possam usar a linguagem para negociar, persuadir e trabalhar com pessoas para alcançar objetivos estratégicos semelhantes aos humanos?”

Segundo Meta, a resposta é sim. Cícero aprendeu suas habilidades jogando uma versão online de Diplomacia sobre webDiplomacy.net. Com o tempo, tornou-se um mestre no jogo, supostamente alcançando “mais que o dobro da pontuação média” dos jogadores humanos e classificando-se entre os 10% melhores das pessoas que jogaram mais de um jogo.

Para criar o Cicero, a Meta reuniu modelos de IA para raciocínio estratégico (semelhante ao AlphaGo) e processamento de linguagem natural (semelhante ao GPT-3) e os reuniu em um único agente. Durante cada partida, Cícero observa o estado do tabuleiro e o histórico da conversa e prevê como os outros jogadores irão agir. Ele elabora um plano que executa por meio de um modelo de linguagem que pode gerar um diálogo semelhante ao humano, permitindo a coordenação com outros jogadores.

A block diagram of Cicero, the <em>Diplomacia</em>-playing bot, fornecido pela Meta.” src=”https://cdn.arstechnica.net/wp-content/uploads/2022/11/Visual_UnderTheHood-640×907.jpg” width=”640″ height=”907″ srcset= “https://cdn.arstechnica.net/wp-content/uploads/2022/11/Visual_UnderTheHood-1280×1813.jpg 2x”></a><figcaption class=
Prolongar / Um diagrama de blocos de Cícero, o Diplomacia-playing bot, fornecido pela Meta.

Meta AI

Meta chama as habilidades de linguagem natural de Cícero de “modelo de diálogo controlável”, que é onde reside o coração da personalidade de Cícero. Como o GPT-3, o Cicero extrai de um grande corpus de texto da Internet extraído da web. “Para construir um modelo de diálogo controlável, começamos com um parâmetro de 2,7 bilhões BARTmodelo de linguagem semelhante pré-treinado em texto da internet e ajustado em mais de 40.000 jogos humanos em webDiplomacy.net,” escreve Meta.

O modelo resultante dominou as complexidades de um jogo complexo. “Cícero pode deduzir, por exemplo, que mais tarde no jogo precisará do apoio de um determinado jogador”, diz Meta, “e então elaborar uma estratégia para ganhar o favor dessa pessoa – e até mesmo reconhecer os riscos e oportunidades que esse jogador vê do seu ponto de vista particular”.

Pesquisa Cícero da Meta apareceu na revista Science sob o título, “Jogo em nível humano no jogo da Diplomacia combinando modelos de linguagem com raciocínio estratégico.”

Quanto a aplicações mais amplas, a Meta sugere que sua pesquisa Cicero poderia “diminuir as barreiras de comunicação” entre humanos e IA, como manter uma conversa de longo prazo para ensinar uma nova habilidade a alguém. Ou pode alimentar um videogame onde os NPCs podem falar como humanos, entendendo as motivações do jogador e se adaptando ao longo do caminho.

Ao mesmo tempo, essa tecnologia pode ser usada para manipular humanos, passando-se por pessoas e enganando-as de maneiras potencialmente perigosas, dependendo do contexto. Nesse sentido, a Meta espera que outros pesquisadores possam desenvolver seu código “de maneira responsável” e diz que tomou medidas para detectar e remover “mensagens tóxicas neste novo domínio”, o que provavelmente se refere ao diálogo que Cícero aprendeu com os textos da Internet. ele ingeriu – sempre um risco para grandes modelos de linguagem.

Meta forneceu um site detalhado para explicar como o Cicero funciona e também abriu o código do Cicero no GitHub. Conectados Diplomacia os fãs – e talvez até o resto de nós – podem precisar ficar atentos.


Source: Ars Technica – All content by arstechnica.com.

*The article has been translated based on the content of Ars Technica – All content by arstechnica.com. If there is any problem regarding the content, copyright, please leave a report below the article. We will try to process as quickly as possible to protect the rights of the author. Thank you very much!

*We just want readers to access information more quickly and easily with other multilingual content, instead of information only available in a certain language.

*We always respect the copyright of the content of the author and always include the original link of the source article.If the author disagrees, just leave the report below the article, the article will be edited or deleted at the request of the author. Thanks very much! Best regards!