Bagaimana Komputer Akhirnya Mampu Menjadi Pemain Poker Terbaik

Dua belas hari ke turnamen poker teraneh dalam hidup mereka, Jason Les dan teman-temannya kembali ke hotel mereka, melihat-lihat dan kelelahan. Meringkuk di atas tumpukan taco, mereka menyusun strategi, seperti yang mereka lakukan setiap malam. Dengan sekitar 60.000 tangan dimainkan – dan 60.000 yang tersisa – mereka kalah buruk dari lawan yang tidak biasa: program komputer bernama Libratus, yang menghasilkan chip hampir $ 800.000.

Itu tidak seharusnya terjadi. Pada 2015, Les dan kru pro poker telah mengalahkan program komputer serupa, memenangkan sekitar $ 700.000. Kali ini, pro pada awalnya menjaga hal-hal lebih atau kurang bahkan dengan menemukan kekurangan dalam cara komputer bermain; penggemar mengikuti Brains Vs. ini Persaingan AI di Rivers Casino di sini menempatkan peluang AI menang hanya sekitar 1 banding 4.

Tetapi pada minggu kedua, kelemahannya telah hilang; peluang kemenangan komputer meningkat. Pada Hari 1, itu bermain bagus, tapi itu tidak mengesankan, kata Les. Yang mengesankan adalah bagaimana hal ini telah dipelajari dan berkembang, betapa jauh lebih baik setiap hari. Mesin telah belajar banyak tentang cara bermain game. Dua puluh tahun yang lalu, mereka berhasil membuat catur, dan 10 tahun yang lalu mereka menjatuhkan grandmaster catur Rusia. Bahkan permainan Cina telah dipecahkan. Tapi poker tetap kuat di tangan manusia.

Itu karena tidak seperti catur dan catur, di mana semua bagian terlihat, poker adalah permainan dengan pengetahuan terbatas dan ketidakpastian, kartu tersembunyi dan gertakan. Ini mungkin lebih benar untuk kehidupan, yang mungkin menjelaskan mengapa sulit bagi chip silikon untuk memahami. AI telah memiliki banyak masalah dengan poker, kata Noam Brown, seorang mahasiswa pascasarjana di Carnegie Mellon University yang mengembangkan Libratus dengan ilmuwan komputer CMU Tuomas Sandholm. Ini adalah cawan suci dari permainan informasi yang tidak sempurna.

Mampu Menjadi Pemain Poker Terbaik

Hasil gambar untuk gambar poker

Kemenangan untuk Libratus, kata Brown, tidak akan menjadi ancaman besar bagi para pemain poker manusia. Otaknya adalah superkomputer yang harganya jutaan dolar per tahun untuk berlari, jadi menggunakannya untuk bermain poker tidak akan menjadi cara yang bagus untuk menghasilkan uang. Tapi Libratus bisa menjadi langkah menuju membantu kecerdasan buatan menangani ketidakpastian secara lebih luas.

Itu karena poker bukan hanya permainan kebetulan. Juga tidak perlu bisa membaca ekspresi wajah lawan, meskipun Hollywood mungkin ingin kita percaya sebaliknya. Apa yang memandu keputusan Libratus adalah matematika yang kuat, matematika yang dapat diterapkan pada pelelangan, negosiasi, keuangan, keamanan, dan arena dunia nyata lainnya di mana informasi disembunyikan.

Matematikawan serius telah lama terpesona oleh poker. John von Neumann, seorang pelopor dalam teori permainan, cabang matematika yang berhubungan dengan kompetisi, menjelajahi seluk beluk permainan kartu di awal abad yang lalu. Begitu juga John Nash, yang perjuangannya dengan skizofrenia digambarkan dalam film A Beautiful Mind. Pada tahun 1950, Nash menerbitkan sebuah makalah yang menunjukkan bahwa ada strategi terbaik untuk banyak permainan, termasuk poker satu lawan satu, terlepas dari bagaimana lawan Anda bermain. Strategi itu, yang sekarang disebut ekuilibrium Nash, mungkin tidak selalu menang, tetapi itu lebih baik daripada pendekatan lainnya.

Menemukan keseimbangan Nash untuk gim sederhana seperti tic-tac-toe atau rock, kertas, gunting itu mudah. Menemukannya untuk permainan yang serumit poker itu sulit. Kecerdasan buatan yang dikembangkan di Universitas Alberta telah mampu menguasai versi dasar poker yang disebut batas kepala Texas Hold ‘em, di mana dua pemain bersaing satu sama lain dengan kemampuan bertaruh terbatas. Tetapi tangan poker head-up tanpa batas, di mana para pemain dapat bertaruh sebanyak yang mereka inginkan, melibatkan sejumlah besar kemungkinan: 10 pangkat 160, yang merupakan diikuti oleh 160 nol. Itu lebih dari perkiraan jumlah atom di alam semesta. Untuk permainan poker yang melibatkan lebih dari dua orang, kemungkinan menjadi tidak terhitung.

Orang-orang mulai dari akademisi universitas hingga pensiunan yang antusias telah mencoba menciptakan kecerdasan buatan untuk menyederhanakan masalah. Setiap Februari, mereka mengadu kreasi mereka satu sama lain di kompetisi mesin saja. Pemenang dinyatakan, tetapi seseorang yang hanya melipat masing-masing tangan akan melakukan lebih baik daripada banyak AI ini. Setiap tahun, komputer bermain miliaran tangan melawan satu sama lain, kata Jonathan Schaeffer, seorang ilmuwan komputer Universitas Alberta yang membantu memulai kontes. Setiap tahun, kami melihat peningkatan bertahap.

Selain orang-orang di belakang Libratus Carnegie Mellon, hanya tim Alberta yang mengklaim mampu mengalahkan manusia. Program Kanada, yang disebut DeepStack, menggunakan jaringan saraf, perangkat lunak yang bekerja sedikit seperti otak manusia, membuat perkiraan cepat bahwa penciptanya membandingkan dengan intuisi dan mempertimbangkan kembali pilihannya ketika kartu baru diletakkan di atas meja. Sebuah makalah penelitian diposting pada Jan. 10 mengklaim bahwa DeepStack bermain 40.000 tangan melawan puluhan pemain poker dan menang. Menjadi program komputer pertama yang mengalahkan pemain situs poker online terbaru profesional di Texas Hold ‘em tanpa batas.

Memiliki Keberuntungan Bermain Poker

Gambar terkait

Tetapi pro poker berhadapan melawan Libratus menepis kemenangan itu, menunjukkan bahwa orang-orang yang direkrut untuk studi itu bukan spesialis dalam satu-satu, poker kepala-up. Orang-orang itu tidak memainkan tipe permainan kami, kata Dong Kim, salah satu pemain poker berisiko tinggi di turnamen. Mereka mungkin memainkan jenis-jenis poker lain, tetapi bahkan para pemain kecil di Internet akan menghancurkan mereka. Para peneliti Alberta menolak berkomentar, sambil menunggu penerimaan makalah mereka dalam jurnal ilmiah.

Libratus bersiap untuk pertandingan epiknya dengan pertama-tama memainkan triliunan tangan melawan dirinya sendiri untuk membangun basis data tentang pilihan mana yang cenderung bekerja lebih baik daripada yang lain. Saat bermain, ia berhenti sekali di tengah masing-masing tangan untuk memikirkan kembali strateginya, menilai tidak hanya gerakan apa yang dapat dibuatnya tetapi juga gerakan lain yang bisa dibuat jika situasinya berbeda.

Metode ini telah menyebabkan keputusan yang tampaknya tidak biasa oleh Libratus di hadapan kebijaksanaan daftar agen poker terpercaya, kata Sandholm. Ketika lawan menaikkan taruhan pada taruhan terakhir, misalnya, komputer dapat mencocokkan kenaikan itu, bahkan dengan kartu lemah yang tidak mungkin menang. Jika anak perempuan saya yang berusia 10 tahun melakukan langkah itu, saya akan mengajarinya untuk tidak melakukannya, kata Sandholm. Tetapi ternyata ini adalah langkah yang baik. Ini membantu untuk menangkap gertakan.

Bookmark the permalink.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *