Alphagomaster

01

2017 년 10 월 19 일 구글 자회사 DeepMind 가 알파고의 새 버전을 발표했습니다. 많은 사람들은 AlpoaGo 가 인공지능 프로그램이라는 것을 알고 있지만, 그것이 사실 한 가족이라는 것을 알지 못한다. 한국 선수들을 일찍 이긴 것은 이세돌 알파 golee 였다. 우진에서 세계 챔피언을 꺾은 커제 알파고 마스터입니다. 이번 발표는 알파 고제로 (AlphaGo Zero) 로, 3 일간의 훈련을 거쳐 100: 0 의 전적으로 그의 형 AlphoGo Lee 를 꺾고, 40 일간의 훈련을 거쳐 다른 형 AlphoGo Master 를 물리쳤다.

AlphaGo Zero 이전 버전과 비교했을 때 가장 큰 차이점은 그것이 더 이상 인간의 지도에 의지하지 않는다는 것이다. 즉, 이전의 AlphaGo Lee 는 인공입력에 의존하는 대량의 바둑 스펙트럼으로 바둑을 배우는 법을 배우고, 분명히 말하면, 그것은 인간의 지도 하에 공부하는 것으로, 인간의 밀레니엄 바둑 경험으로 가르치는 학생으로 이해할 수 있다. (존 F. 케네디, 공부명언)

AlphaGo Zero 는 향상된 학습 알고리즘을 사용합니다. 즉, 더 이상 체스 스펙트럼에 의존하지 않습니다. 프로그래머는 바둑의 기본 규칙을 입력한 후 더 이상 어떤 교육도 하지 않고, 완전히 스스로 더듬어 바둑 방법을 요약하는 것은 인공지능이 자신의 방법에 따라 완전히 배우는 것과 같습니다. AlphaGo Lee 는 인간의 경험을 포기한 AlphaGo Zero 에 완패했다. 이는 인간의 경험이 AlphaGo Lee 를 오도하여 발전을 제한할 수 있다는 것을 보여준다.

알파고제로의 바둑 방식은 시작과 수관 단계에서 인간 선수와 큰 유사점을 가지고 있으며, 판속의 바둑 스타일은 확실히 인간 선수와 이전 버전의 알파고와는 크게 다르다. 바로 이런 차이로 알파고리와의 100 번의 교전에서 무패에 중립을 유지할 수 있게 하는 것이다. 다시 말해, 만약 알파고리가 예배를 하지 않았다면 ...;;;;;;;;;;;;;;;;

제로 경험 학습 외에도 알파 고제로의 또 다른 주요 특징은 이전 버전의 알파 고의 두 신경망을 하나로 통합하는 것입니다. 이전 버전의 알파 고에서는 어떻게 바둑을 잡을 수 있을까요? 전략 네트워크? 그리고? 가치 네트워크? 두 개의 신경망은 어떻게 바둑을 할 수 있는지를 계산한다. 즉, 우선? 전략 네트워크? 이전에 누적된 경험을 이용하여 현재 바둑형 중 어느 위치가 바둑에 적합한지 판단한 후? 가치 네트워크? 이러한 위치에서 바둑을 한 후의 여러 가지 가능성을 시뮬레이션하고 승률을 계산하고 결국 바둑 위치를 선택하게 된다. (윌리엄 셰익스피어, 윈스턴, 바둑, 바둑, 바둑, 바둑, 바둑, 바둑)

AlphaGo Zero 는 둘을 하나로 융합해 이전 두 네트워크의 피쳐 추출 등의 모듈을 * * * 로 사용했는데, 가능한 바둑의 위치를 계산할 때 그에 상응하는 것을 줄 수 있을까? 승률? , 효율성을 크게 향상시키고 훈련에 필요한 시간을 줄입니다. 알파고제로가 3 일 동안 훈련을 한 뒤 몇 달 동안 훈련한 알파 고레를 물리친 주된 이유 중 하나다.

인공지능은 컴퓨터 과학 분야 발전의 제고점일 뿐만 아니라 모든 업종에서 무한한 잠재력과 응용가치를 가지고 있으며, 현재 세계 각국은 보편적으로 낙관적이며, 인공지능 기술은 다음 기술 혁명의 계기로 성장할 것이다. AI 는 최종 인공지능이 혁명 수준의 전복에 이르지 못하더라도 이미 우리의 삶을 변화시키고 있다.

과거 인공지능의 진보는 소프트웨어와 하드웨어의 동시 발전을 바탕으로 한 것으로, 신경망 알고리즘은 지난 세기 중엽부터 제기됐지만, 컴퓨팅 능력에 따라 신경망 알고리즘이 더디게 발전해 왔다.

이후 하드웨어 컴퓨팅 속도가 지속적으로 향상됨에 따라 기존 소프트웨어 알고리즘이 지속적으로 구현 및 개선되고, 향상된 알고리즘은 하드웨어에 대한 요구가 높아져 하드웨어 발전을 더욱 촉진할 수 있으며, 알파 고제로의 출현은 알고리즘 업데이트에 기반을 두고 있습니다.

이전 버전의 AlphaGo 는 48 개의 TPU (구글이 심층 신경망 컴퓨팅 능력을 가속화하기 위해 개발한 칩, 한 개에 500 만 달러에 달하는 칩) 에서 몇 달 동안 공부해야 하는 반면, AlphaGo Zero 는 4 개의 TPU 와 며칠만 있으면 학습을 마칠 수 있다. 이 제로 경험 학습 능력은 단백질 접힘 및 기타 샘플이 부족한 의료 분야에 적합하여 실험 샘플 부족으로 인해 연구 진행이 느려지는 문제를 잘 해결할 수 있다. 향후 관련 연구에서는 규칙을 입력하고 알파 고제로의 능력을 이용해 시뮬레이션을 할 수 있으며, 마지막으로 제한된 샘플을 이용해 검증하면 된다.

알파고가 점차 업그레이드되는 길

이야기가 여기까지 이야기하면서 구글의 두터운 기술력과 영리한 비즈니스 정신에 감탄할 수밖에 없었다. 알파고는 태어날 때부터 deepmind 팀의 세심한 포장을 받았는데, 자세히 생각해 보면? 도시 루틴이 깊습니까? 。

알파고의 등장은 저단 프로바둑을 처음 이긴 때부터 예열하거나 투기하기 시작했고, 인간 정상의 고수 이세돌 승리에 이르기까지 충분히 화려하다. (윌리엄 셰익스피어, 템플린, 자신감명언) (윌리엄 셰익스피어, 윈스턴, 자신감명언) 그러나 4 대 1 의 점수는 여전히 인류에게 희망의 빛을 주었다. 이 유일한 승판에서 이세돌 칼은 빗나가서 알파고를 직접 몰아냈는가? 뇌 단락? 이 시점에서 알파고는 충분히 강력하지만 아직 완벽하지 않다는 것을 알 수 있다. (윌리엄 셰익스피어, 햄릿, 건강명언) 이후 각 길의 인류 고수들은 침상에서 담력을 맛보기 시작했고, 알파고의 길을 면밀히 연구하여 인류의 존엄성을 다시 수호하기를 희망하고 있다. (윌리엄 셰익스피어, 존엄, 존엄, 존엄, 존엄, 존엄, 존엄)

그 후, 신비한 것? 마스터? 바둑계 최고의 바둑 선수들의 대전플랫폼에서 60 승 0 패의 자랑스러운 전적을 거뒀는데, 이 마스터는 도대체 어느 쪽이 신성한지, 인간은 요괴라고 할 수 있다. 화려한 60 승이 달성될 때까지 수수께끼는 결국 밝혀지지 않았다.

이후 전 세계의 시선을 사로잡은 우진 대결, AlphaGo Master 가 커제 타격을 반격할 힘이 없었다. 커제 (WHO) 는 이미 진정한 인간 최강의 전력을 보여줬지만 여전히 알파고 (AlphaGo) 에 의해 완전히 억압되고 있다. 조금이라도 실수가 있으면 바로 알파고 (AlphaGo) 에 빠질 수 있을까? 최소 우세 승리? 전략의 함정은 더 이상 뒤집을 여지가 없다.

우진 대결 이후 인간은 바둑 분야에서 이미 완전히 탄복했다. 코제 한 명은 말할 것도 없고, 5 대 고수들이 손잡고 싸우는 것은 커제 보다 더 빨리 지고, 알파고는 한때 풍경이 무한했다.

자, 우진 초연이 막 끝나가고 있는데, 구글이 또 큰 뉴스를 만들어 냈어! 인공지능은 인간의 경험을 포기한 후 3 일 동안 독학한 알파 고제로가 인류의 수천 년 경험을 물리쳤다. 알파고의 진화판이 원본판을 물리쳤고,' 철갑강권' 에서 뜨거운 피를 흘리는 기갑육박, 한 AI 가 또 다른 더 소의 AI 에게 지고, 중국 AI 가 미국 AI 를 이긴 것이 향후 바둑 경기의 실제 장면일 가능성이 높다는 생각이 들었다. (윌리엄 셰익스피어, 햄릿, 전쟁명언) (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), 전쟁명언)