[Insight] Scale’s Alex Wang on the US-China AI Race - Scale AI의 수장 Alex Wang이 말하는 AI 전쟁

최근 Scale AI의 CEO인 Alex Wang의 인터뷰가 담긴 팟캐스트를 들었는데요, AI가 글로벌 권력 균형을 어떻게 변화시킬 수 있는지에 대한 Alex Wang(Scale AI의 CEO)의 인사이트가 인상적입니다.
(https://www.chinatalk.media/p/scales-alex-wang-on-the-us-china)

Scale AI라는 회사는 AI 트레이닝 데이터 라벨링을 위한 API를 제공하는 비즈니스 모델을 가지고 있는 회사입니다. 특히, 자율 주행 관련 데이터를 필요로 하는 Waymo, Uber 등의 기업이 주요 고객이라고 합니다.

본 인터뷰는 ChinaTalk 에서 진행했습니다. 인공지능의 발전에 빼놓을 수 없는 국가가 중국이죠 ? 자율주행은 물론 데이터의 절대적인 양을 따져도 미국과 가장 비등한 상대가 중국이라고 생각합니다. Alex 처럼 미국으로 가서 스타트업을 성공적으로 이끈 중국인들도 굉장히 많죠. Alex의 Scale AI는 예전에 잠깐 들었는데, 벌써 시리즈 F 투자를 받았네요. !!

Alex는 Scale의 10억 달러 자금 조성을 발표하는 이 블로그 포스트에서(https://scale.com/blog/scale-ai-series-f) Scale이 AI를 위한 세계적인 데이터 파운드리로 성장하는 것을 목표로 하고 있다고 언급했습니다. Alex는 뉴멕시코 주 로스 알라모스에서 두 명의 물리학자 부모님 밑에서 자랐고, 대학 시절에 Scale을 시작했습니다.

그는 DoD(국방부)와 협력하며 AI의 국가 안보적 함의에 대해 진지하게 고민하는 유일한 민간 AI 리더 중 한 명입니다.

아래는 인터뷰에서 논의한 주제들입니다.

1. AGI의 급속한 도약을 제한하는 세 가지 주요 요인과 얼마나 빠르게 이런 장애물들을 넘을 수 있을까 ?
2. AGI의 경쟁에서 중국의 강점과 약점
3. AI 경쟁에서 승리(또는 패배)할 경우의 국가 안보적 의미
4. AI net 평가에 대한 전망과 데이터에 대한 맨해튼 프로젝트의 필요성
5. 혁신을 저해하지 않거나 이민자들을 차별하지 않으면서 AI의 간첩 행위를 방지하는 방법

데이터의 벽

AI의 진보와 국가 경쟁력을 주도하는 세 가지 대표적인 요인은 컴퓨트(Compute), 데이터(Data), 알고리즘(Algorithms) 입니다. 컴퓨트(연산)과 알고리즘에 대해서는 많은 논의가 이루어졌지만, 데이터 역시 매우 중요한 부분입니다.

첫 번째로 중요한 것은 첫 컴퓨팅 곡선(compute curve)입니다. 무어의 법칙과 확장 기능을 모두 활용하여 과거보다 훨씬 더 많은 컴퓨팅을 사용할 수 있습니다.

두 번째로 중요한 것은 데이터인데요, 데이터는 AI 모델의 성능을 향상시키기 위해 필수적입니다. 양질의 데이터가 많이 필요하며, 이러한 데이터는 지속적으로 업데이트되고 개선되어야 합니다. 앞으로 나아가기 위해서는 데이터의 수집, 정제, 관리에 대한 지속적인 투자가 필요합니다. 데이터 벽을 넘기 위해서는 이러한 과정들이 더욱 효율적으로 이루어져야 합니다.

2010년대 초반부터 딥러닝과 신경망의 사용이 시작되면서, 알고리즘에 사용되는 데이터의 양은 꾸준히 지수 곡선 형태로 증가해 왔습니다. 이는 페이페이 리(Fei-Fei Li) 연구실에서 나온 이미지넷(Imagenet) 데이터셋에서 시작되어, 이후 꾸준히 증가했죠. 현재의 모델들은 매우 많은 데이터를 필요로 합니다.

세 번째로 중요한 것은 알고리즘입니다.

현재의 대형 언어 모델들은 두 단계로 훈련됩니다.
사전 훈련(pre-training)과 후속 훈련(post-training)이죠. 대부분의 사람들이 자연스럽게 떠올리는 것은 사전 훈련 단계입니다. 이 단계에서는 수만 개 또는 수십만 개의 GPU를 사용하여 인터넷의 많은 데이터를 다운로드하고, 그 위에 거대한 신경망 또는 트랜스포머 기반 모델을 훈련시킵니다.

두 번째 단계는 후속 훈련으로, 실제로 모델을 유용한 기능에 맞게 최적화하는 단계입니다. 이 후속 훈련 단계에서는 최첨단 데이터(frontier data)에 크게 의존합니다. 여기에서는 RLHF(인간 피드백을 통한 강화 학습) 및 SFT(지도형 미세 조정)와 같은 기법을 적용합니다. 여기서 고품질의 데이터를 활용하여 이러한 모델들이 코딩과 같은 매우 유용한 task에서 훨씬 더 잘 수행되도록 합니다.

이 단계에서 많은 안전 통제가 이루어집니다. 후속 훈련의 두 번째 단계는 지난 2년 동안 대부분의 진보가 이루어진 곳입니다. 이는 업계에서는 잘 알려져 있지만, 다른 곳에서는 잘 알려지지 않았습니다.

GPT-4는 2022년 가을에 처음 훈련되었고, 그 이후로 GPT-4를 크게 능가하는 사전 훈련은 아직 이루어지지 않았습니다. 그 이후의 모든 진보는 이 후속 훈련 과정을 통해 이루어졌습니다. ( 하지만 최근 claude-3.5 sonnet 모델이 GPT-4를 압도했죠 ! )

Epoch AI에서 제공한 예제에서는 동일한 성능 향상을 이루기 위해 두 가지 접근 방법이 있습니다. 후속 훈련 강화(Post-Training Enhancement, PTE) 또는 사전 훈련 컴퓨트를 5배로 확장하는 것입니다. 이는 두 가지 방법 모두 유사한 성능 개선을 달성할 수 있음을 보여줍니다.

후속 훈련(post training process)의 한계

Alex Wang : 연구 커뮤니티에서는 현재 상반된 답변이 있습니다. 솔직히 말해, 이는 이 분야에서 가장 큰 질문 중 하나입니다. 일부는 후속 훈련이 단지 모델에 이미 존재하는 지능의 많은 부분을 노출시키는 것이라고 믿습니다. 따라서 후속 훈련은 모델이 본질적으로 가지고 있지 않은 새로운 기술을 모델에 부여할 수 없다는 것입니다.

GPT-3.5는 후속 훈련 과정을 통해 GPT-4가 처음 나왔을 때보다 더 나아졌습니다. 뛰어난 후속 훈련을 통해 많은 성능 한계를 극복할 수 있습니다. 이로 인해 모델들이 개선된 코드 분석을 수행하고, 스스로 코드를 실행하며, 더 고급 에이전트 작업을 수행하고, 다양한 종류의 작업을 자동화할 수 있게 되었습니다.

QStar와 기타 최근 다양한 챗봇들은 AI 시스템이 국제 수학 올림피아드 수준의 문제를 해결하는 데 매우 근접하고 있음을 나타냅니다.

Chinese Espionage and the Race to AG

데이터셋을 보호하기 위해 국가적 방어선을 구축할 필요가 있다고 생각하십니까?

산업 스파이 활동이 AI를 목표로 하고, 많은 똑똑한 중국 PhD, 전투기 조종사, 정보 분석가들이 뛰어난 데이터를 만들 수 있다고 가정한다면, 미국이 장기적이고 지속 가능한 데이터 우위를 개발할 수 있는 방법은 무엇인가요?

미국은 최고의 인재들이 이주하고자 하는 매력적인 목적지입니다. 세계에서 가장 우수한 인재들이 미국으로 이주하고 싶어합니다. 이러한 흐름을 유지할 수 있다면, 미국은 이러한 최첨단 데이터셋을 강화하는 데 필요한 전문가 능력, 전문 지식, 뛰어난 인재들에 있어 근본적인 이점을 가질 것입니다.

산업 스파이 문제는 미국 발전의 근본적인 장애물입니다.
모든 AI 개발이 비공개 연구소에서 이루어지고 모든 비밀이 도난당한다면, 국가적인 이점을 구축하기에 어려움이 많습니다.

특히 많은 과학자들은 데이터나 지식을 클라우드 서비스를 통해 저장합니다.
모델이나 데이터 자체도 비트와 바이트로 이루어져 있기 때문에 전 세계의 모든 데이터 파일을 사용하더라도 결국 가중치 파일 하나로 귀결됩니다.
이러한 모델 가중치는 도난당할 수 있는 가능성이 높은 비트와 바이트로 이루어져 있습니다.

현재 많은 연구소나 회사의 보안 수준은 이런 가중치들을 비밀로 유지하는데 적합하지 않죠. 예를 들어, 최근 구글 엔지니어인 리언 딩은 구글에서 AI 인프라 작업을 하면서 TPU v6 디자인과 많은 훈련 코드를 비롯한 여러 자료를 훔쳐 체포당했습니다.

Alex는 중국 공산당을 싫어하는 부모를 따라 미국으로 왔고, 미국에서 국가 안보 문제에 종사했다고 합니다. 로스 알라모스에서 자라며 국가 안보와 미국 방어에 대해 매우 열의가 많다고 밝혔죠.

하지만 매번 대화 시작 전에 관계자들에게 "저는 로스 알라모스에서 태어났습니다. 저의 부모님은 헌신적인 공무원이고, 미국이 AI 경쟁에서 승리하도록 만들고 싶습니다." 라고 말합니다.

인재는 중국을 떠나 미국으로 오고, 중국으로 돌아가지 않습니다. 대부분의 중국을 떠나는 사람들은 중국 공산당을 좋아하지 않으며, 돌아갈 생각이 없습니다.

중국의 정책에서도 이를 볼 수 있습니다. 과거에는 미국으로 대학원을 가도록 권장했지만, 돌아오는 사람이 적어서 이제는 러시아나 유럽으로 가도록 권장합니다.

현재의 상황을 보면 미국이 승리할 가능성이 적다고 말합니다. 하지만 보안 문제를 해결하고 AI 노력의 보안에 자신감을 가질 수 있다면, 미국은 가능한 한 많은 고급 인재를 중국에서 받아들여야 합니다. 현재 중국은 세계 어느 나라보다 더 많은 고급 STEM 인재를 배출하고 있기 때문입니다.

저작자표시 비영리 변경금지

데이터의 벽

후속 훈련(post training process)의 한계

Chinese Espionage and the Race to AG

티스토리툴바