Nvidia는 Llama-3.1의 고급 버전인 Nemotron을 출시했으며, 이는 GPT-4 를 포함한 가장 진보된 인공지능(AI) 모델을 능가하도록 설계되었습니다.
정교한 데이터와 혁신적인 하드웨어 덕분에, Nemotron은 인공지능 분야에서 비할 데 없는 성능을 약속합니다. 이 기사에서 모든 세부 사항을 살펴보겠습니다.
Summary
Nvidia의 Nemotron, 전례 없는 AI 계산 능력으로 GPT-4o 및 Claude-3를 능가하다
예상대로, Nvidia는 새로운 모델의 인공지능, Llama-3.1-Nemotron-70B-Instruct를 발표하여 파괴적인 영향을 미쳤습니다.
이 모델은 Nvidia에 따르면 현재 유통 중인 가장 진보된 AI 시스템인 GPT-4o di OpenAI 및 Claude-3 di Anthropic을 능가할 것을 약속합니다.
Nvidia AI Developer 계정의 X 게시물을 통해 발표된 이 소식은 빠르게 업계 전문가들의 주목을 받았습니다.
Nemotron 모델은 Meta의 Llama-3.1-70B-Instruct의 수정되고 개선된 버전으로, 오픈 소스 AI 플랫폼입니다.
Nvidia의 “Nemotron”이라는 이름의 부분에서 강조된 수정은 회사의 중요한 기술적 기여를 반영하며, 이는 모델을 새로운 힘과 다재다능함의 정점으로 이끌었습니다.
기본 아이디어는 이 모델이 Nvidia 자체에서 개발한 최첨단 하드웨어 인프라와 정교한 튜닝 작업 덕분에 GPT-4 및 Claude-3와 같은 더 인기 있는 모델보다 더 “유용”하고 성능이 뛰어날 수 있다는 것입니다.
Nemotron은 lmarena로 알려진 챗봇 아레나의 맥락에서 태어났으며, 이는 다양한 인공지능 모델이 비교되는 공간입니다.
Meta, 자사의 “Llama”라는 AI 모델 시리즈로 Nvidia가 이 새로운 시스템을 구축할 수 있는 기반을 제공했습니다.
주요 목표는 개발자가 추가로 맞춤화할 수 있는 오픈 소스 AI 모델을 만드는 것이었습니다.
그럼에도 불구하고, Nvidia는 업계의 리더들과 경쟁하고 그들을 능가할 수 있는 인공지능 시스템을 만들기 위해 자사의 자원을 활용하여 더 나아가고자 했습니다.
Nemotron의 특징은 무엇입니까?
Nemotron이 부상할 수 있었던 주요 요소 중 하나는 신중하게 선택된 set di dati 와 고도로 정교한 조정 프로세스를 사용하는 것입니다.
Nvidia는 최첨단 하드웨어를 사용하여 엄청난 계산 능력을 활용하여 모델 Llama-3.1-70B를 초기 한계를 넘어 추진했습니다.
이것은 AI의 버전을 더 강력할 뿐만 아니라 실용적인 관점에서 더 “유용한” 버전으로 만들 수 있게 했습니다.
인공지능 분야에서 여러 가지 해석이 가능한 용어이지만, 일반적으로 모델이 관련성 있고, 정확하며, 시기적절한 응답을 제공하는 능력을 나타냅니다.
벤치마킹은 인공지능 모델의 효율성을 평가하는 데 사용되는 방법 중 하나입니다. 그러나 “최고”의 모델을 결정하기 위한 단일하고 결정적인 방법론은 존재하지 않습니다.
이것은 AI 모델의 유용성과 효율성이 종종 주관적인 평가와 사용되는 맥락에 따라 달라지기 때문입니다.
실제로 벤치마킹은 다양한 AI 모델을 동일한 테스트에 노출시키고 유용성과 정확성 측면에서 얻은 결과를 평가하는 것으로 구성됩니다.
Nemotron의 경우 Nvidia는 새로운 모델이 GPT-4o 및 Claude-3을 포함한 주요 경쟁자들을 bull과 bear로 크게 앞선다고 주장합니다.
챗봇 아레나에서의 경쟁은 치열하며, Nemotron은 순위를 올릴 준비가 된 것 같습니다.
비록 아직 공식 lmarena 순위에 완전히 나열되지는 않았지만, Nvidia는 자사의 모델이 “Difficile” 테스트에서 85점을 받았다고 주장합니다. 확인된다면, 이는 이 특정 카테고리의 상위권에 위치할 것입니다.
이 결과는 Llama-3.1-70B, Nemotron의 기반이 되는 모델이 Llama-3.1의 405B 버전에 비해 중간 수준의 모델이라는 점을 고려할 때 더욱 주목할 만합니다. 405B 버전은 훨씬 더 복잡하고 매개변수의 수가 상당히 많습니다.
오픈 소스 기반 및 기타 매개변수
AI 모델의 크기와 복잡성을 이해하기 위해, OpenAI의 가장 진보된 모델 중 하나인 GPT-4o는 1조 개 이상의 매개변수로 개발되었습니다.
매개변수의 수는 인공지능 모델의 성능과 용량을 나타내는 주요 지표 중 하나입니다.
그럼에도 불구하고, Nvidia는 상대적으로 적은 수의 매개변수에도 불구하고 Nemotron의 성능을 최대화하는 데 성공한 것으로 보입니다.
또 다른 흥미로운 점은 Nemotron의 open source 기반으로, 이는 광범위한 개발자 커뮤니티에 접근할 수 있게 해줍니다.
이 오픈 소스 접근 방식은 인공지능 분야의 진보를 더욱 가속화할 잠재력을 가지고 있습니다. 전 세계의 전문가들이 모델의 개선과 맞춤화에 기여할 수 있도록 하기 때문입니다.
또한, Nvidia가 Llama-3.1과 같은 오픈 소스 프로젝트에 자신의 작업을 기반으로 하기로 결정한 것은 기술 발전에서 협력과 공유된 혁신의 중요성을 보여줍니다.