본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

2024.06.16

ⓒAI타임스/박찬기자

 

엔비디아가 대형언어모델(LLM) 학습용 합성 데이터를 생성하도록 설계한 모델 ‘네모트론-4 340B(Nemotron-4 340B)'를 공개했다. 이를 통해 비용이 많이 드는 실제 데이터셋 없이도 도메인별 LLM을 구축할 수 있게 됐다는 설명이다.
벤처비트는 14일(현지시간) 엔비디아가 고품질 합성 데이터를 생성하는 3400억 매개변수의 모델 ▲네모트론-4 340B 베이스(Base) ▲네모트론-4 340B 인스트럭트(Instruct) ▲네모트론-4 340B 리워드(Reward) 등을 오픈 소스로 출시했다고 보도했다.
이에 따르면 이 모델은 챗봇 아레나에서 '준-챗봇(june-chatbot)'이라는 이름으로 선공개, 뛰어난 성능을 AI 커뮤니티에서 상당한 화제를 불러 일으켰다. 공개 직후에도 호평이 쏟아지고 있다.
(후략)

 

[원본기사 : https://www.aitimes.com/news/articleView.html?idxno=160651]

맨 위로
맨 위로