본문 바로가기

2025.07.29

ⓒAI타임스 / 박찬 기자

방대한 데이터를 수집하지 않고도 고성능 시각-언어 모델을 학습할 수 있는 코드 기반 합성 데이터 생성 도구가 나왔다.

미국 펜실베니아대학교와 앨런 인공지능연구소(AI2) 연구진은 25일(현지시간) 시각이해 능력에서 'GPT-4V'와 '제미나이 1.5 플래시' 등 폐쇄형 모델을 능가하는 오픈 소스 AI 학습 도구 ‘코신(CoSyn)’에 관한 논문을 아카이브에 게재했다.

코신은 복잡한 과학 차트, 의료 도식, 금융 문서 등 고난도 시각 정보를 이해할 수 있도록 AI를 훈련하는 데 필요한 고품질 데이터를 코드를 통해 합성(synthetic) 생성한다. 이를 통해 기존인터넷 이미지 수집 방식이 가진 저작권 문제와 편향 문제 등을 효과적으로 피할 수 있다.

(후략)

[원본기사 :https://www.aitimes.com/news/articleView.html?idxno=201021]

맨 위로
맨 위로