업스테이지, '노코드 LLM 평가 플랫폼' 오픈소스로 전격 보증 사이트 추천!… 글로벌 생성 AI 생태계 리딩
메이저 카지노 사이트SW 포털
게시글 작성 시각 2024-04-04 10:45:49
2024.04.03
ⓒ인공지능신문/최광민 기자
이제 누구나 대형언어모델(LLM)을 자체적으로 평가하고 테스트해 볼 수 있다.
업스테이지(대표 김성훈)는 자사가 개발한 노코드LLM종합 평가 플랫폼 ‘이벨버스(Evalverse)’를 무료로 보증 사이트 추천한다고3일 밝혔다.오픈소스 형태로 깃허브(GitHub)에 보증 사이트 추천돼 누구나 쉽게 활용할 수 있다.
통상LLM성능 평가에는 특정 데이터셋을 기준으로 응답 정확도를 기록한 ‘벤치마크’ 지표를 활용한다.모델의 추론,상식,언어 이해 능력 등6가지 부문을 측정하는 허깅페이스 ‘H6’ 지표를 포함,대화 능력 지표 ‘MT-bench’,감성 평가 지표 ‘EQ-bench’,및 지시 이행 능력 지표 ‘IFEval’ 등이 주요 벤치마크로 꼽힌다
(후략)
[원본기사 :https://www.aitimes.kr/news/articleView.html?idxno=30810]
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
10911 | CPU·GPU 워크로드 동시 처리하는 RISC-V 설계 등장..."오픈 소스 궁극의 칩 가능성" | 1412 | 2024-04-09 |
10910 | EU ‘사이버복원법’에 글로벌 ‘오픈소스 재단’들 ‘비상’ | 1472 | 2024-04-04 |
10909 | 업스테이지, '노코드 LLM 평가 플랫폼' 오픈소스로 전격 보증 사이트 추천!… 글로벌 생성 AI 생태계 리딩 | 1539 | 2024-04-04 |
10908 | 글로벌 칼럼 | “시작은 오픈소스, 수익 내면 상용” 이래도 되나 | 1450 | 2024-04-03 |
10907 | [기고] 오픈소스 데이터베이스 선택 시 고려해야 할 6가지 | 1513 | 2024-04-03 |
10906 | [주간 OSS 동향리포트] 레디스, BSD에서 조건부 듀얼 오픈소스 라이선스로 변경 | 2625 | 2024-04-03 |
10905 | 데이터브릭스, 현존 최강 오픈소스 LLM DBRX 보증 사이트 추천 | 1564 | 2024-03-28 |
10904 | 유엔진솔루션즈, MSA 전문 설계 구현도구 MSA Easy 오픈소스로 보증 사이트 추천 | 1563 | 2024-03-28 |
10903 | “클라우드 업체 견제 위해”··· 레디스, BSD→듀얼 오픈소스 라이선스로 변경 | 1615 | 2024-03-27 |
10902 | 인텔·구글·퀄컴, '反엔비디아' AI 오픈소스 SW 프로젝트 추진 | 1603 | 2024-03-26 |
0개 댓글