하정우 AI수석도 '주목'…세일즈포스, AI 에이전트 평가 시스템 메이저 사이트
메이저 카지노 사이트SW 포털
게시글 작성 시각 2025-07-22 10:17:23
2025.07.20
ⓒ ZDNet Korea / 김미정 기자
인공지능(AI) 에이전트 성능을 자동 평가하는 프레임워크가 등장했다. AI 모델 자체만을 평가하던 벤치마크 한계를 넘어 에이전트의 실질적 성능 분석이 가능한 프레임워크다.
20일 IT 업계에 따르면 세일즈포스는 지난 17일 '모델 컨텍스트 프로토콜 기반 평가 프레임워크(MCPeval): MCP 기반의 자동 심층 에이전트 평가' 논문을 통해 에이전트 문제 해결 능력을 자동 검증할 수 있는 새 벤치마크 프레임워크를 오픈소스로 메이저 사이트했다.
MCPeval은 MCP 기반으로 에이전트 성능을 검증한다. 사용자가 가상 업무 환경을 제시하면, 에이전트가 MCP를 이용해 필요한 도구 정보를 받아, 주어진 작업을 직접 수행하는 식이다.
(후략)
번호 | 제목 | 조회수 | 작성 |
---|---|---|---|
11423 | "글로벌과 정면승부"…트릴리온랩스, 21B급 LLM 전면 메이저 사이트 순위 - 메이저 사이트 | 1572 | 2025-07-24 |
11422 | 네이버클라우드, ‘경량화 추론 모델’ 오픈소스 보증 사이트 추천 | 1958 | 2025-07-23 |
11421 | [주간 OSS 동향리포트] NIPA, 2025 오픈소스 컨트리뷰션 아카데미 참여형 발대식 개최 | 1952 | 2025-07-23 |
11420 | 하정우 AI수석도 '주목'…세일즈포스, AI 에이전트 평가 시스템 메이저 사이트 | 1984 | 2025-07-22 |
11419 | 코난테크놀로지, 4B LLM 오픈 소스 메이저 놀이터..."큐원 3 미세조정" - 메이저 놀이터SW | 1980 | 2025-07-22 |
11418 | "오픈소스를 전략으로"…롯데이노베이트, '국가대표 AI' 도전장 [AI브리핑] - 메이저 사이트 | 2008 | 2025-07-21 |
11417 | [SW대전환]③ AI 혁신, 오픈소스·데이터로 열고 SBOM으로 완성 | 2002 | 2025-07-21 |
11416 | AI, '바르코-비전2.0' 멀티모달 모델 오픈소스 메이저 카지노 사이트 | 2109 | 2025-07-17 |
11415 | [주간 OSS 동향리포트] SK텔레콤 '에이닷 엑스 4.0', KT ‘믿:음 2.0’, 오픈소스 메이저 놀이터 | 2154 | 2025-07-16 |
11414 | MS, 수학 추론 전문 오픈 소스 경량모델 출시..."학습 도구로 적합" - 검증 사이트 추천SW | 2164 | 2025-07-15 |
0개 댓글