Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
Tags
- 웹취약점
- 윤송이
- blindSQL
- 윤리적해커
- 가장인간적인미래
- 사이버위협
- Selenium
- ACDC
- hackingback
- CTF
- clarivate
- 해킹
- 보복해킹
- webofscience
- 인공지능윤리
- cna
- 해킹백
- 디지털자구행위
- 밀리테크챌린지
- CVE
- LordOfSQLInjection
- Los
- 과학기술전문사관
Archives
- Today
- Total
프리미의 공간
Arize AI의 Gemini CLI 코딩 에이전트에 평가 도구를 추가하는 방법 본문
https://arize.com/blog/gemini-cli-evaluation-harness/
How to add an evaluation harness to your Gemini CLI coding agent
Build an evaluation harness for your Gemini CLI coding agent with Arize Skills. Compare changes, run evaluators, and improve LLM apps with a repeatable workflow.
arize.com
- Gemini CLI에 Arize Skills를 등록하고 사용하는 방법에 대한 설명 글.\
- 나는 Gemini CLI 라는 에이전트의 성능을 측정하는 방법을 기대했음. 가령 웹서버에 특정 API를 구현하는 작업에서 얼마나 concurrency를 고려했고, 보안 위협에 대한 성능은 어느정도이며, 코드 스타일 준수율은 얼마인지.
- 근데 그게 아니라 Gemini CLI로 평가 관련된 작업을 한다면, Arize Skills를 연동하면 더 잘될거다 라는 글이었음.