모델명

평가로그

노트
🥇
claude-3-opus-20240229
Anthropic
elo 아레나 랭킹 2위
🥈
gpt-4-turbo-2024-04-09
OpenAI
(2024-04-09 기준) gpt-4-turbo default 모델
🥉
gpt-4-1106-preview
OpenAI
elo 아레나 랭킹 1위
4
gpt-4o-2024-05-13
OpenAI
5
claude-3-sonnet-20240229
Anthropic
elo 아레나 랭킹 3위
6
HyperClovaX
NAVER
7
gpt-3.5-turbo-0125
OpenAI
elo 아레나 랭킹 9위
8
microsoft_WizardLM-2-8x22B
9
10
claude-3-haiku-20240307
Anthropic
11
(4비트 양자화 기준) elo 아레나 랭킹 6위, miqu 기반
12
mirlab_AkaLlama-llama3-70b-v0.1
13
google-gemini-1.5-pro
google
elo 아레나 랭킹 7위
14
15
152334H_miqu-1-70b-sf
(4비트 양자화 기준) elo 아레나 랭킹 8위
16
20240506_202620
17
solar-1-mini-chat
upstage
elo 아레나 랭킹 5위
18
amazingvince/Not-WizardLM-2-7B
19
Qwen_Qwen1.5-14B-Chat
20
Qwen_Qwen1.5-72B-Chat
잦은 영어/중국어 출력
21
maywell_Synatra-kiqu-10.7B
elo 아레나 랭킹 10위
22
23
elo 아레나 랭킹 4위, KoLLM 58위
24
nlpai-lab_KULLM3
25
maywell_Synatra-kiqu-7B
elo 아레나 랭킹 13위
26
HumanF-MarkrAI_COKAL-DPO-13b-v2
27
yanolja_Bookworm-10.7B-v0.4-DPO
28
(4비트 양자화 기준) elo 아레나 랭킹 12위
29
OpenModels4all/gemma-1.1-7b-it
30
Heoni/Aguie-chat_v0.1
31
kurugai_Kurugai-EEVE-v1.0
32
instructkr_lynn-3b-base
33
PistachioAlt/Synatra-MCS-7B-v0.3-RP-Slerp
34
35
maywell/Jolteon-Instruct-13B-alpha
36
OpenCarrot-Mistral-7B-Instruct-v0.2
37
KoLLM 1위
38
KoLLM 6위
39
openchat_openchat-3.5-0106
elo 아레나 랭킹 11위
40
MarkrAI/RAG-KO-Mixtral-7Bx2-v2.1
41
maywell_TinyWand-kiqu
elo 아레나 랭킹 14위

Made with ❤️ byinstruct.kr

Sionic AI에서 모델 평가를 위한 GPU 자원을 지원하고 있습니다.

🤗☕️