-
deepseek r1 distill function call review카테고리 없음 2025. 2. 14. 19:14
https://github.com/akswnd98/owlagent
GitHub - akswnd98/owlagent
Contribute to akswnd98/owlagent development by creating an account on GitHub.
github.com
deepseek r1 distill은 기본적으로 function call을 native하게 지원하지 않는다.
그런데 써 보면 알겠지만 지능이 상당히 좋다.
지금 까지 나왔던 다른 소형 (rtx3090이나 맥북에서 돌릴만한) 모델들과 비교하면 한 두 단계 위이다.
이대로 버리기엔 아까워서 prompt를 깍아서 function call 기능을 직접 구현해 봤다.
deepseek 공식 홈페이지를 보면 알겠지만,
Chat template을 사용해야 하고, System prompt를 사용하지 않고, <think>로 운을 띄어야 cot 추론을 강제할 수 있다.
(Chat template 적용 여부는 크게 중요하지는 않더라)이런 정보를 토대로 agent를 작성해 봤다.
잘 동작하는 거 같다.
앞으로 virtual file system, email, web sesarch, excel, word, markdown, code interpreter 등등의 function들을 추가하여 agent로 사용해 보고 다시 리뷰해야겠다.