ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • deepseek r1 distill function call review
    카테고리 없음 2025. 2. 14. 19:14

     

     

     

    https://github.com/akswnd98/owlagent

     

    GitHub - akswnd98/owlagent

    Contribute to akswnd98/owlagent development by creating an account on GitHub.

    github.com

    deepseek r1 distill은 기본적으로 function call을 native하게 지원하지 않는다.

    그런데 써 보면 알겠지만 지능이 상당히 좋다.

    지금 까지 나왔던 다른 소형 (rtx3090이나 맥북에서 돌릴만한) 모델들과 비교하면 한 두 단계 위이다.

    이대로 버리기엔 아까워서 prompt를 깍아서 function call 기능을 직접 구현해 봤다.

    deepseek 공식 홈페이지를 보면 알겠지만,

    Chat template을 사용해야 하고, System prompt를 사용하지 않고, <think>로 운을 띄어야 cot 추론을 강제할 수 있다.
    (Chat template 적용 여부는 크게 중요하지는 않더라)

    이런 정보를 토대로 agent를 작성해 봤다.

    잘 동작하는 거 같다.

    앞으로 virtual file system, email, web sesarch, excel, word, markdown, code interpreter 등등의 function들을 추가하여 agent로 사용해 보고 다시 리뷰해야겠다.

    댓글

Designed by Tistory.