LLM vs SLLM: 무엇이 다른가?
LLM은 한단어로 요약하면 두뇌 입니다.
이 인공 두뇌를 사용하기 위해 인터넷을 연결해 대형모델을 사용하느냐 아니면 인터넷 안되도 되는 환경에서 개인 컴퓨터에 뇌를 두고 사용하느냐 입니다.
인공뉴런으로 만들어진 인공신경망을 학습시킨 인공 뇌 입니다.
사람의 뇌는 뉴런이 있고 뉴런과 뉴런 사이에는 시냅스로 연결되어 학습에 따라 문턱치 값이 생기는데 이 값에 따라서 어떤것이 맞고 틀리고 뭐 그런것입니다.
LLM이란?
LLM(Large Language Model)은 말 그대로 대규모 언어 모델로 수천억 개에 달하는 파라미터를 기반으로 방대한 양의 텍스트 데이터를 학습해서 만들어진 인공지능 모델로 OpenAI의 GPT-4나 Anthropic의 Claude 또는 Google의 Gemini 같은 모델들이 여기에 속하는데 이 모델들은 수백 GB에서 수 TB에 이르는 어마어마한 용량을 자랑하며 일반적으로 강력한 GPU 서버 인프라 없이는 구동 자체가 불가능합니다.
SLLM이란?
SLLM(Small Language Model 또는 Lightweight Language Model)은 LLM의 핵심 능력은 최대한 유지하면서도 모델의 크기와 파라미터 수를 대폭 줄여서 일반적인 하드웨어 환경에서도 충분히 실행할 수 있도록 설계된 경량화 언어 모델로 우리가 로컬 환경에서 자주 사용하는 Ollama 같은 도구가 바로 이 SLLM 계열에 속하는데 Ollama를 통해 실행되는 Llama나 Mistral 또는 Gemma 같은 모델들은 수 GB 수준의 용량으로도 개인 PC나 맥북 같은 일반 장비에서 충분히 구동됩니다.
어떤 상황에 무엇을 선택해야 할까?
LLM은 복잡한 추론이나 창의적인 글쓰기 또는 다국어 처리처럼 높은 수준의 언어 이해가 요구되는 작업에서 압도적인 성능을 보여주지만 반대로 SLLM은 인터넷이 없는 환경이거나 민감한 데이터를 외부로 보내서는 안 되는 상황이거나 또는 단순 반복적인 작업을 빠르게 처리해야 하는 경우에 훨씬 실용적인 선택이 됩니다.
결국 LLM과 SLLM은 서로 경쟁 관계가 아니라 사용 목적과 환경에 따라 선택하는 도구가 다른 것이고 Ollama처럼 로컬에서 손쉽게 SLLM을 실행할 수 있는 생태계가 성숙해지면서 이제는 개인 개발자나 소규모 팀도 자체적인 AI 인프라를 구축하는 시대가 열리고 있습니다.
회사 여유가 있으면 애플의 M3 울트라 모델 사용하면 좋고 집에서 사용하면 약간 낮은 모델이 좋고 그렇습니다.
애플제품은 RAM 한번정하면 확장 같은것 안되기 때문에 살때 넉넉하게 사는것이 좋고 예전 애플은 디자인이 좋거나 여러가지 통합환경이 좋아서 괜찮다고 했는데 이젠 SLLM 돌리기 위해서필요한 제품이 되었네요. 애플 제품 특성상 CPU GPU RAM 공유하는 구조로 되어 있고 속도가 빨라서 그렇습니다.
이제 개발자는 애플을 기준으로 컴퓨터 1대 사고 필요하면 인텔것 사던가 말던가 그런쪽으로 가는 사람도 많아 질것 같습니다.
문제는 가격이 ... 맥미니 M4 pro 48G 300만은 줘야 하는데... Max 제품 정도는 써야 좋아서 ... 그럼 가격이 ...
