ADK 에이전트를 위한 LiteRT-LM 모델 호스트¶
LiteRT-LM은 엣지 플랫폼 전반에서
언어 모델을 효율적으로 실행하기 위한 C++ 라이브러리입니다. 데스크톱(Linux,
macOS, Windows)에서는 ADK가 LiteRT-LM CLI lit으로 실행한 LiteRT-LM 서버를
통해 LiteRT-LM 호스팅 모델과 통합됩니다.
시작하기¶
LiteRT-LM은 Gemini 클래스와 함께 사용합니다. base_url과 model
매개변수만 설정하면 됩니다.
base_url을 LiteRT-LM 서버 URL로 설정합니다. 예:localhost:8001model을 LiteRT-LM 모델 이름으로 설정합니다. 예:gemma3n-e2b
from google.adk.agents import Agent
from google.adk.models import Gemini
root_agent = Agent(
model=Gemini(
model="gemma3n-e2b",
base_url="http://localhost:8001",
),
name="dice_agent",
description=(
"hello world agent that can roll a die of 8 sides and check prime"
" numbers."
),
instruction="""
You roll dice and answer questions about the outcome of the dice rolls.
""",
tools=[
roll_die,
check_prime,
],
)
그다음 평소처럼 에이전트를 실행합니다.
LiteRT-LM 서버 실행하기¶
LiteRT-LM 서버는 LiteRT-LM 모델을 제공하는 별도 프로세스입니다. 이 서버는
LiteRT-LM CLI 도구 lit이 시작합니다.
lit CLI 도구 다운로드¶
LiteRT-LM GitHub 저장소의
안내를
따라 lit CLI 도구를 다운로드하세요.
모델 다운로드¶
서버를 시작하기 전에 먼저 모델을 다운로드해야 합니다. lit으로 LiteRT-LM 모델을
다운로드하려면 Hugging Face 사용자 액세스 토큰이 필요합니다. 토큰은
여기에서 발급받을 수 있습니다.
다운로드 가능한 모델 목록을 보려면 lit list 명령을 사용하세요.
lit pull 명령으로 모델을 다운로드합니다.
서버 실행¶
모델을 다운로드한 후 다음 명령으로 로컬에서 LiteRT-LM 서버를 시작합니다.
로컬 서버 포트 번호
LiteRT-LM 서버의 포트 번호는 자유롭게 선택할 수 있지만, 에이전트 코드의
Gemini 클래스에서 설정한 base_url과 반드시 일치해야 합니다.
디버깅¶
LiteRT-LM 서버로 들어오는 요청과 모델에 전달되는 정확한 입력을 확인하려면
--verbose 플래그를 사용하세요.